AI AGENTS - Bài 13: Viên gạch 6: Memory (Bộ nhớ)

Đỗ Ngọc Minh

Bài 13:

Viên gạch 6: Memory (Bộ nhớ)

 




1. Mục tiêu bài
Sau bài này, học viên sẽ:

  • Hiểu Memory là gì trong AI Agents
  • Phân biệt rõ:
    • Bộ nhớ ngắn hạn (Context Window)
    • Bộ nhớ dài hạn (Vector Database)
  • Biết cách thiết kế hệ thống memory cho AI Agent thực tế

2. Tổng quan: Memory trong AI Agent là gì?



Memory = khả năng AI “nhớ” và “tái sử dụng thông tin” theo thời gian

👉 Nếu không có Memory:

  • Agent chỉ “thông minh tức thời”
  • Không học từ quá khứ
  • Không cá nhân hóa

👉 Nếu có Memory:

  • Agent trở thành:
    • Trợ lý cá nhân hóa
    • Hệ thống ra quyết định liên tục
    • “Nhân sự AI” thực thụ

3. Hai loại Memory

Loại Memory

Bản chất

Vai trò

Short-term

Tạm thời

Giữ ngữ cảnh hiện tại

Long-term

Lưu trữ lâu dài

Học và tái sử dụng


4. Bộ nhớ ngắn hạn – Context Window

4.1. Định nghĩa

Context Window = vùng ngữ cảnh mà AI có thể “nhìn thấy” tại một thời điểm

👉 Hiểu đơn giản:

Đây là “trí nhớ làm việc” (working memory)


4.2. Cách hoạt động

AI chỉ xử lý được thông tin nằm trong context:

[User Prompt + History + Instructions] → Model → Output

👉 Nếu vượt quá giới hạn:

  • Thông tin cũ bị “quên”

4.3. Đặc điểm chính

  • Giới hạn theo token (ví dụ: 8k, 32k, 128k…)
  • Không lưu lâu dài
  • Phụ thuộc vào mỗi request

4.4. Ví dụ thực tế

User chat:

1.   “Tôi tên Minh”

2.   “Tôi làm CEO”

3.   “Hãy viết email cho tôi”

👉 AI hiểu:

  • Người dùng = Minh
  • Vai trò = CEO

Nhưng nếu cuộc hội thoại quá dài:
→ AI có thể “quên Minh là ai”


4.5. Ưu điểm & hạn chế

Ưu điểm

  • Nhanh
  • Đơn giản
  • Không cần hệ thống lưu trữ

Hạn chế

  • Không bền
  • Không mở rộng được
  • Không cá nhân hóa lâu dài

5. Bộ nhớ dài hạn – Vector Database

5.1. Định nghĩa

Vector DB = hệ thống lưu trữ thông tin dưới dạng embedding (vector số)

👉 Giúp AI:

  • Lưu trữ kiến thức
  • Tìm lại thông tin “liên quan nhất”

5.2. Nguyên lý cốt lõi

Bước 1: Chuyển dữ liệu → vector

  • Text → embedding

Bước 2: Lưu vào database

Bước 3: Khi cần → truy vấn theo “độ giống”

👉 Không tìm theo keyword
👉 Mà tìm theo ngữ nghĩa (semantic search)


5.3. Ví dụ trực quan

Bạn lưu:

  • “Minh là CEO công ty công nghệ”
  • “Minh thích chiến lược cạnh tranh”

Sau đó hỏi:

“Viết chiến lược cho tôi”

👉 AI:

  • Query → tìm vector gần nhất
  • Retrieve thông tin liên quan đến “Minh”

→ Cá nhân hóa output


5.4. Công nghệ phổ biến

  • Pinecone
  • Weaviate
  • FAISS
  • Chroma

5.5. Ưu điểm & hạn chế

Ưu điểm

  • Lưu trữ lâu dài
  • Mở rộng vô hạn
  • Cá nhân hóa mạnh

Hạn chế

  • Phức tạp hơn
  • Cần thiết kế retrieval tốt
  • Có độ trễ (latency)

🔥 6. So sánh trực diện

Tiêu chí

Context Window

Vector DB

Thời gian lưu

Ngắn hạn

Dài hạn

Dung lượng

Giới hạn

Gần như vô hạn

Tốc độ

Rất nhanh

Trung bình

Cá nhân hóa

Thấp

Cao

Cơ chế

Nhét vào prompt

Retrieve + Inject


️ 7. Kiến trúc Memory trong AI Agent

Một AI Agent thực tế thường dùng kết hợp cả 2:

User Input
  
Retrieve (Vector DB)
  
Inject vào Context Window
  
LLM xử lý
  
Output

👉 Đây gọi là:
RAG – Retrieval Augmented Generation


7.1. Luồng hoạt động

1.   User hỏi

2.   Agent truy vấn Vector DB

3.   Lấy dữ liệu liên quan

4.   Nhét vào Context Window

5.   Model trả lời


7.2. Insight quan trọng

👉 Context Window = “não đang suy nghĩ”
👉 Vector DB = “trí nhớ dài hạn”

→ Agent mạnh = kết hợp cả 2


💡 8. Case thực tế (Doanh nghiệp)

Case 1: Sales AI Agent

  • Context:
    • Cuộc hội thoại hiện tại
  • Vector DB:
    • Lịch sử khách hàng
    • Hành vi mua hàng

→ Output: tư vấn cá nhân hóa


Case 2: HR AI Agent

  • Context:
    • JD hiện tại
  • Vector DB:
    • CV ứng viên
    • lịch sử đánh giá

→ Output: shortlist ứng viên


Case 3: CEO Assistant

·     Context:

    • câu hỏi chiến lược
  • Vector DB:
    • dữ liệu doanh nghiệp
    • OKR, KPI, chiến lược cũ

→ Output:

  • Quyết định mang tính “institutional memory”

🚨 9. Sai lầm phổ biến

1.   Chỉ dùng Context Window → mất trí nhớ

2.   Lưu tất cả vào Vector DB → không retrieve được

3.   Không làm sạch dữ liệu → noise cao

4.   Không thiết kế embedding strategy


🧠 10. Framework thiết kế Memory cho AI Agent

Bước 1: Xác định loại dữ liệu

  • Ngắn hạn → Context
  • Dài hạn → DB

Bước 2: Chuẩn hóa dữ liệu

  • Chunking
  • Tagging
  • Metadata

Bước 3: Thiết kế retrieval

  • Top-K
  • Similarity threshold

Bước 4: Inject thông minh

  • Không nhồi quá nhiều
  • Chỉ lấy relevant

🎯 11. Kết luận “1 câu nhớ lâu”

Context Window giúp AI “hiểu hiện tại”
Vector DB giúp AI nhớ quá khứ”

👉 AI Agent thực sự mạnh khi:
Biết cái gì cần nhớ – và nhớ đúng lúc


SÁCH KHAM KHẢO:

https://drive.google.com/file/d/1iIO3pXFxzzpvQ2hGvzNvx-0EdRtj5cqE/view?usp=sharing


Nhận xét

Bài đăng phổ biến từ blog này

CHATGPT PROMPTS FOR HRM

CHIẾN LƯỢC vs KẾ HOẠCH

Data driven decision making