AI AGENTS - Bài 13: Viên gạch 6: Memory (Bộ nhớ)

- tháng 4 20, 2026

Đỗ Ngọc Minh

Bài 13:

Viên gạch 6: Memory (Bộ nhớ)

1. Mục tiêu bài
Sau bài này, học viên sẽ:

Hiểu Memory là gì trong AI Agents
Phân biệt rõ:

Bộ nhớ ngắn hạn (Context Window)
Bộ nhớ dài hạn (Vector Database)

Biết cách thiết kế hệ thống memory cho AI Agent thực tế

2. Tổng quan: Memory trong AI Agent là gì?

Memory = khả năng AI “nhớ” và “tái sử dụng thông tin” theo thời gian

👉 Nếu không có Memory:

Agent chỉ “thông minh tức thời”
Không học từ quá khứ
Không cá nhân hóa

👉 Nếu có Memory:

Agent trở thành:

Trợ lý cá nhân hóa
Hệ thống ra quyết định liên tục
“Nhân sự AI” thực thụ

3. Hai loại Memory

Loại Memory	Bản chất	Vai trò
Short-term	Tạm thời	Giữ ngữ cảnh hiện tại
Long-term	Lưu trữ lâu dài	Học và tái sử dụng

4. Bộ nhớ ngắn hạn – Context Window

4.1. Định nghĩa

Context Window = vùng ngữ cảnh mà AI có thể “nhìn thấy” tại một thời điểm

👉 Hiểu đơn giản:

Đây là “trí nhớ làm việc” (working memory)

4.2. Cách hoạt động

AI chỉ xử lý được thông tin nằm trong context:

[User Prompt + History + Instructions] → Model → Output

👉 Nếu vượt quá giới hạn:

Thông tin cũ bị “quên”

4.3. Đặc điểm chính

Giới hạn theo token (ví dụ: 8k, 32k, 128k…)
Không lưu lâu dài
Phụ thuộc vào mỗi request

4.4. Ví dụ thực tế

User chat:

1. “Tôi tên Minh”

2. “Tôi làm CEO”

3. “Hãy viết email cho tôi”

👉 AI hiểu:

Người dùng = Minh
Vai trò = CEO

❗ Nhưng nếu cuộc hội thoại quá dài:
→ AI có thể “quên Minh là ai”

4.5. Ưu điểm & hạn chế

Ưu điểm

Nhanh
Đơn giản
Không cần hệ thống lưu trữ

Hạn chế

Không bền
Không mở rộng được
Không cá nhân hóa lâu dài

5. Bộ nhớ dài hạn – Vector Database

5.1. Định nghĩa

Vector DB = hệ thống lưu trữ thông tin dưới dạng embedding (vector số)

👉 Giúp AI:

Lưu trữ kiến thức
Tìm lại thông tin “liên quan nhất”

5.2. Nguyên lý cốt lõi

Bước 1: Chuyển dữ liệu → vector

Text → embedding

Bước 2: Lưu vào database

Bước 3: Khi cần → truy vấn theo “độ giống”

👉 Không tìm theo keyword
👉 Mà tìm theo ngữ nghĩa (semantic search)

5.3. Ví dụ trực quan

Bạn lưu:

“Minh là CEO công ty công nghệ”
“Minh thích chiến lược cạnh tranh”

Sau đó hỏi:

“Viết chiến lược cho tôi”

👉 AI:

Query → tìm vector gần nhất
Retrieve thông tin liên quan đến “Minh”

→ Cá nhân hóa output

5.4. Công nghệ phổ biến

Pinecone
Weaviate
FAISS
Chroma

5.5. Ưu điểm & hạn chế

Ưu điểm

Lưu trữ lâu dài
Mở rộng vô hạn
Cá nhân hóa mạnh

Hạn chế

Phức tạp hơn
Cần thiết kế retrieval tốt
Có độ trễ (latency)

🔥 6. So sánh trực diện

Tiêu chí	Context Window	Vector DB
Thời gian lưu	Ngắn hạn	Dài hạn
Dung lượng	Giới hạn	Gần như vô hạn
Tốc độ	Rất nhanh	Trung bình
Cá nhân hóa	Thấp	Cao
Cơ chế	Nhét vào prompt	Retrieve + Inject

⚙️ 7. Kiến trúc Memory trong AI Agent

Một AI Agent thực tế thường dùng kết hợp cả 2:

User Input
   ↓
Retrieve (Vector DB)
   ↓
Inject vào Context Window
   ↓
LLM xử lý
   ↓
Output

👉 Đây gọi là:
RAG – Retrieval Augmented Generation

7.1. Luồng hoạt động

1. User hỏi

2. Agent truy vấn Vector DB

3. Lấy dữ liệu liên quan

4. Nhét vào Context Window

5. Model trả lời

7.2. Insight quan trọng

👉 Context Window = “não đang suy nghĩ”
👉 Vector DB = “trí nhớ dài hạn”

→ Agent mạnh = kết hợp cả 2

💡 8. Case thực tế (Doanh nghiệp)

Case 1: Sales AI Agent

Context:

Cuộc hội thoại hiện tại

Vector DB:

Lịch sử khách hàng
Hành vi mua hàng

→ Output: tư vấn cá nhân hóa

Case 2: HR AI Agent

Context:

JD hiện tại

Vector DB:

CV ứng viên
lịch sử đánh giá

→ Output: shortlist ứng viên

Case 3: CEO Assistant

· Context:

câu hỏi chiến lược

Vector DB:

dữ liệu doanh nghiệp
OKR, KPI, chiến lược cũ

→ Output:

Quyết định mang tính “institutional memory”

🚨 9. Sai lầm phổ biến

1. Chỉ dùng Context Window → mất trí nhớ

2. Lưu tất cả vào Vector DB → không retrieve được

3. Không làm sạch dữ liệu → noise cao

4. Không thiết kế embedding strategy

🧠 10. Framework thiết kế Memory cho AI Agent

Bước 1: Xác định loại dữ liệu

Ngắn hạn → Context
Dài hạn → DB

Bước 2: Chuẩn hóa dữ liệu

Chunking
Tagging
Metadata

Bước 3: Thiết kế retrieval

Top-K
Similarity threshold

Bước 4: Inject thông minh

Không nhồi quá nhiều
Chỉ lấy relevant

🎯 11. Kết luận “1 câu nhớ lâu”

❗ Context Window giúp AI “hiểu hiện tại”
❗ Vector DB giúp AI “nhớ quá khứ”

👉 AI Agent thực sự mạnh khi:
Biết cái gì cần nhớ – và nhớ đúng lúc

SÁCH KHAM KHẢO:

https://drive.google.com/file/d/1iIO3pXFxzzpvQ2hGvzNvx-0EdRtj5cqE/view?usp=sharing

Tìm kiếm Blog này

Đỗ Ngọc Minh

AI AGENTS - Bài 13: Viên gạch 6: Memory (Bộ nhớ)

Nhận xét

Đăng nhận xét

Bài đăng phổ biến từ blog này

CHATGPT PROMPTS FOR HRM

CHIẾN LƯỢC vs KẾ HOẠCH

Data driven decision making