AI AGENTS - Bài 13: Viên gạch 6: Memory (Bộ nhớ)
Bài 13:
Viên gạch
6: Memory (Bộ nhớ)
1. Mục tiêu bài
Sau bài này, học viên sẽ:
- Hiểu
Memory là gì trong AI Agents
- Phân
biệt rõ:
- Bộ
nhớ ngắn hạn (Context Window)
- Bộ
nhớ dài hạn (Vector Database)
- Biết
cách thiết kế hệ thống memory cho AI Agent thực tế
2. Tổng quan: Memory trong AI Agent là gì?
Memory = khả năng AI “nhớ” và “tái sử dụng thông
tin” theo thời gian
👉 Nếu
không có Memory:
- Agent
chỉ “thông minh tức thời”
- Không
học từ quá khứ
- Không
cá nhân hóa
👉 Nếu có
Memory:
- Agent
trở thành:
- Trợ
lý cá nhân hóa
- Hệ
thống ra quyết định liên tục
- “Nhân
sự AI” thực thụ
3. Hai loại Memory
|
Loại Memory |
Bản chất |
Vai trò |
|
Short-term |
Tạm thời |
Giữ ngữ cảnh hiện tại |
|
Long-term |
Lưu trữ lâu dài |
Học và tái sử dụng |
4. Bộ nhớ ngắn hạn – Context Window
4.1. Định nghĩa
Context Window = vùng ngữ cảnh mà AI có thể
“nhìn thấy” tại một thời điểm
👉 Hiểu
đơn giản:
Đây là “trí nhớ làm việc” (working memory)
4.2. Cách hoạt động
AI chỉ xử lý được thông tin nằm trong context:
[User Prompt + History + Instructions] → Model → Output
👉 Nếu vượt
quá giới hạn:
- Thông
tin cũ bị “quên”
4.3. Đặc điểm chính
- Giới
hạn theo token (ví dụ: 8k, 32k, 128k…)
- Không
lưu lâu dài
- Phụ
thuộc vào mỗi request
4.4. Ví dụ thực tế
User chat:
1. “Tôi
tên Minh”
2. “Tôi
làm CEO”
3. “Hãy viết
email cho tôi”
👉 AI hiểu:
- Người
dùng = Minh
- Vai
trò = CEO
❗ Nhưng
nếu cuộc hội thoại quá dài:
→ AI có thể “quên Minh là ai”
4.5. Ưu điểm & hạn chế
Ưu điểm
- Nhanh
- Đơn
giản
- Không
cần hệ thống lưu trữ
Hạn chế
- Không
bền
- Không
mở rộng được
- Không
cá nhân hóa lâu dài
5. Bộ nhớ dài hạn – Vector Database
5.1. Định nghĩa
Vector DB = hệ thống lưu trữ thông tin dưới dạng
embedding (vector số)
👉 Giúp
AI:
- Lưu
trữ kiến thức
- Tìm
lại thông tin “liên quan nhất”
5.2. Nguyên lý cốt lõi
Bước 1: Chuyển dữ liệu → vector
- Text
→ embedding
Bước 2: Lưu vào database
Bước 3: Khi cần → truy vấn theo “độ giống”
👉 Không
tìm theo keyword
👉 Mà tìm theo ngữ
nghĩa (semantic search)
5.3. Ví dụ trực quan
Bạn lưu:
- “Minh
là CEO công ty công nghệ”
- “Minh
thích chiến lược cạnh tranh”
Sau đó hỏi:
“Viết chiến lược cho tôi”
👉 AI:
- Query
→ tìm vector gần nhất
- Retrieve
thông tin liên quan đến “Minh”
→ Cá nhân hóa output
5.4. Công nghệ phổ biến
- Pinecone
- Weaviate
- FAISS
- Chroma
5.5. Ưu điểm & hạn chế
Ưu điểm
- Lưu
trữ lâu dài
- Mở
rộng vô hạn
- Cá
nhân hóa mạnh
Hạn chế
- Phức
tạp hơn
- Cần
thiết kế retrieval tốt
- Có
độ trễ (latency)
🔥 6. So sánh trực diện
|
Tiêu chí |
Context Window |
Vector DB |
|
Thời gian lưu |
Ngắn hạn |
Dài hạn |
|
Dung lượng |
Giới hạn |
Gần như vô hạn |
|
Tốc độ |
Rất nhanh |
Trung bình |
|
Cá nhân hóa |
Thấp |
Cao |
|
Cơ chế |
Nhét vào prompt |
Retrieve + Inject |
⚙️ 7. Kiến trúc Memory trong AI Agent
Một AI Agent thực tế thường dùng kết hợp cả 2:
User Input
↓
Retrieve (Vector DB)
↓
Inject vào Context Window
↓
LLM xử lý
↓
Output
👉 Đây gọi
là:
RAG – Retrieval Augmented Generation
7.1. Luồng hoạt động
1. User hỏi
2. Agent
truy vấn Vector DB
3. Lấy dữ
liệu liên quan
4. Nhét
vào Context Window
5. Model
trả lời
7.2. Insight quan trọng
👉
Context Window = “não đang suy nghĩ”
👉 Vector DB = “trí nhớ
dài hạn”
→ Agent mạnh = kết hợp cả 2
💡 8. Case thực tế (Doanh nghiệp)
Case 1: Sales AI Agent
- Context:
- Cuộc
hội thoại hiện tại
- Vector
DB:
- Lịch
sử khách hàng
- Hành
vi mua hàng
→ Output: tư vấn cá nhân hóa
Case 2: HR AI Agent
- Context:
- JD
hiện tại
- Vector
DB:
- CV
ứng viên
- lịch
sử đánh giá
→ Output: shortlist ứng viên
Case 3: CEO Assistant
· Context:
- câu
hỏi chiến lược
- Vector
DB:
- dữ
liệu doanh nghiệp
- OKR,
KPI, chiến lược cũ
→ Output:
- Quyết
định mang tính “institutional memory”
🚨 9. Sai lầm phổ biến
1. Chỉ
dùng Context Window → mất trí nhớ
2. Lưu tất
cả vào Vector DB → không retrieve được
3. Không
làm sạch dữ liệu → noise cao
4. Không
thiết kế embedding strategy
🧠 10. Framework thiết kế Memory cho AI
Agent
Bước 1: Xác định loại dữ liệu
- Ngắn
hạn → Context
- Dài
hạn → DB
Bước 2: Chuẩn hóa dữ liệu
- Chunking
- Tagging
- Metadata
Bước 3: Thiết kế retrieval
- Top-K
- Similarity
threshold
Bước 4: Inject thông minh
- Không
nhồi quá nhiều
- Chỉ
lấy relevant
🎯 11. Kết luận “1 câu nhớ lâu”
❗
Context Window giúp AI “hiểu hiện tại”
❗ Vector DB giúp AI “nhớ quá
khứ”
👉 AI
Agent thực sự mạnh khi:
Biết cái gì cần nhớ – và nhớ đúng lúc
SÁCH KHAM KHẢO:
https://drive.google.com/file/d/1iIO3pXFxzzpvQ2hGvzNvx-0EdRtj5cqE/view?usp=sharing
Nhận xét
Đăng nhận xét