AI AGENTS - BÀI 10: TOOLS – CÔNG CỤ GIÚP KẾT NỐI VỚI THẾ GIỚI THỰC (Viên gạch thứ 3)
BÀI 10:
TOOLS –
CÔNG CỤ GIÚP KẾT NỐI VỚI THẾ GIỚI THỰC
1. Khái niệm: Tại sao Agent cần công cụ (Tools)?
Nếu LLM là bộ não, thì Tools (Công cụ) chính là đôi
tay, đôi mắt và đôi chân của Agent. Một bộ não dù thông minh đến đâu nếu bị nhốt
trong phòng kín cũng không thể làm được việc. Công cụ cho phép Agent huấn luyện
để tương tác trực tiếp với thực tế.
2. Các nhóm công cụ phổ biến và sức mạnh của
chúng
A. Web Search (như “đôi mắt” của Agent - Cập nhật
thông tin)
- Mô
tả: Kết nối Agent với các công cụ tìm kiếm như Google,
Bing hoặc Serper.
- Sức
mạnh: Giúp Agent thoát khỏi "điểm dừng kiến thức"
(Knowledge Cutoff). Nó có thể biết được giá vàng hôm nay, tin tức sáng nay
hoặc các xu hướng vừa mới chớm nở. Đôi khi chúng ta cần nhiều nguồn khác
nhau để so sánh và có thể tìm thông tin mới nhất.
- Ví
dụ: "Hãy tìm cho tôi 5 xu hướng công nghệ nổi bật nhất
tại triển lãm CES 2025."
B. Python Code Interpreter (Kỹ sư tính toán - Xử
lý dữ liệu)
- Mô
tả: Cho phép Agent tự viết và tự chạy mã code Python trong
một môi trường an toàn. Bằng những promts cơ bản chúng ta biến chúng thành
ngôn ngữ Python (là một ngôn ngữ lập trình rất mạnh).
- Sức
mạnh: Giải quyết các bài toán logic phức tạp, vẽ biểu đồ, xử
lý file Excel hàng triệu dòng hoặc thực hiện các phép tính siêu chính xác
mà LLM thuần túy thường làm sai.
- Ví
dụ: "Từ file CSV doanh thu này, hãy vẽ biểu đồ tăng
trưởng và dự báo doanh số tháng sau."
C. SQL Database (Tàng kinh các - Truy xuất dữ liệu
nội bộ)
- Mô
tả: Kết nối trực tiếp vào cơ sở dữ liệu của doanh nghiệp.
- Sức
mạnh: Thay vì phải xuất file Excel, Agent có thể "hỏi"
trực tiếp database để lấy thông tin khách hàng, tồn kho theo thời gian thực.
- Ví
dụ: "Liệt kê 10 khách hàng có giá trị đơn hàng cao nhất
trong quý 3."
D. API kết nối (Gọi các công cụ hỗ trợ khác nhau
- Thực thi tác vụ)
- Mô
tả: Kết nối với Gmail, Google Calendar, Slack, Trello...
- Sức
mạnh: Đây là lúc Agent thực sự "làm việc". Nó có
thể soạn email, lên lịch họp, nhắn tin cho đồng nghiệp.
- Ví
dụ: "Dựa vào lịch trống của tôi, hãy đặt một cuộc hẹn
với đối tác vào chiều thứ Ba."
3. Lời khuyên & Tips để sử dụng công cụ
chuyên nghiệp
- Tip
1: Nguyên tắc "Đúng công cụ, Đúng việc":
Đừng bắt Agent dùng Python để tìm tin tức, cũng đừng dùng Web Search để
tính toán tài chính. Hãy định nghĩa rõ thế mạnh của từng công cụ trong phần
mô tả (Tool Description).
- Tip
2: Mô tả công cụ là "Chìa khóa":
Agent quyết định dùng công cụ dựa trên mô tả bạn viết. Hãy viết mô tả thật
chi tiết. Thay vì ghi "Công cụ tìm kiếm", hãy ghi "Dùng
công cụ này khi người dùng hỏi về các sự kiện diễn ra sau năm 2024 hoặc
tin tức nóng hổi".
- Tip
3: Luôn có "Hàng rào bảo vệ" (Guardrails):
Đặc biệt với công cụ chạy code (Python) hoặc xóa dữ liệu (SQL), hãy thiết
lập quyền "chỉ đọc" hoặc yêu cầu con người xác nhận
(Human-in-the-loop) trước khi thực thi các hành động quan trọng.
VÍ DỤ:
GIẢI THÍCH KỊCH BẢN CHO CÁC
TIP
Tip 1: Nguyên tắc "Đúng công cụ, Đúng việc"
Kịch bản: Xây dựng một Agent Phân
tích Tài chính. Chúng ta sẽ tách biệt rõ ràng công cụ tìm kiếm và công cụ
tính toán để tránh sai số.
- Tình
huống: Người dùng hỏi: "Dựa trên tin tức
sáng nay, hãy tính xem nếu tôi mua 100 cổ phiếu Apple thì cần bao nhiêu tiền?"
- Cách
cấu hình Agent:
- Tool
1: Google_Search (Chỉ dùng để lấy giá cổ phiếu hiện tại).
- Tool
2: Python_Interpreter (Chỉ dùng để thực hiện phép tính: giá
x 100).
- Prompt
chỉ dẫn: "Nếu câu hỏi yêu cầu dữ liệu thực
tế, hãy gọi Google_Search trước. Sau khi có con số, tuyệt đối không tự
tính nhẩm, hãy chuyển con số đó vào Python_Interpreter để có kết quả chính
xác 100%."
Tip 2: Mô tả công cụ là "Chìa khóa"
(Semantic Labeling)
Kịch bản: Agent Trợ lý Văn phòng có 2
công cụ dễ gây nhầm lẫn: Nội quy công ty (RAG) và Tìm kiếm Web.
- Vấn
đề: Nếu bạn mô tả chung chung là "Tìm kiếm thông
tin", AI sẽ bối rối không biết tìm ở đâu khi khách hỏi về "Chế độ
thai sản".
- Cách
viết mô tả công cụ chuyên nghiệp (Tool Description):
- Tool
RAG_Internal: "Dùng công cụ này KHI VÀ CHỈ KHI
câu hỏi liên quan đến chính sách, quy định, phúc lợi hoặc quy trình riêng
biệt của công ty chúng ta."
- Tool
Web_Search: "Dùng công cụ này khi câu hỏi
liên quan đến kiến thức phổ thông, luật pháp nhà nước hoặc tin tức bên
ngoài không nằm trong tài liệu nội bộ."
- Kết
quả: Agent sẽ không bao giờ dùng Google để tìm bảng lương của
nhân viên, giúp bảo mật và tăng độ chính xác.
Tip 3: Luôn có "Hàng rào bảo vệ"
(Human-in-the-loop)
Kịch bản: Agent Quản lý Quan hệ Khách
hàng (CRM) có công cụ Gửi Email và Cập nhật dữ liệu.
- Tình
huống: Bạn không muốn AI tự ý gửi một email xin lỗi
sai lệch cho đối tác VIP hoặc xóa nhầm dữ liệu khách hàng.
- Cách
thiết lập kịch bản Guardrails:
- Bước
1: Agent soạn thảo nội dung email dựa trên công cụ Email_Draft_Tool.
- Bước
2 (Rào chắn): Agent không được gọi Send_Email_API ngay.
Nó phải trình bày bản thảo cho người dùng.
- Prompt
yêu cầu: "Sau khi soạn xong nội dung, bạn
phải hiển thị rõ ràng cho tôi xem. Chỉ khi tôi gõ 'Duyệt' hoặc 'OK', bạn
mới được phép gọi công cụ Send_Email_API để gửi đi."
TỔNG KẾT: KỊCH BẢN TỔNG HỢP CHO NGƯỜI MỚI
Nếu bạn đang dùng một Framework như CrewAI, kịch bản
(code/config) sẽ trông như thế này:
Python
# Minh họa Tip 1 & 2: Định nghĩa công cụ có mô tả chi tiết
search_tool = SerperDevTool(
description="Chuyên
dùng để tra cứu giá cổ phiếu và tin tức thị trường mới nhất hôm nay."
)
calculator_tool = PythonREPLTool(
description="Chuyên
dùng để tính toán tài chính, lợi nhuận và vẽ biểu đồ. Luôn dùng khi có con số."
)
# Minh họa Tip 3: Thiết lập quyền phê duyệt
research_agent = Agent(
role='Chuyên gia Tài
chính',
goal='Phân tích và
tính toán chi phí đầu tư',
tools=[search_tool,
calculator_tool],
step_callback=human_approval_function # Rào chắn: Phải có người duyệt mỗi
bước
)
Lời khuyên cuối cùng: Hãy
coi Agent như một nhân viên mới thử việc. Bạn không chỉ đưa cho họ bộ đồ nghề
(Tools), mà còn phải dặn kỹ: "Cái này dùng lúc nào" (Tip 2), "Đừng
dùng kìm để đóng đinh" (Tip 1), và "Làm xong nhớ hỏi ý kiến
tôi rồi mới bấm nút gửi" (Tip 3).
4. ROADMAP: Lộ trình chinh phục Công cụ dành cho
người mới
Bước 1: Nhập môn (Tuần 1-2) - "Hỏi và
Tìm"
- Học
cách sử dụng các Agent có sẵn kết nối Internet (như Perplexity hoặc tính
năng Search của ChatGPT).
- Tập
viết các câu lệnh yêu cầu AI tìm kiếm và tóm tắt nguồn tin.
Bước 2: Làm quen với Dữ liệu (Tuần 3-4) -
"Tính toán và Trực quan"
- Học
cách tải file Excel lên AI và yêu cầu nó dùng Python để phân tích.
- Học
các câu lệnh cơ bản về xử lý dữ liệu (Pandas) để hiểu cách AI đang làm việc
dưới nền.
Bước 3: Kết nối hệ sinh thái (Tuần 5-6) -
"Tự động hóa đơn giản"
- Sử
dụng các công cụ No-code như Zapier hoặc Make.com để kết nối
AI với Gmail/Calendar.
- Xây
dựng quy trình: Nếu có email mới -> AI tóm tắt -> Gửi thông báo vào
Slack.
Bước 4: Chuyên gia điều phối (Tuần 7+) -
"Xây dựng Agent tự thân"
- Học
cách sử dụng Framework như CrewAI hoặc LangChain để tự tạo
các Tool tùy chỉnh (Custom Tools).
- Học
cách viết API để Agent có thể nói chuyện với bất kỳ phần mềm nào của doanh
nghiệp.
Nhận xét
Đăng nhận xét