AI AGENTS - BÀI 10: TOOLS – CÔNG CỤ GIÚP KẾT NỐI VỚI THẾ GIỚI THỰC (Viên gạch thứ 3)

Đỗ Ngọc Minh



BÀI 10:

TOOLS – CÔNG CỤ GIÚP KẾT NỐI VỚI THẾ GIỚI THỰC

1. Khái niệm: Tại sao Agent cần công cụ (Tools)?

Nếu LLM là bộ não, thì Tools (Công cụ) chính là đôi tay, đôi mắt và đôi chân của Agent. Một bộ não dù thông minh đến đâu nếu bị nhốt trong phòng kín cũng không thể làm được việc. Công cụ cho phép Agent huấn luyện để tương tác trực tiếp với thực tế.


2. Các nhóm công cụ phổ biến và sức mạnh của chúng

A. Web Search (như “đôi mắt” của Agent - Cập nhật thông tin)

  • Mô tả: Kết nối Agent với các công cụ tìm kiếm như Google, Bing hoặc Serper.
  • Sức mạnh: Giúp Agent thoát khỏi "điểm dừng kiến thức" (Knowledge Cutoff). Nó có thể biết được giá vàng hôm nay, tin tức sáng nay hoặc các xu hướng vừa mới chớm nở. Đôi khi chúng ta cần nhiều nguồn khác nhau để so sánh và có thể tìm thông tin mới nhất.
  • Ví dụ: "Hãy tìm cho tôi 5 xu hướng công nghệ nổi bật nhất tại triển lãm CES 2025."

B. Python Code Interpreter (Kỹ sư tính toán - Xử lý dữ liệu)

  • Mô tả: Cho phép Agent tự viết và tự chạy mã code Python trong một môi trường an toàn. Bằng những promts cơ bản chúng ta biến chúng thành ngôn ngữ Python (là một ngôn ngữ lập trình rất mạnh).
  • Sức mạnh: Giải quyết các bài toán logic phức tạp, vẽ biểu đồ, xử lý file Excel hàng triệu dòng hoặc thực hiện các phép tính siêu chính xác mà LLM thuần túy thường làm sai.
  • Ví dụ: "Từ file CSV doanh thu này, hãy vẽ biểu đồ tăng trưởng và dự báo doanh số tháng sau."

C. SQL Database (Tàng kinh các - Truy xuất dữ liệu nội bộ)

  • Mô tả: Kết nối trực tiếp vào cơ sở dữ liệu của doanh nghiệp.
  • Sức mạnh: Thay vì phải xuất file Excel, Agent có thể "hỏi" trực tiếp database để lấy thông tin khách hàng, tồn kho theo thời gian thực.
  • Ví dụ: "Liệt kê 10 khách hàng có giá trị đơn hàng cao nhất trong quý 3."

D. API kết nối (Gọi các công cụ hỗ trợ khác nhau - Thực thi tác vụ)

  • Mô tả: Kết nối với Gmail, Google Calendar, Slack, Trello...
  • Sức mạnh: Đây là lúc Agent thực sự "làm việc". Nó có thể soạn email, lên lịch họp, nhắn tin cho đồng nghiệp.
  • Ví dụ: "Dựa vào lịch trống của tôi, hãy đặt một cuộc hẹn với đối tác vào chiều thứ Ba."

3. Lời khuyên & Tips để sử dụng công cụ chuyên nghiệp

  • Tip 1: Nguyên tắc "Đúng công cụ, Đúng việc": Đừng bắt Agent dùng Python để tìm tin tức, cũng đừng dùng Web Search để tính toán tài chính. Hãy định nghĩa rõ thế mạnh của từng công cụ trong phần mô tả (Tool Description).
  • Tip 2: Mô tả công cụ là "Chìa khóa": Agent quyết định dùng công cụ dựa trên mô tả bạn viết. Hãy viết mô tả thật chi tiết. Thay vì ghi "Công cụ tìm kiếm", hãy ghi "Dùng công cụ này khi người dùng hỏi về các sự kiện diễn ra sau năm 2024 hoặc tin tức nóng hổi".
  • Tip 3: Luôn có "Hàng rào bảo vệ" (Guardrails): Đặc biệt với công cụ chạy code (Python) hoặc xóa dữ liệu (SQL), hãy thiết lập quyền "chỉ đọc" hoặc yêu cầu con người xác nhận (Human-in-the-loop) trước khi thực thi các hành động quan trọng.

VÍ DỤ: GIẢI THÍCH KỊCH BẢN CHO CÁC TIP

Tip 1: Nguyên tắc "Đúng công cụ, Đúng việc"

Kịch bản: Xây dựng một Agent Phân tích Tài chính. Chúng ta sẽ tách biệt rõ ràng công cụ tìm kiếm và công cụ tính toán để tránh sai số.

  • Tình huống: Người dùng hỏi: "Dựa trên tin tức sáng nay, hãy tính xem nếu tôi mua 100 cổ phiếu Apple thì cần bao nhiêu tiền?"
  • Cách cấu hình Agent:
    • Tool 1: Google_Search (Chỉ dùng để lấy giá cổ phiếu hiện tại).
    • Tool 2: Python_Interpreter (Chỉ dùng để thực hiện phép tính: giá x 100).
  • Prompt chỉ dẫn: "Nếu câu hỏi yêu cầu dữ liệu thực tế, hãy gọi Google_Search trước. Sau khi có con số, tuyệt đối không tự tính nhẩm, hãy chuyển con số đó vào Python_Interpreter để có kết quả chính xác 100%."

Tip 2: Mô tả công cụ là "Chìa khóa" (Semantic Labeling)

Kịch bản: Agent Trợ lý Văn phòng có 2 công cụ dễ gây nhầm lẫn: Nội quy công ty (RAG)Tìm kiếm Web.

  • Vấn đề: Nếu bạn mô tả chung chung là "Tìm kiếm thông tin", AI sẽ bối rối không biết tìm ở đâu khi khách hỏi về "Chế độ thai sản".
  • Cách viết mô tả công cụ chuyên nghiệp (Tool Description):
    • Tool RAG_Internal: "Dùng công cụ này KHI VÀ CHỈ KHI câu hỏi liên quan đến chính sách, quy định, phúc lợi hoặc quy trình riêng biệt của công ty chúng ta."
    • Tool Web_Search: "Dùng công cụ này khi câu hỏi liên quan đến kiến thức phổ thông, luật pháp nhà nước hoặc tin tức bên ngoài không nằm trong tài liệu nội bộ."
  • Kết quả: Agent sẽ không bao giờ dùng Google để tìm bảng lương của nhân viên, giúp bảo mật và tăng độ chính xác.

Tip 3: Luôn có "Hàng rào bảo vệ" (Human-in-the-loop)

Kịch bản: Agent Quản lý Quan hệ Khách hàng (CRM) có công cụ Gửi EmailCập nhật dữ liệu.

  • Tình huống: Bạn không muốn AI tự ý gửi một email xin lỗi sai lệch cho đối tác VIP hoặc xóa nhầm dữ liệu khách hàng.
  • Cách thiết lập kịch bản Guardrails:
    • Bước 1: Agent soạn thảo nội dung email dựa trên công cụ Email_Draft_Tool.
    • Bước 2 (Rào chắn): Agent không được gọi Send_Email_API ngay. Nó phải trình bày bản thảo cho người dùng.
    • Prompt yêu cầu: "Sau khi soạn xong nội dung, bạn phải hiển thị rõ ràng cho tôi xem. Chỉ khi tôi gõ 'Duyệt' hoặc 'OK', bạn mới được phép gọi công cụ Send_Email_API để gửi đi."

TỔNG KẾT: KỊCH BẢN TỔNG HỢP CHO NGƯỜI MỚI

Nếu bạn đang dùng một Framework như CrewAI, kịch bản (code/config) sẽ trông như thế này:

Python

# Minh họa Tip 1 & 2: Định nghĩa công cụ có mô tả chi tiết

search_tool = SerperDevTool(

    description="Chuyên dùng để tra cứu giá cổ phiếu và tin tức thị trường mới nhất hôm nay."

)

calculator_tool = PythonREPLTool(

    description="Chuyên dùng để tính toán tài chính, lợi nhuận và vẽ biểu đồ. Luôn dùng khi có con số."

)

 

# Minh họa Tip 3: Thiết lập quyền phê duyệt

research_agent = Agent(

  role='Chuyên gia Tài chính',

  goal='Phân tích và tính toán chi phí đầu tư',

  tools=[search_tool, calculator_tool],

  step_callback=human_approval_function # Rào chắn: Phải có người duyệt mỗi bước

)

Lời khuyên cuối cùng: Hãy coi Agent như một nhân viên mới thử việc. Bạn không chỉ đưa cho họ bộ đồ nghề (Tools), mà còn phải dặn kỹ: "Cái này dùng lúc nào" (Tip 2), "Đừng dùng kìm để đóng đinh" (Tip 1), và "Làm xong nhớ hỏi ý kiến tôi rồi mới bấm nút gửi" (Tip 3).

 


4. ROADMAP: Lộ trình chinh phục Công cụ dành cho người mới

Bước 1: Nhập môn (Tuần 1-2) - "Hỏi và Tìm"

  • Học cách sử dụng các Agent có sẵn kết nối Internet (như Perplexity hoặc tính năng Search của ChatGPT).
  • Tập viết các câu lệnh yêu cầu AI tìm kiếm và tóm tắt nguồn tin.

Bước 2: Làm quen với Dữ liệu (Tuần 3-4) - "Tính toán và Trực quan"

  • Học cách tải file Excel lên AI và yêu cầu nó dùng Python để phân tích.
  • Học các câu lệnh cơ bản về xử lý dữ liệu (Pandas) để hiểu cách AI đang làm việc dưới nền.

Bước 3: Kết nối hệ sinh thái (Tuần 5-6) - "Tự động hóa đơn giản"

  • Sử dụng các công cụ No-code như Zapier hoặc Make.com để kết nối AI với Gmail/Calendar.
  • Xây dựng quy trình: Nếu có email mới -> AI tóm tắt -> Gửi thông báo vào Slack.

Bước 4: Chuyên gia điều phối (Tuần 7+) - "Xây dựng Agent tự thân"

  • Học cách sử dụng Framework như CrewAI hoặc LangChain để tự tạo các Tool tùy chỉnh (Custom Tools).
  • Học cách viết API để Agent có thể nói chuyện với bất kỳ phần mềm nào của doanh nghiệp.

Bonus: Ebook:




https://drive.google.com/file/d/1DlJzo-HPsNDtvZ8tixqaDwE2yeQEvVfq/view?usp=sharing

 


Nhận xét

Bài đăng phổ biến từ blog này

CHATGPT PROMPTS FOR HRM

CHIẾN LƯỢC vs KẾ HOẠCH

Data driven decision making