Trí tuệ nhân tạo (AI) - Chuyên đề 6: Introduction to Machine Learning (Giới thiệu về Học máy)

Đỗ Ngọc Minh

Chuyên đề 6: Introduction to Machine Learning (Giới thiệu về Học máy)

Mục tiêu: Giúp bạn hiểu rõ cách máy "học" từ dữ liệu, phân biệt các loại học máy chính và thấy được các ứng dụng thực tế từ gợi ý xem phim đến chatbot.

Thời lượng đề xuất: ~2 giờ.

Đối tượng: Người muốn hiểu sâu hơn về AI và ứng dụng ML vào thực tế.

1. Tiêu đề: Introduction to Machine Learning (ML)

Nền Tảng Của Mọi AI Hiện Đại
Chúng ta đã nói về AI tạo sinh, LLM và Cloud. Bây giờ là lúc tìm hiểu về công nghệ cốt lõi nhất, nền tảng của tất cả những thứ đó: Machine Learning (Học máy). Đây chính là cơ chế cho phép máy tính có khả năng "học" mà không cần được lập trình từng bước một. Hiểu về Học máy chính là hiểu về "trái tim" đang đập của AI hiện đại.

2. Machine Learning (Học máy) là gì?

Để hiểu Học máy, hãy so sánh nó với lập trình truyền thống.

Lập trình truyền thống:

Quy trình: Bạn (lập trình viên) phân tích một vấn đề, nghĩ ra các quy tắc (rules) logic để giải quyết nó, rồi viết các quy tắc đó thành mã lệnh để máy tính thực thi.
Ví dụ (Lọc email spam): Bạn viết code với các quy tắc như:

NẾU email chứa từ "trúng thưởng", "khuyến mãi đặc biệt", "miễn phí 100%"
HOẶC NẾU email được gửi từ một địa chỉ lạ
THÌ đánh dấu email này là SPAM.

Hạn chế: Cách tiếp cận này cứng nhắc và không hiệu quả. Những kẻ gửi spam sẽ nhanh chóng thay đổi từ ngữ ("khuyën mãi", "miê~n phí") để lách luật. Bạn sẽ phải liên tục cập nhật các quy tắc một cách thủ công.

Machine Learning:

Quy trình: Thay vì cung cấp quy tắc, bạn cung cấp dữ liệu (data). Bạn đưa cho máy tính hàng triệu ví dụ về email spam và email không phải spam. Nhiệm vụ của máy tính là tự tìm ra các quy tắc và mẫu ẩn để phân biệt hai loại này.
Ví dụ (Lọc email spam): Bạn cung cấp cho mô hình ML một tập dữ liệu gồm:

1 triệu email đã được con người dán nhãn là "SPAM".
1 triệu email đã được dán nhãn là "KHÔNG SPAM".

Mô hình sẽ tự học được rằng các email spam thường có những đặc điểm như: chứa nhiều ký tự đặc biệt, có các đường link lạ, hoặc sử dụng các cụm từ nhất định. Nó xây dựng một mô hình phức tạp dựa trên xác suất, linh hoạt hơn rất nhiều so với các quy tắc cứng.

Định nghĩa của Arthur Samuel (1959): "Học máy là lĩnh vực nghiên cứu cung cấp cho máy tính khả năng học hỏi mà không cần được lập trình một cách tường minh."

3. Loại #1: Supervised Learning (Học có giám sát)

Đây là loại hình học máy phổ biến nhất.

Khái niệm: Tên gọi "có giám sát" ví von quá trình học này giống như một học sinh có giáo viên hướng dẫn. "Giáo viên" (là chúng ta, những người chuẩn bị dữ liệu) cung cấp cho "học sinh" (mô hình ML) một bộ "sách giáo khoa" chứa đầy đủ cả câu hỏi và câu trả lời đúng.
Dữ liệu đầu vào: Dữ liệu phải được dán nhãn (labeled data). Mỗi điểm dữ liệu bao gồm hai phần: một đầu vào (input feature) và một đầu ra mong muốn (output label).
Mục tiêu: Mô hình sẽ học cách "ánh xạ" từ đầu vào đến đầu ra. Sau khi quá trình học kết thúc, khi bạn đưa cho nó một đầu vào mới (chưa từng thấy trước đây), nó có thể dự đoán ra đầu ra tương ứng.
Ví dụ:

Input: Một hình ảnh. Output label: "Chó" hoặc "Mèo".
Input: Diện tích, số phòng ngủ, vị trí của một ngôi nhà. Output label: Giá bán của ngôi nhà đó.

4. Ứng dụng của Supervised Learning

Học có giám sát thường được dùng để giải quyết hai loại vấn đề chính:

Phân loại (Classification): Khi đầu ra cần dự đoán là một nhãn hoặc một danh mục rời rạc.

Ví dụ:

Lọc email spam: Nhãn là "spam" hoặc "không spam".
Nhận diện hình ảnh: Nhãn là "chó", "mèo", "ô tô", "người".
Phân tích cảm xúc: Nhãn là "tích cực", "tiêu cực", "trung tính" cho một bình luận của khách hàng.
Chẩn đoán y tế: Dựa trên hình ảnh X-quang, nhãn dự đoán là "có khối u" hoặc "không có khối u".

Hồi quy (Regression): Khi đầu ra cần dự đoán là một giá trị số liên tục.

Ví dụ:

Dự báo giá nhà: Dự đoán một con số cụ thể (ví dụ: 2.5 tỷ đồng).
Dự báo doanh thu: Dự đoán doanh thu của quý tới.
Dự báo thời tiết: Dự đoán nhiệt độ (ví dụ: 28.5°C) hoặc lượng mưa (ví dụ: 15mm).

5. Loại #2: Unsupervised Learning (Học không giám sát)

Khái niệm: Ngược lại với học có giám sát, ở đây không có "giáo viên" và không có "câu trả lời đúng". Bạn chỉ đưa cho mô hình một lượng lớn dữ liệu không có nhãn (unlabeled data) và yêu cầu nó: "Hãy tự tìm ra những điều thú vị trong đống dữ liệu này."
Mục tiêu: Mô hình sẽ tự động cố gắng khám phá ra các cấu trúc, mẫu, hoặc các nhóm tiềm ẩn bên trong dữ liệu mà con người có thể không dễ dàng nhận ra.
Ví dụ: Bạn đưa cho mô hình ML dữ liệu mua sắm của 10,000 khách hàng (không có nhãn gì cả). Mô hình có thể tự phát hiện ra rằng có 3 nhóm khách hàng chính: (1) những người hay mua đồ giảm giá, (2) những người trung thành với một thương hiệu, và (3) những người chỉ mua sắm vào cuối tuần.

6. Ứng dụng của Unsupervised Learning

Phân cụm (Clustering): Đây là nhiệm vụ phổ biến nhất của học không giám sát.

Phân khúc khách hàng: Các công ty thương mại điện tử sử dụng clustering để nhóm những khách hàng có hành vi duyệt web và mua sắm giống nhau. Từ đó, họ có thể gửi các chiến dịch marketing được cá nhân hóa cho từng nhóm.
Tổ chức tài liệu: Google News sử dụng clustering để tự động nhóm hàng ngàn bài báo từ các nguồn khác nhau viết về cùng một sự kiện lại với nhau.
Phân tích hình ảnh: Trong y tế, nó có thể được dùng để nhóm các loại tế bào tương tự nhau trong hình ảnh sinh thiết.

Phát hiện bất thường (Anomaly Detection):

Phát hiện gian lận tài chính: Hệ thống sẽ học "hành vi bình thường" của một tài khoản thẻ tín dụng. Bất kỳ giao dịch nào khác biệt đáng kể so với mẫu bình thường (ví dụ: một giao dịch lớn bất ngờ ở một quốc gia khác) sẽ được gắn cờ là bất thường để kiểm tra.
Giám sát sản xuất: Phát hiện các lỗi hoặc sự cố trên dây chuyền sản xuất dựa trên dữ liệu từ các cảm biến.

7. Loại #3: Reinforcement Learning (Học tăng cường)

Đây là loại hình học máy gần nhất với cách con người và động vật học hỏi.

Khái niệm: Học thông qua thử và sai (trial and error) trong một môi trường tương tác.
Các thành phần chính:

Tác nhân (Agent): Là mô hình AI mà chúng ta muốn huấn luyện (ví dụ: một con robot, một nhân vật trong game).
Môi trường (Environment): Là thế giới mà tác nhân tương tác (ví dụ: một mê cung, bàn cờ).
Hành động (Action): Những gì tác nhân có thể làm (ví dụ: đi sang trái, đi sang phải).
Phần thưởng (Reward): Một tín hiệu tích cực mà môi trường trả về khi tác nhân thực hiện một hành động tốt (ví dụ: +1 điểm khi tìm thấy lối ra).
Hình phạt (Penalty): Một tín hiệu tiêu cực (hoặc không có phần thưởng) khi tác nhân thực hiện hành động xấu (ví dụ: -1 điểm khi đâm vào tường).

Mục tiêu: Tác nhân không được cho biết hành động nào là đúng. Nó phải tự mình thử nghiệm các hành động khác nhau và qua thời gian, nó sẽ học được một chính sách (policy) - một chiến lược hành động - để tối đa hóa tổng phần thưởng mà nó nhận được.

8. Ứng dụng của Reinforcement Learning

Học tăng cường rất hiệu quả cho các bài toán ra quyết định tuần tự.

Chơi game: AlphaGo của Google DeepMind đã đánh bại nhà vô địch cờ vây thế giới bằng cách tự chơi hàng triệu ván cờ với chính nó và học từ những nước đi dẫn đến chiến thắng.
Robotics: Dạy các cánh tay robot cách cầm nắm các vật thể có hình dạng khác nhau hoặc dạy robot hai chân cách giữ thăng bằng và đi lại.
Hệ thống đề xuất (Recommender Systems): Tối ưu hóa việc đề xuất sản phẩm nào cho người dùng tiếp theo để tối đa hóa khả năng họ sẽ mua hàng hoặc tương tác.
Xe tự lái: Giúp xe đưa ra các quyết định phức tạp trong thời gian thực, như khi nào cần chuyển làn, khi nào cần tăng tốc hay phanh gấp để đảm bảo an toàn và hiệu quả.

9. Ví dụ: Tại sao Facebook biết bạn thích gì?

Hệ thống đề xuất nội dung của Facebook (hay Netflix, YouTube, TikTok) là một ứng dụng phức tạp, kết hợp nhiều kỹ thuật Machine Learning, chủ yếu là Supervised và Unsupervised Learning.

1. Thu thập dữ liệu (Input): Mọi hành động của bạn trên nền tảng đều là một tín hiệu dữ liệu: mỗi lần bạn nhấn "like", mỗi bình luận bạn viết, mỗi video bạn xem hết, mỗi bài viết bạn dừng lại đọc lâu hơn 3 giây, những người bạn kết bạn, những trang bạn theo dõi...

2. Phân cụm người dùng (Unsupervised Learning): Hệ thống sẽ phân tích hành vi của hàng tỷ người dùng và tự động nhóm bạn vào các "cụm" (clusters) với những người có sở thích và hành vi tương tự. Ví dụ, bạn có thể thuộc cụm "những người yêu chó, thích du lịch phượt, và làm việc trong ngành marketing".

3. Dự đoán sở thích (Supervised Learning): Bây giờ, giả sử một người khác trong cụm của bạn vừa "like" một video về một chú chó Corgi. Hệ thống sẽ xem đây là một cặp dữ liệu (input: người trong cụm A, output: thích video chó Corgi). Nó sẽ sử dụng mô hình học có giám sát để dự đoán (predict) rằng bạn, với tư cách là một thành viên khác của cụm A, cũng có khả năng cao sẽ thích video đó.

4. Xếp hạng và Hiển thị: Hệ thống sẽ dự đoán xác suất bạn sẽ tương tác với hàng trăm, hàng nghìn bài đăng tiềm năng. Sau đó, nó sẽ xếp hạng chúng và hiển thị những bài đăng có xác suất tương tác cao nhất lên đầu News Feed của bạn. Quá trình này diễn ra liên tục mỗi khi bạn làm mới trang.

10. Tóm tắt & Q&A

Kết luận chính: Machine Learning là công nghệ nền tảng cho phép máy tính tự học hỏi từ dữ liệu, tạo nên "trí thông minh" cho các ứng dụng AI.
Ba loại hình chính:

Học có giám sát (Supervised Learning): Học từ dữ liệu có nhãn để đưa ra dự đoán.
Học không giám sát (Unsupervised Learning): Khám phá cấu trúc ẩn trong dữ liệu không nhãn.
Học tăng cường (Reinforcement Learning): Học qua thử và sai để ra quyết định tối ưu.

Ứng dụng thực tiễn: Từ việc bạn nhận được một đề xuất phim trên Netflix, đến việc email của bạn được lọc spam, hay một chatbot có thể hiểu câu hỏi của bạn, tất cả đều là sản phẩm của Machine Learning.

Tìm kiếm Blog này

Đỗ Ngọc Minh

Trí tuệ nhân tạo (AI) - Chuyên đề 6: Introduction to Machine Learning (Giới thiệu về Học máy)

Nhận xét

Đăng nhận xét

Bài đăng phổ biến từ blog này

CHATGPT PROMPTS FOR HRM

30 NỖI ĐAU THÁCH THỨC CỦA CEO - BÀI 18: SỰ RỜI ĐI CỦA NHÂN VẬT CHỦ CHỐT

CÁC ĐIỂM CHÍNH ĐỂ TRIỂN KHAI HỆ THỐNG ĐÁNH GIÁ GIÁ TRỊ CÔNG VIỆC - In-house Point Factor System (IPFS)