Trí tuệ nhân tạo (AI) - Chuyên đề 6: Introduction to Machine Learning (Giới thiệu về Học máy)
Chuyên đề 6:
Introduction to Machine Learning (Giới thiệu về Học máy)
Mục tiêu: Giúp bạn hiểu rõ cách máy
"học" từ dữ liệu, phân biệt các loại học máy chính và thấy được các ứng
dụng thực tế từ gợi ý xem phim đến chatbot.
Thời lượng đề xuất: ~2 giờ.
Đối tượng: Người muốn hiểu sâu hơn
về AI và ứng dụng ML vào thực tế.
1. Tiêu đề: Introduction to Machine Learning (ML)
- Nền
Tảng Của Mọi AI Hiện Đại
- Chúng
ta đã nói về AI tạo sinh, LLM và Cloud. Bây giờ là lúc tìm hiểu về công
nghệ cốt lõi nhất, nền tảng của tất cả những thứ đó: Machine Learning (Học
máy). Đây chính là cơ chế cho phép máy tính có khả năng "học" mà
không cần được lập trình từng bước một. Hiểu về Học máy chính là hiểu về
"trái tim" đang đập của AI hiện đại.
2. Machine Learning (Học máy) là gì?
Để hiểu Học máy, hãy so sánh nó với lập trình truyền thống.
- Lập
trình truyền thống:
- Quy
trình: Bạn (lập trình viên) phân tích một vấn đề,
nghĩ ra các quy tắc (rules) logic để giải quyết nó, rồi viết các
quy tắc đó thành mã lệnh để máy tính thực thi.
- Ví
dụ (Lọc email spam): Bạn viết code với các quy tắc như:
- NẾU
email chứa từ "trúng thưởng", "khuyến mãi đặc biệt",
"miễn phí 100%"
- HOẶC
NẾU email được gửi từ một địa chỉ lạ
- THÌ
đánh dấu email này là SPAM.
- Hạn
chế: Cách tiếp cận này cứng nhắc và không hiệu quả. Những
kẻ gửi spam sẽ nhanh chóng thay đổi từ ngữ ("khuyën mãi",
"miê~n phí") để lách luật. Bạn sẽ phải liên tục cập nhật các
quy tắc một cách thủ công.
- Machine
Learning:
- Quy
trình: Thay vì cung cấp quy tắc, bạn cung cấp dữ
liệu (data). Bạn đưa cho máy tính hàng triệu ví dụ về email spam và
email không phải spam. Nhiệm vụ của máy tính là tự tìm ra các quy tắc
và mẫu ẩn để phân biệt hai loại này.
- Ví
dụ (Lọc email spam): Bạn cung cấp cho mô hình ML một tập
dữ liệu gồm:
- 1
triệu email đã được con người dán nhãn là "SPAM".
- 1
triệu email đã được dán nhãn là "KHÔNG SPAM".
- Mô
hình sẽ tự học được rằng các email spam thường có những đặc điểm như: chứa
nhiều ký tự đặc biệt, có các đường link lạ, hoặc sử dụng các cụm từ nhất
định. Nó xây dựng một mô hình phức tạp dựa trên xác suất, linh hoạt hơn rất
nhiều so với các quy tắc cứng.
- Định
nghĩa của Arthur Samuel (1959): "Học máy là lĩnh vực
nghiên cứu cung cấp cho máy tính khả năng học hỏi mà không cần được lập
trình một cách tường minh."
3. Loại #1: Supervised Learning (Học có giám sát)
Đây là loại hình học máy phổ biến nhất.
- Khái
niệm: Tên gọi "có giám sát" ví von quá trình học
này giống như một học sinh có giáo viên hướng dẫn. "Giáo viên"
(là chúng ta, những người chuẩn bị dữ liệu) cung cấp cho "học sinh"
(mô hình ML) một bộ "sách giáo khoa" chứa đầy đủ cả câu hỏi và
câu trả lời đúng.
- Dữ
liệu đầu vào: Dữ liệu phải được dán nhãn (labeled
data). Mỗi điểm dữ liệu bao gồm hai phần: một đầu vào (input
feature) và một đầu ra mong muốn (output label).
- Mục
tiêu: Mô hình sẽ học cách "ánh xạ" từ đầu vào đến
đầu ra. Sau khi quá trình học kết thúc, khi bạn đưa cho nó một đầu vào mới
(chưa từng thấy trước đây), nó có thể dự đoán ra đầu ra tương ứng.
- Ví
dụ:
- Input:
Một hình ảnh. Output label: "Chó" hoặc "Mèo".
- Input:
Diện tích, số phòng ngủ, vị trí của một ngôi nhà. Output label:
Giá bán của ngôi nhà đó.
4. Ứng dụng của Supervised Learning
Học có giám sát thường được dùng để giải quyết hai loại vấn
đề chính:
- Phân
loại (Classification): Khi đầu ra cần dự đoán là một nhãn
hoặc một danh mục rời rạc.
- Ví
dụ:
- Lọc
email spam: Nhãn là "spam" hoặc
"không spam".
- Nhận
diện hình ảnh: Nhãn là "chó",
"mèo", "ô tô", "người".
- Phân
tích cảm xúc: Nhãn là "tích cực", "tiêu
cực", "trung tính" cho một bình luận của khách hàng.
- Chẩn
đoán y tế: Dựa trên hình ảnh X-quang, nhãn dự đoán
là "có khối u" hoặc "không có khối u".
- Hồi
quy (Regression): Khi đầu ra cần dự đoán là một giá
trị số liên tục.
- Ví
dụ:
- Dự
báo giá nhà: Dự đoán một con số cụ thể (ví dụ: 2.5 tỷ
đồng).
- Dự
báo doanh thu: Dự đoán doanh thu của quý tới.
- Dự
báo thời tiết: Dự đoán nhiệt độ (ví dụ: 28.5°C) hoặc lượng
mưa (ví dụ: 15mm).
5. Loại #2: Unsupervised Learning (Học không giám sát)
- Khái
niệm: Ngược lại với học có giám sát, ở đây không có
"giáo viên" và không có "câu trả lời đúng". Bạn chỉ
đưa cho mô hình một lượng lớn dữ liệu không có nhãn (unlabeled data)
và yêu cầu nó: "Hãy tự tìm ra những điều thú vị trong đống dữ liệu
này."
- Mục
tiêu: Mô hình sẽ tự động cố gắng khám phá ra các cấu
trúc, mẫu, hoặc các nhóm tiềm ẩn bên trong dữ liệu mà con người có thể
không dễ dàng nhận ra.
- Ví
dụ: Bạn đưa cho mô hình ML dữ liệu mua sắm của 10,000
khách hàng (không có nhãn gì cả). Mô hình có thể tự phát hiện ra rằng có 3
nhóm khách hàng chính: (1) những người hay mua đồ giảm giá, (2) những người
trung thành với một thương hiệu, và (3) những người chỉ mua sắm vào cuối
tuần.
6. Ứng dụng của Unsupervised Learning
- Phân
cụm (Clustering): Đây là nhiệm vụ phổ biến nhất của học
không giám sát.
- Phân
khúc khách hàng: Các công ty thương mại điện tử sử dụng
clustering để nhóm những khách hàng có hành vi duyệt web và mua sắm giống
nhau. Từ đó, họ có thể gửi các chiến dịch marketing được cá nhân hóa cho
từng nhóm.
- Tổ
chức tài liệu: Google News sử dụng clustering để tự động
nhóm hàng ngàn bài báo từ các nguồn khác nhau viết về cùng một sự kiện lại
với nhau.
- Phân
tích hình ảnh: Trong y tế, nó có thể được dùng để nhóm
các loại tế bào tương tự nhau trong hình ảnh sinh thiết.
- Phát
hiện bất thường (Anomaly Detection):
- Phát
hiện gian lận tài chính: Hệ thống sẽ học
"hành vi bình thường" của một tài khoản thẻ tín dụng. Bất kỳ
giao dịch nào khác biệt đáng kể so với mẫu bình thường (ví dụ: một giao dịch
lớn bất ngờ ở một quốc gia khác) sẽ được gắn cờ là bất thường để kiểm
tra.
- Giám
sát sản xuất: Phát hiện các lỗi hoặc sự cố trên dây
chuyền sản xuất dựa trên dữ liệu từ các cảm biến.
7. Loại #3: Reinforcement Learning (Học tăng cường)
Đây là loại hình học máy gần nhất với cách con người và động
vật học hỏi.
- Khái
niệm: Học thông qua thử và sai (trial and error)
trong một môi trường tương tác.
- Các
thành phần chính:
- Tác
nhân (Agent): Là mô hình AI mà chúng ta muốn huấn luyện
(ví dụ: một con robot, một nhân vật trong game).
- Môi
trường (Environment): Là thế giới mà tác nhân tương tác
(ví dụ: một mê cung, bàn cờ).
- Hành
động (Action): Những gì tác nhân có thể làm (ví dụ: đi
sang trái, đi sang phải).
- Phần
thưởng (Reward): Một tín hiệu tích cực mà môi trường
trả về khi tác nhân thực hiện một hành động tốt (ví dụ: +1 điểm khi tìm
thấy lối ra).
- Hình
phạt (Penalty): Một tín hiệu tiêu cực (hoặc không có phần
thưởng) khi tác nhân thực hiện hành động xấu (ví dụ: -1 điểm khi đâm vào
tường).
- Mục
tiêu: Tác nhân không được cho biết hành động nào là đúng. Nó
phải tự mình thử nghiệm các hành động khác nhau và qua thời gian, nó sẽ học
được một chính sách (policy) - một chiến lược hành động - để tối
đa hóa tổng phần thưởng mà nó nhận được.
8. Ứng dụng của Reinforcement Learning
Học tăng cường rất hiệu quả cho các bài toán ra quyết định
tuần tự.
- Chơi
game: AlphaGo của Google DeepMind đã đánh bại nhà vô địch cờ
vây thế giới bằng cách tự chơi hàng triệu ván cờ với chính nó và học từ những
nước đi dẫn đến chiến thắng.
- Robotics: Dạy
các cánh tay robot cách cầm nắm các vật thể có hình dạng khác nhau hoặc dạy
robot hai chân cách giữ thăng bằng và đi lại.
- Hệ
thống đề xuất (Recommender Systems): Tối ưu hóa việc đề
xuất sản phẩm nào cho người dùng tiếp theo để tối đa hóa khả năng họ sẽ
mua hàng hoặc tương tác.
- Xe
tự lái: Giúp xe đưa ra các quyết định phức tạp
trong thời gian thực, như khi nào cần chuyển làn, khi nào cần tăng tốc hay
phanh gấp để đảm bảo an toàn và hiệu quả.
9. Ví dụ: Tại sao Facebook biết bạn thích gì?
Hệ thống đề xuất nội dung của Facebook (hay Netflix,
YouTube, TikTok) là một ứng dụng phức tạp, kết hợp nhiều kỹ thuật Machine
Learning, chủ yếu là Supervised và Unsupervised Learning.
1. Thu thập
dữ liệu (Input): Mọi hành động của bạn trên nền tảng đều là một
tín hiệu dữ liệu: mỗi lần bạn nhấn "like", mỗi bình luận bạn viết, mỗi
video bạn xem hết, mỗi bài viết bạn dừng lại đọc lâu hơn 3 giây, những người bạn
kết bạn, những trang bạn theo dõi...
2. Phân cụm
người dùng (Unsupervised Learning): Hệ thống sẽ phân tích hành vi
của hàng tỷ người dùng và tự động nhóm bạn vào các "cụm" (clusters) với
những người có sở thích và hành vi tương tự. Ví dụ, bạn có thể thuộc cụm
"những người yêu chó, thích du lịch phượt, và làm việc trong ngành
marketing".
3. Dự đoán
sở thích (Supervised Learning): Bây giờ, giả sử một người khác
trong cụm của bạn vừa "like" một video về một chú chó Corgi. Hệ thống
sẽ xem đây là một cặp dữ liệu (input: người trong cụm A, output: thích video
chó Corgi). Nó sẽ sử dụng mô hình học có giám sát để dự đoán (predict) rằng
bạn, với tư cách là một thành viên khác của cụm A, cũng có khả năng cao sẽ
thích video đó.
4. Xếp hạng
và Hiển thị: Hệ thống sẽ dự đoán xác suất bạn sẽ tương tác với
hàng trăm, hàng nghìn bài đăng tiềm năng. Sau đó, nó sẽ xếp hạng chúng và hiển
thị những bài đăng có xác suất tương tác cao nhất lên đầu News Feed của bạn.
Quá trình này diễn ra liên tục mỗi khi bạn làm mới trang.
10. Tóm tắt & Q&A
- Kết
luận chính: Machine Learning là công nghệ nền tảng cho
phép máy tính tự học hỏi từ dữ liệu, tạo nên "trí thông minh"
cho các ứng dụng AI.
- Ba
loại hình chính:
- Học
có giám sát (Supervised Learning): Học từ dữ liệu có nhãn để
đưa ra dự đoán.
- Học
không giám sát (Unsupervised Learning): Khám phá cấu trúc
ẩn trong dữ liệu không nhãn.
- Học
tăng cường (Reinforcement Learning): Học qua thử và
sai để ra quyết định tối ưu.
- Ứng
dụng thực tiễn: Từ việc bạn nhận được một đề xuất phim
trên Netflix, đến việc email của bạn được lọc spam, hay một chatbot có thể
hiểu câu hỏi của bạn, tất cả đều là sản phẩm của Machine Learning.
Nhận xét
Đăng nhận xét