Phân biệt Artificial Intelligence, Machine Learning, Deep Learning

 

Phân biệt Artificial Intelligence, Machine Learning, Deep Learning 


AI là một thuật ngữ cao siêu mà có lẽ ai cũng từng nghe qua. Lấy cảm hứng từ bộ phim hoạt hình Baymax (Big hero 6), một chú robot thông minh phục vụ và chăm sóc sức khoẻ con người, cũng như có bạn đọc yêu cầu giải đáp thuật ngữ này nên tôi quyết định dành ra một góc để nói về AI.

Bài viết nhằm mục đích làm sáng tỏ cho những bạn chưa phân biệt được các khái niệm AI, Machine Learning – ML và Deep Learning – DL. Dĩ nhiên, người trong ngành phân biệt điều này khá dễ nhưng để có thêm thông tin bổ ích tôi sẽ tổ chức lại kiến thức liên quan để bạn đọc quan tâm tìm hiểu và tiện tra cứu tài liệu hơn.

AI

AI là viết tắt của Artificial Intelligence, dịch ra thành Trí tuệ nhân tạo. Trong lịch sử phát triển AI, các nhà nghiên cứu phân thành 4 hướng tiếp cận chính:

  • Hành động như người (acting humanly)
  • Suy nghĩ như người (thinking humanly)
  • Suy nghĩ hợp lý (thinking rationally)
  • Hành động hợp lý (acting rationally)

Trong đó, mức độ mô phỏng máy tính như người là khó nhất và đây cũng là mục tiêu mà các nhà khoa học đang hướng tới. Ngoài ra, AI còn hướng đến khả năng máy tính có thể suy luận gồm những đặc trưng sau:

  • Suy luận (reasoning): khả năng giải quyết vấn đề bằng suy luận logic.
  • Tri thức (knowledge): khả năng biểu diễn tri thức về thế giới xung quanh (hiểu được có bao nhiêu đối tượng, sự kiện, tình huống hiện hữu trong thế giới thực và được phân loại dựa trên đặc tính của từng đối tượng đó).
  • Lập kế hoạch (planning): khả năng thiết lập và đạt được mục tiêu đề ra dựa trên tri thức đã biểu diễn được.
  • Giao tiếp (communication): khả năng hiểu được ngôn ngữ viết và nói của con người.
  • Nhận thức (perception): khả năng suy luận về thế giới từ hình ảnh thị giác, âm thanh và các đầu vào giác quan khác.

 

Có lẽ bạn đọc đã từng nghe đến câu chuyện Turing test. Đây là hướng phát triển AI hành động như người. Bài test này được Alan Turing đề xuất vào năm 1950, mục đích để kiểm tra hệ thống máy tính đã đạt đến khả năng thông minh hay chưa. Bài test gồm một người đặt câu hỏi, một người trả lời câu hỏi và một máy tính phản hồi câu hỏi. Nếu trong quá trình trao đổi mà người đặt câu hỏi không thể phân biệt được người hay máy trả lời các câu hỏi này thì máy được xem là thông minh. Đến nay thì hướng tiếp cận này đã đạt được một số thành quả nhất định như:

  • Natural language processing: máy có khả năng đọc hiểu và giao tiếp bằng ngôn ngữ tự nhiên với người.
  • Knowledge representation: máy có khả năng lưu trữ tri thức thông qua thị giác, thính giác, hay văn bản.
  • Automated reasoning: máy có khả năng sử dụng tri thức đã lưu trữ để trả lời câu hỏi hay đưa ra kết luận hữu ích.
  • Machine learning: máy có khả năng thích nghi với các điều kiện môi trường xung quanh để rút trích ra các nguyên lý từ tri thức thu nhận được phục vụ cho việc ra quyết định.
  • Computer vision: máy có khả năng quan sát và xác định được các đối tượng xung quanh.
  • Robotics: máy có khả năng tương tác với đối tượng và di chuyển trong môi trường xung quanh.

Suy nghĩ như người là một hướng tiếp cận khác thiên về khoa học nhận thức (cognitive science). Ngành này cần hẳn một thư viện để bạn đọc nghiên cứu. Vì để máy có thể suy nghĩ được như người thì bản thân ta phải hiểu được con người suy nghĩ như thế nào. Ta có ba cách để kiểm tra điều này:

  • Quan sát quá trình suy nghĩ của mình.
  • Quan sát hành động của một người.
  • Quan sát hoạt động của não bộ.

Nếu ta có thể mô phỏng lại input-output tương tự như người thì đây là bằng chứng cho thấy máy có khả năng suy nghĩ như người ở góc độ nào đó. Các nhà nghiên cứu tin tưởng rằng khi kết hợp hai ngành này lại sẽ giúp chúng ta tiến đến mục tiêu AI nhanh chóng hơn.

Suy nghĩ như người thì khó quá nên ta có thể giới hạn bài toán lại chỉ cần suy nghĩ hợp lý là được. Lúc này, logic học đã có đất cho mình dụng võ. Vào thế kỷ 19, các nhà logic học đã phát triển được các kí hiệu toán học để mô tả một phát biểu hay quan hệ giữa các đối tượng bất kỳ trong tự nhiên giúp cho máy có khả năng suy luận. Hướng tiếp cận này gặp vài trắc trở. Thứ nhất, máy khó diễn đạt được tri thức từ thế giới không chính tắc (informal) sang ngôn ngữ chính tắc (formal) đặc biệt khi tri thức đó không chắc chắn 100% là đúng. Thứ hai, có sự khác biệt lớn giữa giải quyết bài toán trên lý thuyết và bài toán ngoài thực tế. Do trong thực tế cần rất nhiều dữ kiện để giải quyết vấn đề nên nhiêu đây cũng đủ khiến cho các hệ thống tính toán bị quá tải.

Cuối cùng là những con robot, là hướng tiếp cận hành động hợp lý. Robot hay còn gọi là agent, trong tiếng La Tinh có nghĩa làm gì đó. Các chương trình máy tính đều có khả năng làm gì đó nhưng agent được đòi hỏi nhiều hơn. Chúng phải có khả năng tự vận hành, thu nhận thông tin từ môi trường xung quanh, tồn tại được trong một thời gian dài, thích nghi với những thay đổi, đề xuất các mục tiêu và đạt được mục tiêu đó. Một con agent như vậy thường được áp dụng các bài test của Turing hay suy luận logic để đạt được các mục tiêu đề ra. Ví dụ điển hình là những con robot của Nasa được phóng lên các hành tinh có điều kiện khắc nghiệt và ít nhận được các chỉ thị của con người, làm sao chúng có thể tự thu thập các mẫu đất đá, tồn tại trong điều kiện gió bão, tự định hướng lịch trình khai thác và sử dụng năng lượng mặt trời để duy trì hoạt động của mình.

Machine learning và Deep learning

Như vậy, ta có thể thấy ML chỉ là một thành phần trong hướng tiếp cận hành động như người, và hướng tiếp cận này lại thuộc bốn hướng tiếp cận của AI. Để đạt được mục tiêu này, các nhà khoa học đã nghiên cứu ra nhiều giải thuật và các hướng giải quyết khác nhau:

  • Supervised-learning: decision tree, k-NN, naive bayes, SVM, neural network, deep learning, …
  • Unsupervised-learning: k-means, hierachical clustering
  • Reinforcement learning: passive/acive/generalization.

Một lần nữa ta có thể thấy Deep learning chỉ là một phương pháp nằm trong hướng giải quyết học có giám sát của ML. Tại sao DL lại gây bão nhiều như vậy. Nhà nhà, doanh nghiệp, engineer đều làm nghiên cứu Deep learning?

Strengths: Deep learning là phương pháp state-of-the-art trong lĩnh vực như computer vision và speech recognition. Deep neural networks có hiệu suất cao trên tập dữ liệu ảnh, audio, và text data, có thể dễ dàng update mô hình bằng dữ liệu mới thông qua batch propagation. Kiến trúc của mô hình này (số lượng và cấu trúc từng layer) có thể được ứng dụng qua nhiều bài toán khác nhau, trong đó các hidden layers đóng vai trò giảm chi phí feature engineering.

Weaknesses: Deep learning không phải là thuật toán general-purpose bởi vì chúng đòi hỏi một lượng dữ liệu khổng lồ để training. Thực tế, chúng bị vượt mặt bởi các thuật toán tree ensembles trong các tác vụ machine leanring cơ bản. Hơn nữa, mô hình này tốn rất nhiều tài nguyên để train và đòi hỏi nhiều chuyên gia để tuning hypermarameters (số layer, số node từng layer, learning rate, số lần lặp).

Một vài nhận định bản thân

Lý do nằm ở chỗ DL khai thác được Big Data cùng với độ chính xác cao trên tập dữ liệu ảnh và tín hiệu số có thể lên đến 95%. Thêm vào đó đây là một cách để kêu gọi vốn đầu tư cũng như kéo mọi người quan tâm nhiều hơn đến nghiên cứu. Ngoài ra, để áp dụng DL, bạn cần tiến hành nhiều thực nghiệm như tiền xử lý dữ liệu, lựa chọn số node, số layer, thiết kế mô hình CNN, RNN, LSTM, dùng nhiều loại activate function để so sánh hiệu suất, áp dụng tỉa node,… Do vậy đã có quá nhiều mẫu thiết kế khác nhau về DL apply vào các hội nghị AI nên ta đã dành cho DL những conference riêng để báo cáo khoa học. Nói như vậy không có nghĩa là DL giải quyết được mọi vấn đề.

Trong thực tế, DL khó vượt mặt các giải thuật cơ bản như Random forest, SVM, hay Monte Carlo estimation. Và gặp khó khăn trên các tập dữ liệu kiểu categories hay văn bản. Đặc biệt trong lĩnh vực Fintech, cụ thể là credit scoring. DL sẽ không cho ta thấy quá trình suy luận diễn ra như thế nào vì đây là black-box method, ta chỉ biết được input và ouput. Khi một khách hàng bị reject hồ sơ mở thẻ tín dụng, ta không biết được tại sao máy lại đưa ra kết luận như vậy. Điều này thật tai hại khi phải diễn giải được kết quả cho khách hàng. Lắm lúc người làm hồ sơ phải tra lại lý lịch từ đầu và có thể phải đưa ra những biện minh cho việc ra quyết định như vậy. Ngoài ra, quyền bí mật thông tin cá nhân bị xâm phạm hoàn toàn. DL cần rất nhiều thông tin ngoài những thông tin cơ bản như tên tuổi, địa chỉ nhà, … Làm sao có thể thu thập được các thông tin khác nếu khách hàng không cho phép. Hơn nữa đối với những bạn đang làm nghiên cứu thì xu hướng sẽ chọn làm DL, như vậy sẽ đánh mất khả năng cạnh tranh về ý tưởng của mình do trong cùng thời điểm đó ai cũng muốn làm về DL.

Nhiều người cho rằng AI phát triển đến một mức nào đó sẽ chiếm quyền kiểm soát con người như trong các bộ phim viễn tưởng Terminator, i-Robot, AI, … Hay chiếm đoạt công việc của những ngành truyền thống như mọi người đang lo sợ. Theo mình thì điều này không thể vì những lý do sau:

  • Máy móc chỉ có khả năng làm theo chỉ thị cụ thể của con người. Nhờ vậy con người sẽ được giải phóng khỏi những công việc lặp đi lặp lại nhàm chán chứ không bị thay thế hoàn toàn. Job cũ bị thay thế bằng job mới được sinh ra
  • Máy không chắc chắn 100% suy luận của mình đưa ra. Do đó, công đoạn cuối vẫn cần đến con người kiểm tra và đưa ra quyết định.
  • Máy móc chỉ hỗ trợ sự sáng tạo của con người chứ bản thân chúng không có khả năng này. Ta có thể điểm qua một số ứng dụng như: Deep dream của Google, brain storming của Adobe, mobile app generation, wix web generation, literature generation, music generation.
  • Thay vì lo lắng về AI, ta nên lo lắng về thông tin riêng tư đang bị lợi dụng hằng ngày.
  • Cần có hệ thống toán học hay ngôn ngữ mới linh hoạt, ít rập khuôn và cứng nhắc hơn (điển hình chỉ có một đúng hai sai) để mô phỏng suy luận, nhận thức và hành động như người.
  • Con người luôn có backup plan cho mọi thứ. Phải có manual trong mọi trường hợp và nút Esc sinh ra cũng vì lý do này.

Một chú Baymax trong bộ phim hoạt hình Big hero 6 hay quen thuộc hơn là Doraemon có lẽ là mơ ước của mọi người. Chú có thể trò chuyện với chúng ta, quét qua cơ thể để phân tích tình hình sức khoẻ, từ đó có thể đưa ra các chẩn đoán. Chú có thể tự thu thập thêm kiến thức mới phục vụ cho việc điều trị. Chú còn biết phân biệt được hành động đúng sai và nguy hiểm, giúp ta tránh được các tổn thương đến cơ thể. Đặc biệt chú có thể tự di chuyển đến nhiều nơi bằng đường bộ hay lắp thêm cánh để bay khắp thành phố. Tôi nghĩ chúng ta nên hướng đến những sản phẩm AI tích cực như vậy thay vì ảo tưởng đến ngày tận thế tiêu cực do những con robot này gây ra. Mà thật ra nạn diệt chủng đều do con người gây ra chứ không phải do máy móc quyết định.

Hy vọng qua bài viết này, bạn đọc đã hình dung rõ hơn giữa các khái niệm AI, ML và DL. Trong tương lai, khi muốn phát triển các hệ thống AI, bạn cần tự hỏi xem mình muốn đi theo hướng suy luận hay hành động, và đạt tới mức độ như người hay chỉ cần hợp lý là đủ rồi. Các hệ thống này đòi hỏi nhiều nỗ lực để hoàn thiện cùng với rủi ro cao phải chấp nhận thất bại. Nhưng nếu thành công trong sứ mệnh phục vụ nhân loại thì các bạn thật xứng đáng vì những gì mình bỏ ra.

Nguồn tham khảo

Nhận xét

Bài đăng phổ biến từ blog này

Dựa theo nội dung cuốn sách THE DIP - VÙNG TRŨNG của Seth Godin.

16 TUÝP NGƯỜI TRONG TỔ CHỨC

9 MÔ HÌNH CHIẾN LƯỢC CHO DOANH NGHIỆP - BÀI 3: MÔ HÌNH 3 - PHÂN TÍCH SWOT