🎬 Video thuyết minh tiếng Việt sẽ được nhúng ở bài này:

  • M2_05_Khám_phá_cách_AI_sử_dụng_kỹ_thuật_học_máy.mp4
03
Mô-đun 2 · Bên trong AI

Học máy — cách AI “học” từ dữ liệu

AI không tự nhiên thông minh. Đằng sau hầu hết công cụ AI là một kỹ thuật tên là Học máy. Hiểu nó, bạn sẽ hiểu vì sao chất lượng dữ liệu lại quyết định chất lượng AI.

Mindmap phần 3
Học máy (Machine Learning)
AI có ở khắp nơi
  • Gợi ý video trên nền tảng phát trực tuyến
  • GPS chọn tuyến nhanh nhất
  • Dịch hội thoại theo thời gian thực
ML là gì
  • Tập hợp con của AI
  • Phân tích dữ liệu để dự đoán/ra quyết định
  • Giúp công cụ AI hiểu dữ liệu nhanh
Dữ liệu huấn luyện
  • Bộ dữ liệu dùng để “dạy” AI
  • Cung cấp ví dụ về cách phản hồi đúng
  • VD: hàng ngàn ảnh táo chín & chưa chín
Cạm bẫy: thiên kiến
  • Dữ liệu lệch → đầu ra sai
  • Chỉ học táo đỏ → nhận nhầm táo khác màu
  • Chất lượng dữ liệu là then chốt

Giải thíchAI không mới — và nó không tự dạy chính nó

Mọi sự chú ý khiến AI trông như xu hướng công nghệ mới nhất, nhưng thực ra AI đã tồn tại từ lâu. Khi một nền tảng phát trực tuyến gợi ý video bạn có thể thích, đó là AI. Suốt nhiều năm, các công cụ AI — phần mềm có thể tự động hoá hoặc hỗ trợ nhiều nhiệm vụ — đã hiện diện khắp nơi: từ GPS gợi ý tuyến đường nhanh nhất đến hệ thống dịch hội thoại theo thời gian thực.

Dù trông “thông minh tự nhiên”, các công cụ này không tự dạy mình. Chúng chạy trên một kỹ thuật gọi là học máy.

Học máy (ML) là gì?Một tập hợp con của AI, chuyên phát triển những chương trình có thể phân tích dữ liệu để đưa ra quyết định hoặc dự đoán. Nó là lớp chuyên biệt nằm trong danh mục công nghệ AI rộng hơn.
Dữ liệu huấn luyện là gì?bộ dữ liệu dùng để dạy AI. Nó cung cấp cho chương trình ML các ví dụ về điều được mong đợi và cách phản hồi cho thích hợp.

Giải thíchVí dụ kinh điển: dạy AI phân loại táo chín

Hãy hình dung một nhà phân phối thực phẩm muốn dùng công cụ AI để phân loại và đóng gói táo chín. Trước hết, người thiết kế phải huấn luyện chương trình ML cách nhận ra táo chín bằng cách đưa vào một bộ dữ liệu gồm hàng ngàn hình ảnh táo chín và chưa chín. Khi xử lý chỗ ảnh đó, chương trình dần học được đặc điểm của một quả táo chín. Sau khi học xong, công cụ AI có thể nhận diện cả những quả táo chín chưa từng xuất hiện trong dữ liệu huấn luyện, giúp nhân viên nhà máy làm việc hiệu quả hơn.

Cạm bẫy lớn nhất: thiên kiến trong dữ liệu

Nếu dữ liệu huấn luyện chỉ chứa ảnh táo đỏ, AI sẽ kém chính xác khi gặp táo chín có kích thước, hình dạng hay màu sắc khác. Hậu quả: phân loại sai, mất tiền và lãng phí những quả táo tốt. Đây gọi là thiên kiến — và nó cho thấy chất lượng cùng mức độ phù hợp của dữ liệu huấn luyện quyết định chất lượng đầu ra của AI.

Khi được dùng đúng cách, ML là một kỹ thuật phi thường với vô vàn ứng dụng, và đóng vai trò then chốt thúc đẩy AI trong tương lai.