Học máy — cách AI học từ dữ liệu

🎬 Video thuyết minh tiếng Việt sẽ được nhúng ở bài này:

M2_05_Khám_phá_cách_AI_sử_dụng_kỹ_thuật_học_máy.mp4

Mô-đun 2 · Bên trong AI

Học máy — cách AI “học” từ dữ liệu

AI không tự nhiên thông minh. Đằng sau hầu hết công cụ AI là một kỹ thuật tên là Học máy. Hiểu nó, bạn sẽ hiểu vì sao chất lượng dữ liệu lại quyết định chất lượng AI.

Mindmap phần 3

Học máy (Machine Learning)

AI có ở khắp nơi

Gợi ý video trên nền tảng phát trực tuyến
GPS chọn tuyến nhanh nhất
Dịch hội thoại theo thời gian thực

ML là gì

Tập hợp con của AI
Phân tích dữ liệu để dự đoán/ra quyết định
Giúp công cụ AI hiểu dữ liệu nhanh

Dữ liệu huấn luyện

Bộ dữ liệu dùng để “dạy” AI
Cung cấp ví dụ về cách phản hồi đúng
VD: hàng ngàn ảnh táo chín & chưa chín

Cạm bẫy: thiên kiến

Dữ liệu lệch → đầu ra sai
Chỉ học táo đỏ → nhận nhầm táo khác màu
Chất lượng dữ liệu là then chốt

Giải thíchAI không mới — và nó không tự dạy chính nó

Mọi sự chú ý khiến AI trông như xu hướng công nghệ mới nhất, nhưng thực ra AI đã tồn tại từ lâu. Khi một nền tảng phát trực tuyến gợi ý video bạn có thể thích, đó là AI. Suốt nhiều năm, các công cụ AI — phần mềm có thể tự động hoá hoặc hỗ trợ nhiều nhiệm vụ — đã hiện diện khắp nơi: từ GPS gợi ý tuyến đường nhanh nhất đến hệ thống dịch hội thoại theo thời gian thực.

Dù trông “thông minh tự nhiên”, các công cụ này không tự dạy mình. Chúng chạy trên một kỹ thuật gọi là học máy.

Học máy (ML) là gì?Một tập hợp con của AI, chuyên phát triển những chương trình có thể phân tích dữ liệu để đưa ra quyết định hoặc dự đoán. Nó là lớp chuyên biệt nằm trong danh mục công nghệ AI rộng hơn.

Dữ liệu huấn luyện là gì?Là bộ dữ liệu dùng để dạy AI. Nó cung cấp cho chương trình ML các ví dụ về điều được mong đợi và cách phản hồi cho thích hợp.

Giải thíchVí dụ kinh điển: dạy AI phân loại táo chín

Hãy hình dung một nhà phân phối thực phẩm muốn dùng công cụ AI để phân loại và đóng gói táo chín. Trước hết, người thiết kế phải huấn luyện chương trình ML cách nhận ra táo chín bằng cách đưa vào một bộ dữ liệu gồm hàng ngàn hình ảnh táo chín và chưa chín. Khi xử lý chỗ ảnh đó, chương trình dần học được đặc điểm của một quả táo chín. Sau khi học xong, công cụ AI có thể nhận diện cả những quả táo chín chưa từng xuất hiện trong dữ liệu huấn luyện, giúp nhân viên nhà máy làm việc hiệu quả hơn.

Cạm bẫy lớn nhất: thiên kiến trong dữ liệu

Nếu dữ liệu huấn luyện chỉ chứa ảnh táo đỏ, AI sẽ kém chính xác khi gặp táo chín có kích thước, hình dạng hay màu sắc khác. Hậu quả: phân loại sai, mất tiền và lãng phí những quả táo tốt. Đây gọi là thiên kiến — và nó cho thấy chất lượng cùng mức độ phù hợp của dữ liệu huấn luyện quyết định chất lượng đầu ra của AI.

Khi được dùng đúng cách, ML là một kỹ thuật phi thường với vô vàn ứng dụng, và đóng vai trò then chốt thúc đẩy AI trong tương lai.