Microsoft
phải gỡ bỏ chương trình tương tác con người trên Twitter hay AlphaGO
đánh thắng vô địch cờ vây thế giới là những thăng trầm trong thời gian
gần đây trong lĩnh vực trí tuệ nhân tạo (AI).
Nhiều tiến bộ của AI gần đây đến từ phương pháp dạy máy tính deep learning. Ảnh: Michal Bednarek | Shutterstock.com
|
Theo Live Science, một bước tiến lớn của AI
là sự kiện chương trình máy tính của Google đánh cờ vây thắng áp đảo
đương kim vô địch thế giới hồi tháng 3. Đây là trò chơi chiến thuật cổ
của Trung Quốc, phức tạp hơn cờ vua và được coi là một chuẩn mực để đánh
giá sự tiến bộ của AI.
Một tuần sau đó, Microsoft thiết kế một chương trình máy tính khác tên là Tay mô phỏng một cô gái 19 tuổi người Mỹ để
học hỏi từ những tương tác với con người trên Twitter. Theo Microsoft,
hệ thống AI này có thể giao tiếp với con người ngày một tốt hơn nhờ học
hỏi những người tweet đến nó.
Tuy nhiên, họ đã phải tắt hệ thống này 16 giờ sau đó, khi Tay bắt đầu
đưa ra những tuyên bố phân biệt chủng tộc, giới tính và khiêu dâm.
Microsoft sau đó đã phải xin lỗi và giải thích đã xảy ra một vụ "tấn
công phối hợp" vào các "lỗ hổng" và "lỗi kỹ thuật" của Tay.
Dù Microsoft cho rằng họ là nạn nhân của tin tặc, nhưng theo Bart
Selman, một giáo sư về khoa học máy tính tại Đại học Cornell, cái gọi là
"lỗ hổng" thực chất là việc Tay lặp lại các cụm từ được tweet tới nó mà
không qua bất kỳ công cụ lọc nào. Ông cho rằng đây là một trong những
nhược điểm chính của AI hiện nay: kỹ năng đọc hiểu ngôn ngữ.
Dạy cho trí tuệ nhân tạo
AI rất giỏi phân tích cú pháp văn bản, nghĩa là, làm sáng tỏ những mẫu
ngữ pháp là nền tảng cho một ngôn ngữ, theo Selman. Điều này cho phép
các chương trình như Tay có thể đưa ra những câu phát biểu giống như
người thật. Đây cũng là sức mạnh của các chương trình dịch tự động của
Google và Skype.
"Nhưng hiểu ngữ nghĩa – ý nghĩa của câu là một việc khác hoàn toàn", ông nói.
Nhiều tiến bộ gần đây của AI là nhờ vào phương pháp "học sâu – deep
learning", mà ở một số mức độ nào đó có thể mô phỏng quá trình hoạt động
của các lớp tế bào thần kinh trong não bộ. Với dải dữ liệu khổng lồ, nó
rất giỏi trong việc tìm kiếm các mẫu, nên các thành công lớn nhất của
AI cho tới nay đều liên quan tới nhận diện hình ảnh hoặc giọng nói.
Trong khi cách tiếp cận truyền thống của việc dạy máy tính học là nói
cho nó biết cần tìm kiếm cái gì để "học", thì một trong những ưu điểm
chính của deep learning là khả năng "tự động khám phá", theo Shimon
Whiteson, giáo sư khoa Khoa học máy tính, Đại học Oxford, Anh.
Lớp đầu tiên của deep learning là tối ưu hóa để tìm các đặc điểm cơ bản
nhất trong dữ liệu, ví dụ như các cạnh của một vật thể trong một bức
ảnh. Dữ liệu đầu ra sẽ được chuyển tới lớp kế tiếp, quét các cấu hình
phức tạp hơn, như hình vuông hay hình tròn. Quá trình này được lặp đi
lặp lại trên các lớp với độ phức tạp tăng dần theo từng lớp, sao cho tới
một lúc nào đó, nó có thể sử dụng các cấu trúc ở các mức thấp hơn để
xác định một vật thể là ôtô hay xe đạp.
"Với deep learning, bạn chỉ việc đưa dữ liệu thô vào một mạng lưới thần
kinh lớn nào đó, mà sau đó nó sẽ được đào tạo tới cuối", Whiteson cho
biết.
Điều này đã dẫn đến một số khả năng siêu phàm của AI. Selman nói hệ
thống deep learning đã được chứng minh có thể làm tốt hơn các chuyên gia
y tế trong việc chuẩn đoán bệnh từ ảnh chụp cộng hưởng từ MRI. Kết hợp
cùng với phương pháp học tăng cường (reinforcement learning) để đưa ra
chiến lược tối ưu, AI cũng thành công trong việc xây dựng các mô phỏng
ảo chính xác, theo Kaheer Suleman, giám đốc công nghệ và đồng người sáng
lập của công ty về AI tại Canada, Maluuba.
Đây cũng là cách mà chương trình AlphaGo của Google sử dụng để trở
thành một chuyên gia cờ vây, tự chơi hàng triệu ván một mình, kết hợp
các phương pháp này để nâng cao kỹ năng và phát triển chiến thuật.
Tuy nhiên, đây cũng là nhược điểm của phương pháp này.
"Thách thức lớn với AI là những lĩnh vực không có kho dữ liệu đã được
phân loại và dán nhãn, hoặc trong các môi trường không thể mô phỏng
tốt", Suleman nói. "Ngôn ngữ là một lĩnh vực điển hình trong trường hợp
này, Internet là một văn bản vô tận nhưng không nơi nào 'dán nhãn' ngữ
nghĩa theo kiểu máy móc cả".
Maluuba đang phát triển các thuật toán có thể đọc văn bản và trả lời
các câu hỏi về văn bản đó, nhưng Suleman cho biết có một số tính năng
của ngôn ngữ làm cho công việc trở nên đặc biệt khó khăn. Ngữ nghĩa trải
rộng trên nhiều cấp độ, từ từ vựng tới cụm từ và câu. Chúng có thể kết
hợp với nhau theo vô số cách mà mỗi người lại có lối nói riêng.
Ngoài ra, mọi ngôn ngữ đều trừu tượng. Từ ngữ là những biểu tượng đơn
giản cho mọi thứ trong thế giới thực mà một cỗ máy không thể trải nghiệm
được.
Không có sự truy cập vào các dữ liệu của cuộc sống trong một thế giới
vật chất cùng với sự phong phú của những tương tác xã hội mà con người
đã tích lũy từ lâu, nên không có gì ngạc nhiên rằng Tay không hiểu nghĩa
từ "Holocaust" (cuộc tàn sát người Do Thái dưới thời Hitler).
"Deep learning rất tốt nhưng không phải là giải pháp tối ưu", Whiteson
nói. "Còn rất nhiều thứ thiếu sót. Nên bước tiếp theo đương nhiên là bổ
sung gì cho deep learning để nó trở nên tốt hơn".
Hướng tới tương lai
Dù còn nhiều thách thức, Maluuba đã công bố một báo cáo vào tháng
3/2016 trên arXiv, một kho lưu trữ trực tuyến các nghiên cứu, mô tả cách
mà hệ thống của họ có thể trả lời các câu hỏi trắc nghiệm về văn bản
không quen thuộc với độ chính xác 70%, vượt qua các hệ thống khác 15%.
Cách tiếp cận của Maluuba kết hợp deep learning với cấu trúc mạng lưới
thần kinh, được thiết kế để tương tác với nhau theo cách hình thành hình
thức thô sơ của lý luận. Công ty cũng đang làm việc với các hệ thống
hội thoại để học cách đối thoại tự nhiên với con người.
Selman nói rằng AI tập trung vào ngôn ngữ có thể mang lại hữu ích đáng
ngạc nhiên cho các ứng dụng, nơi các đối tượng khá hạn chế. Ví dụ các
đường dây nóng hỗ trợ kỹ thuật, theo ông dự đoán sẽ sớm được tự động hóa
(đã có một vài nơi tự động hóa), hoặc các công việc hành chính tương
đối cao cấp yêu cầu các tương tác theo thủ tục như cập nhật các bảng
tính và gửi đi các email theo công thức.
"Vẫn tồn tại những yếu kém trong những công việc mở, khó kiểm soát,
không những liên quan đến nhiều khía cạnh của trí tuệ con người mà còn
yêu cầu phải thực sự hiểu được con người", Selman nói.
Tuy nhiên, theo Whiteson, vẫn có những thành tựu đáng kể trong lĩnh vực
AI, như xe tự lái của Google là một ví dụ điển hình. Lái xe trên đường
cùng với con người không những yêu cầu phải hiểu luật giao thông, còn
phải theo các chuẩn mực xã hội bất thành văn, cùng với các cách xử lý
khi tránh va chạm xảy ra.
Những tiến bộ trong lĩnh vực AI và robot dẫn đến số lượng máy móc được
sử dụng trong thế giới thực ngày càng tăng, khả năng tương tác với con
người không còn là một mục tiêu viễn tưởng. Các nhà nghiên cứu vẫn đang
tìm kiếm các cách tiếp cận mới giúp máy tính có thể cảm nhận và hiểu
được thế giới xung quanh.
No comments:
Post a Comment