(PCWorldVN) Bốn kỹ sư phần mềm không biết tiếng Nhật vừa thiết kế thành công phần mềm nhận diện chữ Nhật viết tay với độ chính xác không ngờ nhờ những tiến bộ vượt bậc của AI và machine learning.
- Baidu, Google và cuộc chiến trí tuệ nhân tạo
- MetaMind và tham vọng thương mại hóa trí tuệ nhân tạo
- Trí tuệ nhân tạo quét email dự đoán việc mất cắp dữ liệu
- Bước đột phá mới trong Trí Tuệ Nhân Tạo
- Machine learning đang ngấm vào doanh nghiệp
Các ứng dụng về trí tuệ nhân tạo (AI) trong thế giới thực đang ngày một nhiều hơn và rơi vào những lĩnh vực ít ai ngờ đến.
Cách nay không lâu, AI đã giành chiến thắng trong môn cờ vây với con người, nhưng rõ ràng là AI không chỉ có vậy.
Đó là cách mà 4 kỹ sư lập trình hầu như không biết tí gì về tiếng Nhật, nhưng chỉ trong vài tháng đã tạo ra được một phần mềm có thể giải mã được chữ viết tay của thứ tiếng này.
Bốn lập trình viên nói trên thuộc công ty Reactive, tạo ra ứng dụng nhận diện chữ Nhật viết tay với độ chính xác đến 98,66%.
Bốn lập trình viên nói trên thuộc công ty Reactive, tạo ra ứng dụng nhận diện chữ Nhật viết tay với độ chính xác đến 98,66%.
Reactive là công ty khởi nghiệp, mới chỉ 18 tháng tuổi, ở Tokyo, là một trong số những nhà lập trình và nhà đầu tư đang muốn tận dụng khả năng của AI để áp dụng vào cuộc sống rộng rãi hơn, không chỉ quẩn quanh với môn cờ vây.
Từ trái sang: David Malkin, Joseph Bullard, Philip Irri và Philippe Remy ở Reactive, Tokyo, Nhật Bản. |
Xa hơn nữa, chúng ta cần sử dụng trí tưởng tượng của mình để ứng dụng được AI vào các tình huống thực tế trong kinh doanh.
AI từng là sân chơi độc quyền của Google, Facebook và một số công ty công nghệ lớn. Đến nay, bất kỳ công ty khởi nghiệp nào cũng có thể truy cập đến các nền tảng đám mây, như cách mà Microsoft, NVIDIA và Amazon.com đang bán AI như là một tiện ích của họ.
AI từng là sân chơi độc quyền của Google, Facebook và một số công ty công nghệ lớn. Đến nay, bất kỳ công ty khởi nghiệp nào cũng có thể truy cập đến các nền tảng đám mây, như cách mà Microsoft, NVIDIA và Amazon.com đang bán AI như là một tiện ích của họ.
Mạng thần kinh “xem” bằng cách áp từng lớp bộ lọc lên đối tượng, tựa như cách thần kinh con người xử lý và nhận diện vật thể.
Công nghệ của Reactive cho thấy ngay cả một nhóm ít ỏi vài nhà lập trình cũng có thể tạo được những ứng dụng phức tạp mà chỉ cần biết chút ít về lĩnh vực ấy. Điều khó khăn hơn là làm thế nào biến ứng dụng tạo ra được có thể kiếm tiền được. Để làm được vậy, Reactive đang muốn giúp các trường học tại Nhật thay thế giấy bằng kiểm tra điện tử, là điều có thể thay đổi rất nhiều bộ mặt giáo dục tại quốc gia này, nhất là ở vùng nông thôn vẫn dựa vào chữ viết tay.
Malkin và cộng sự của anh gồm Joe Bullard, Philippe Remy và Philip Irri đang thúc đẩy dự án của họ. Bullard đã trình diễn chương trình của nhóm cho những chuyên gia trong lĩnh vực AI hồi đầu năm nay tại trụ sở Google ở Nhật, và chương trình vận hành rất trơn tru.
Bài toán về nhận diện chữ viết không mới, nhưng ký tự Nhật lại hoàn toàn khác so với những mẫu tự alphabet thông thường của nhiều ngôn ngữ khác. Đó là vì tiếng Nhật gồm các ký tự tượng hình như kanji, có thể đọc độc lập, nên khó để biết được đâu là khởi đầu một câu, đâu là kết thúc một câu. Có hơn 2.000 chữ phổ biến, tạo từ khoảng vài chục nét bút. Cách làm của Reactive là xử lý từng nét một. Thuật toán của Reactive là tìm trên mạng thần kinh (neural network) nét nào khớp, rồi thêm một nét khác và lập lại, cho đến khi có được chữ hoàn chỉnh khớp với chữ viết tay nhất. Reactive đã đào tạo cho mô hình AI của họ khoảng 1,8 triệu ký tự.
Seishi Okamoto, giám đốc dự án ở Fujjitsu Laboratories cũng đang phát triển phần mềm để nhận diện tiếng Hoa, cho rằng: “Thực tế là công nghệ này sẽ rất tiềm năng cho doanh nghiệp vì tốc độ nhận diện và khả năng mở rộng của nó. Deep learning cho nhận diện chữ viết tiếng Hoa cũng có được khả năng tương tự.”
Không như một chương trình, phần mềm thông thường được viết ra dựa trên những quy luật chung nào đó, AI của deep learning lại mô phỏng giống cách não bộ con người xử lý thông tin hơn. Cung cấp đủ lượng dữ liệu đầu vào và mong muốn có được kết quả đầu ra nào đó, các mạng thần kinh xử lý thông tin bên trong. Điều này cho phép chúng tìm ra nhiều giải pháp rất bất ngờ như thông dịch và tag hình ảnh, khác xa với cách tiếp cận truyền thống.
Yoshua Bengio, giáo sư đại học Montreal, đồng tác giả vài công trình nghiên cứu AI, cho rằng: “Có vài yếu tố khác mà lĩnh vực nghiên cứu AI cần quan tâm, đó là hệ thống máy tính phải đủ mạnh, phải có sẵn các tập dữ liệu khổng lồ và phải cải tiến hơn nữa nền tảng AI cơ bản. Dân chủ hoá các công cụ AI cũng tạo thuận lợi hơn cho các nhà lập trình tự do phát triển ứng dụng và sản phẩm mới.”
Mọi điều trên có vẻ như đang thúc đẩy cuộc cách mạng về công nghệ trí tuệ nhân tạo. Những đầu tư vào các công ty AI khởi nghiệp hiện có trong mọi lĩnh vực, từ giao dục, bán lẻ cho đến nông nghiệp, mà năm 2015 đạt đến 310 triệu USD, gần gấp 7 lần so với cách nay 5 năm (theo CB Insights).
Và một khi đã hoàn thiện, một mạng thần kinh sẽ không còn giới hạn ở các ứng dụng về ngôn ngữ. Khi rảnh rỗi, bốn kỹ sư của Reactive cấp cho công cụ của họ 5.000 chiếc váy tải về từ Google Images, sau đó cho nó một tấm ảnh một phụ nữ mặc một chiếc váy trong số đó. Và phần mềm sẽ phản hồi lại bằng câu nói “Chiếc váy thật đẹp!”.
Malkin và cộng sự của anh gồm Joe Bullard, Philippe Remy và Philip Irri đang thúc đẩy dự án của họ. Bullard đã trình diễn chương trình của nhóm cho những chuyên gia trong lĩnh vực AI hồi đầu năm nay tại trụ sở Google ở Nhật, và chương trình vận hành rất trơn tru.
Bài toán về nhận diện chữ viết không mới, nhưng ký tự Nhật lại hoàn toàn khác so với những mẫu tự alphabet thông thường của nhiều ngôn ngữ khác. Đó là vì tiếng Nhật gồm các ký tự tượng hình như kanji, có thể đọc độc lập, nên khó để biết được đâu là khởi đầu một câu, đâu là kết thúc một câu. Có hơn 2.000 chữ phổ biến, tạo từ khoảng vài chục nét bút. Cách làm của Reactive là xử lý từng nét một. Thuật toán của Reactive là tìm trên mạng thần kinh (neural network) nét nào khớp, rồi thêm một nét khác và lập lại, cho đến khi có được chữ hoàn chỉnh khớp với chữ viết tay nhất. Reactive đã đào tạo cho mô hình AI của họ khoảng 1,8 triệu ký tự.
Seishi Okamoto, giám đốc dự án ở Fujjitsu Laboratories cũng đang phát triển phần mềm để nhận diện tiếng Hoa, cho rằng: “Thực tế là công nghệ này sẽ rất tiềm năng cho doanh nghiệp vì tốc độ nhận diện và khả năng mở rộng của nó. Deep learning cho nhận diện chữ viết tiếng Hoa cũng có được khả năng tương tự.”
Không như một chương trình, phần mềm thông thường được viết ra dựa trên những quy luật chung nào đó, AI của deep learning lại mô phỏng giống cách não bộ con người xử lý thông tin hơn. Cung cấp đủ lượng dữ liệu đầu vào và mong muốn có được kết quả đầu ra nào đó, các mạng thần kinh xử lý thông tin bên trong. Điều này cho phép chúng tìm ra nhiều giải pháp rất bất ngờ như thông dịch và tag hình ảnh, khác xa với cách tiếp cận truyền thống.
Yoshua Bengio, giáo sư đại học Montreal, đồng tác giả vài công trình nghiên cứu AI, cho rằng: “Có vài yếu tố khác mà lĩnh vực nghiên cứu AI cần quan tâm, đó là hệ thống máy tính phải đủ mạnh, phải có sẵn các tập dữ liệu khổng lồ và phải cải tiến hơn nữa nền tảng AI cơ bản. Dân chủ hoá các công cụ AI cũng tạo thuận lợi hơn cho các nhà lập trình tự do phát triển ứng dụng và sản phẩm mới.”
Mọi điều trên có vẻ như đang thúc đẩy cuộc cách mạng về công nghệ trí tuệ nhân tạo. Những đầu tư vào các công ty AI khởi nghiệp hiện có trong mọi lĩnh vực, từ giao dục, bán lẻ cho đến nông nghiệp, mà năm 2015 đạt đến 310 triệu USD, gần gấp 7 lần so với cách nay 5 năm (theo CB Insights).
Và một khi đã hoàn thiện, một mạng thần kinh sẽ không còn giới hạn ở các ứng dụng về ngôn ngữ. Khi rảnh rỗi, bốn kỹ sư của Reactive cấp cho công cụ của họ 5.000 chiếc váy tải về từ Google Images, sau đó cho nó một tấm ảnh một phụ nữ mặc một chiếc váy trong số đó. Và phần mềm sẽ phản hồi lại bằng câu nói “Chiếc váy thật đẹp!”.
|
No comments:
Post a Comment