Highlight

Những điều thú vị khi dùng Trí tuệ nhân tạo của Viettel

Những người dùng Internet tại Việt Nam thường lấy “chị Google” ra để… giải trí. Khi “chị” đọc văn bản hay chỉ đường cho người tham gia gi...

Monday, April 11, 2016

Người khiếm thị sẽ sớm có thể "nhìn" nhờ 3 công nghệ sau


Nhờ sự phát triển của công nghệ mà giờ đây, cuộc sống của người khiếm thị sẽ không còn quá khác biệt với người có thị lực bình thường.
Người khiếm thị sẽ sớm có thể "nhìn" nhờ 3 công nghệ sau
Đầu tuần này, Facebook đã nâng cấp bản cập nhật trên nền tảng iOS của mình với tính năng miêu tả bằng giọng nói các bức ảnh được upload lên bởi người dùng.
Đây là một bước tiến lớn, nhưng Facebook không phải công ty duy nhất đang cố gắng mang thế giới đến gần hơn với những người khiếm thị.
Facebook mới cung cấp tính năng “đọc ảnh” cho người mù.
Thực tế, sự phát triển nhanh chóng của trí tuệ nhân tạo, thị giác máy (machine vision) và công nghệ nhận diện hình ảnh đã mở ra thế giới số cho những người khiếm thị và giúp họ kết nối với thế giới bên ngoài.
1. Công nghệ Smart Liquids
Một ví dụ về các thiết bị đã sử dụng công nghệ Smart Liquids đó là chiếc tablet được mệnh danh “iPad đầu tiên dành cho người mù” mà công ty start-up BLITAB tại Australia đã tạo ra.
Theo như Kristina Tsvetanova, người đồng sáng lập và cũng là CEO của BLITAB Technology cho biết, thiết bị này giống như một cuốn sách điện tử nhưng thay vì có màn hình thì nó lại hiển thị những chấm nhỏ, cho phép người dùng có thể đọc toàn bộ trang sách bằng chữ nổi trong một lần.
BLITAB cung cấp một trải nghiệm hoàn toàn mới cho cả người dùng chữ nổi và những người không dùng loại chữ này với phím điều hướng (touch navigation), tính năng chuyển đổi văn bản sang giọng nói, bàn phím đánh chữ nổi Perkin và sắp tới là miêu tả hình ảnh và biểu đồ.
Nó cũng cho phép chuyển đổi trực tiếp mọi loại văn bản sang dạng chữ nổi và nhận thông tin qua thẻ NFC (kết nối không giây tầm ngắn). BLITAB không đơn thuần là một chiếc tablet mà nó còn là nền tảng cho những phần mềm dành cho độc giả khiếm thị hiện nay và cả trong tương lai.
Kiểu dáng lạ mắt, song lại rất tiện lợi cho người khiếm thị của BLITAB
Kiểu dáng lạ mắt, song lại rất tiện lợi cho người khiếm thị của BLITAB
Tháng trước, BLITAB đã ra mắt giao diện mới không có bàn phím với điều hướng tính năng chuyển văn bản thành giọng nói bằng màn hình cảm ứng.
Bà Tsvetanova cũng cho biết, công ty này đang lên kế hoạch tạo ra một dòng máy cao cấp, tích hợp nhiều tính năng hơn với giá khoảng 2.500 Euro, trong khi dòng máy giá rẻ sẽ có giá khoảng 500 Euro và sẽ tập trung chủ yếu vào màn hình chữ nổi.
2. Công nghệ Seeing AI (tạm dịch: nhìn bằng trí thông minh nhân tạo)
MemNets là những ứng dụng giúp hệ thống deep leaning của Facebook hiểu được ngôn ngữ như con người. Theo thông tin từ Facebook, một hệ thống MemNets thử nghiệm đã được dạy để đọc và trả lời những câu hỏi và chạy được dữ liệu lên đến 100.000 câu hỏi.
Trong tương lai, Facebook mong muốn công nghệ này sẽ cho phép người dùng đặt câu hỏi về những bức ảnh, giúp người khiếm thị không phải sống ngoài thế giới số của bạn bè mình.
Microsoft, một ông lớn khác trong ngành công nghệ, cũng đang nghiên cứu lĩnh vực công nghệ hỗ trợ nghệ thuật thị giác (art visual assistive technology) như một phần của dự án Seeing AI mà họ đang thực hiện.
Dự án này được miêu tả chi tiết trong một video, cho thấy họ đang nghiên cứu công nghệ thị giác máy tính với những khả năng xử lý ngôn ngữ tự nhiên để mô tả môi trường xung quanh mỗi người, bao gồm đọc văn bản, trả lời câu hỏi và thậm chí là nhận ra cảm xúc trên khuôn mặt con người.
Dù vẫn chưa quyết định ngày ra mắt, nhưng Microsoft cho biết, Seeing AI sẽ được sử dụng như một ứng dụng điện thoại hay thậm chí truy cập qua kính thông minh từ Pivohead.
3. Công nghệ Neural Networks (tạm dịch: mạng nơ-ron)
Một ứng dụng tiềm năng khác là Aipoly, ứng dụng iPhone sử dụng trí tuệ nhân tạo để nhận diện những sự vật trong đời thực và giúp người khiếm thị cảm nhận thế giới qua điện thoại thông minh.
Thông qua ứng dụng này, người dùng có thể vẽ ra bức tranh trong tâm trí về cảnh vật xung quanh bằng cách scan hình ảnh và nghe ứng dụng mô tả lại địa điểm đó. Họ cũng có thể dùng ứng dụng này để tìm công tắc đèn, ổ cắm hoặc các thiết bị trong phòng tắm.
Đặc biệt, những trẻ em bị suy giảm thị lực có thể dùng ứng dụng này để học về các sự vật xung quanh mà không cần đễ sự hỗ trợ của người giám hộ.
Aipoly nhận diện được đồ vật
Aipoly nhận diện được đồ vật
Người đồng sáng lập của Aipoly, Alberto Rizzoli cho biết, công nghệ của ứng dụng này dựa trên một mạng nơ-ron tích hợp, được “đào tạo” bởi phần mềm Deep Learning của công ty Teradeep với cơ sở dữ liệu lên đến 10 triệu hình ảnh.
Một mạng nơ-ron là mô hình xử lý thông tin được mô phỏng dựa trên não người, trong trường hợp này, nó dựa trên cấu trúc vùng thị giác trong não động vật. Công nghệ này cho phép máy tính “nhìn” và “nghĩ” như con người và giúp chúng có khả năng sáng tạo.
Đây là công nghệ nổi bật trong suốt 5 năm qua. Gần đây công nghệ này đã có thể tạo ra các sản phẩm nghệ thuật dựa trên phong cách của các danh hoạ, thậm chí nó còn có thể “tưởng tượng” và phác hoạ chân dung người.

No comments:

Post a Comment