Highlight

Những điều thú vị khi dùng Trí tuệ nhân tạo của Viettel

Những người dùng Internet tại Việt Nam thường lấy “chị Google” ra để… giải trí. Khi “chị” đọc văn bản hay chỉ đường cho người tham gia gi...

Tuesday, June 7, 2016

Sự thật đằng sau các sản phẩm trí tuệ nhân tạo



Người vô tâm nói về chuyện loài người sẽ bị trí tuệ nhân tạo dẫn dắt, nhưng chắc chắn rằng nhân loại sẽ vẫn phải dùng bộ não của chính mình trong tương lai phía trước.
Dạo gần đây, trí tuệ nhân tạo (AI) - trong vỏ bọc công cụ trợ lý cá nhân, chương trình tự động, xe tự hành và học máy - lại được hâm nóng, là chủ đề chính trong các cuộc trò chuyện của thung lũng Silicon, báo cáo của các phương tiện truyền thông công nghệ và hội chợ thương mại...
AI là một trong những công nghệ đầy những hứa hẹn thường được (các hãng công nghệ) thốt ra, nhưng chỉ được hiện thực hóa một cách ... từ từ.
Tôi nhớ đến những cuộc trình diễn công nghệ AI của IBM, MIT, Carnie-Melon, Thinking Machines và những thứ tương tự giữa thập niên 1980, cũng như những nhân vật ủng hộ công nghệ như Jaron Lanier, người thường xuất hiện trên bìa của những tạp chí công nghệ đỉnh cao thời đó như "Omni".
AI là lĩnh vực tập trung không ít nghiên cứu khoa học, nhưng việc hiện thực hóa vẫn còn như đứa bé chưa trưởng thành. Đây không phải là câu chuyện hoàng đế không mặc gì, thay vào đó thì vị hoàng đế này hiện chỉ mặc duy nhất chiếc quần lót. Song, còn cần phải mặc vào nhiều thứ khác nữa.
Vì vậy, hãy đừng quá tin vào những hứa hẹn của phần mềm hay máy thông minh. Chúng ta đã cách xa, nhiều thập kỷ, thời kỳ của chiếc máy tính biết nói trong phim "Star Trek", hay như của nhân vật trí tuệ nhân tạo trong phim AI của Steven Spielberg...
Tuy nhiên, đã có nhiều tiến triển trong lĩnh vực nghiên cứu trí tuệ nhân tạo nói chung. Các nhà phát triển thông minh sẽ tập trung vào các lĩnh vực cụ thể mà có tiềm năng thực thụ trong hiện tại và nhường phần còn lại cho các ... tiểu thuyết gia khoa học viễn tưởng và báo chí công nghệ.
Robot và AI: những hệ phái riêng biệt
Trong nhiều năm qua, các tác phẩm viễn tưởng đã dung hợp robot với trí tuệ nhân tạo, từ nhân vật Gort trong "The Day the Earth Stood Still” đến các Cylon trong "Battlestar Galactica," từ những robot giả người trong tiểu thuyết “I Robot” của Isaac Asimov, đến phim "Star Trek: The Next Generation".
Tuy nhiên, robot không phải là trí tuệ silicon, mà là máy có thể thực hiện những tác vụ cơ khí trước đây được con người xử lý - thường xuyên hơn đáng tin cậy, nhanh hơn, và không có nhu cầu cho một mức lương đủ sống hoặc phúc lợi.
Robot hiện phổ biến trong sản xuất và được sử dụng trong bệnh viện để cấp phát thuốc (vì chúng không biết ăn cắp), nhưng lại không có quá nhiều trong các cao ốc văn phòng và trong gia đình.
Gần đây đã có những tiến bộ đáng kinh ngạc trong lĩnh vực công nghệ mô phỏng sinh học, được thúc đẩy phát triển phần lớn nhờ vào các cựu binh Mỹ - những người đã mất chân tay trong các cuộc chiến suốt hai thập kỷ qua.
Bây giờ chúng ta thấy chân tay có thể đáp ứng xung động thần kinh và sóng não như là bộ phận mở rộng tự nhiên của cơ thể, và rõ ràng chẳng bao lâu nữa chúng sẽ không cần phải gắn dây cáp điện lằng nhằng và các máy hỗ trợ để vận hành.
Có lẽ một ngày nào đó chúng ta sẽ dung hợp AI vào robot và cuối cùng trở thành nô lệ cho các Cylon - hoặc tệ hơn. Nhưng không còn rất lâu nữa đâu. Cùng lúc đó, một số tiến bộ trong lĩnh vực AI sẽ giúp robot làm việc hiệu quả hơn, bởi vì phần mềm của chúng trở nên tinh vi hơn.
Trọng tâm nghiên cứu mô hình so khớp mẫu
Đa số những sản phẩm thông minh hiện chỉ là cơ sở của AI - tính năng gợi ý sản phẩm trên trang web Amazon, các gợi ý nội dung trên Facebook, nhận dạng giọng nói của Apple Siri, hướng dẫn đường đi của Google Maps, và nhiều thứ khác như vậy - chỉ đơn giản là việc so khớp theo mẫu.
Nhờ những tiến bộ liên tục trong lĩnh vực lưu trữ dữ liệu và quy mô tính toán, nhờ sức mạnh điện toán đám mây, nhiều mẫu/quy luật có thể được lưu trữ, xác định, dựa vào đó tiếp tục phát triển, nhiều hơn bao giờ hết. Phần lớn những gì con người làm đều dựa trên mô hình so khớp theo mẫu - để giải quyết một vấn đề, ngay từ đầu người ta hay thử đoán xem đối tượng đó giống thứ gì đã biết, sau đó thử các giải pháp (tương ứng) đã biết. Mô hình so khớp mẫu càng đưa ra hành động hay kết quả nhanh, thì dường như hệ thống (được xem là) càng thông minh hơn.
Nhưng chúng ta vẫn còn trong thời kỳ trứng nước sơ khai. Có một số trường hợp, chẳng hạn như trong lĩnh vực định vị tìm đường, có những hệ thống cung cấp dịch vụ rất tốt, nhưng cũng có những hệ thống chỉ người ta đâm vào đống gạch hay xi-măng của một sân bay đang xây dở, vào giữa hồ nước, hoặc vào một con đường ngập tuyết ở ngoại thành bởi vì ... hệ thống GPS “bảo” phải di chuyển như vậy.
Nhưng chủ yếu, các hệ thống này đều "không biết gì".
Đó là lý do tại sao mà sau khi bạn truy cập Amazon và xem sản phẩm, nhiều trang web khác bạn ghé thăm lại hiển thị các mẫu quảng cáo sản phẩm đó. Thật ngớ ngẩn, các hệ thống này chỉ biết rằng bạn xem sản phẩm X đó, và do đó, chúng tiếp tục hiển thị hình ảnh của sản phẩm đó. Thông minh là như vậy sao?
Và không chỉ có các mẫu quảng cáo sản phẩm của Amazon; tính năng so khớp âm nhạc của Apple Music và các gợi ý tìm kiếm qua giọng nói của Google Now cũng không hiểu gì về ngữ cảnh, vì vậy chúng dẫn bạn vào một biển mênh mông những thứ giống nhau... một cách nhanh nhảu đoảng.
Chúng thậm chí còn làm ngược ý bạn, như của tính năng "AutoCorrect" (tự động sửa từ) trên bàn phím mềm của các thiết bị Apple hiện nay. Đây là ví dụ tiêu biểu về sự thất bại trong giải quyết vấn đề bằng sức mạnh đám đông: mọi người đều gõ phím tạo ra những câu sai văn phạm, không rõ ràng về số nhiều số ít, dấu câu, viết hoa và lỗi chính tả. (Tôi phát hiện ra rằng tắt tính năng này đi sẽ bớt lỗi hơn, ngay cả đối với tay gõ phím tệ như tôi).
Cái thiếu chính là chiều sâu của ngữ cảnh; AI cần biết bạn đã mua hoặc từ chối mua sản phẩm gì, để từ đó không hiển thị quảng cáo món hàng giống y hệt, mà lại nên đưa ra sản phẩm nào bạn quan tâm hơn. Với âm nhạc cũng vậy - nếu danh sách bài hát bạn nghe khác nhau, vậy các gợi ý cũng cần khác đi. Và tương tự với tính gợi ý nơi ăn tối của Google Now - vâng, tôi thích các món Ấn Độ, nhưng làm ơn không phải lúc nào tôi cũng thích như vậy. Có món gì mà tôi thích và gần đây không ăn không? Vậy còn quy tắc, sở thích của những người hay đi ăn cùng tôi thì sao?
AutoCorrect chính là một ví dụ khác, đòi hỏi ngữ cảnh. Đầu tiên, cần ai đó bảo Apple rằng có khác biệt giữa từ "its" và từ "it's" cũng như có nhiều biến thể ngôn từ trong tiếng Anh cần được thể hiện đúng trên màn hình thiết bị.
Đừng mong rằng chỉ cần các chương trình bot (phần mềm trợ lý tự động) hoàn thành tác vụ đơn giản là được. Nhưng ví dụ về tính năng AutoCorrect cho thấy không hẳn như vậy. Trên thực tế, đó cùng là một loại vấn đề.
Tính năng AutoCorrect
Xác định mẫu trên đà phát triển của ngành máy học
Mô hình so khớp mẫu, ngay cả trong ngữ cảnh đầy đủ dữ liệu hỗ trợ, vẫn không đủ. Bởi vì việc này cần có những điều cần được xác định trước. Đó là lý do vì sao cần xác định mẫu, nghĩa là phần mềm phát hiện ra các mẫu mới hoặc đã bị thay đổi bằng cách giám sát hoạt động của bạn.
Điều đó không dễ dàng, bởi vì cần có quy tắc, tham số nền cho các hệ thống như vậy.
Những nỗ lực nghiên cứu về xác định mẫu là một mảng lớn của máy học ngày nay, cho dù để dụ bạn bấm/nhấn vào quảng cáo nhiều hoặc mua hàng nhiều hơn, chẩn đoán lỗi của máy photocopy và động cơ máy bay, định tuyến đường cho xe tải dựa trên thời tiết và giao thông, hoặc đối phó với rủi ro trong khi lái xe (công nghệ tránh va chạm).
Vì lĩnh vực máy học khó như vậy - đặc biệt đối với những lĩnh vực không được định nghĩa và tổ chức rõ ràng - bạn chỉ có thể mong đợi xuất hiện những tiến bộ chậm, dù hệ thống có cải tiến, nhưng những cải tiến đó sẽ không có kêt quả một sớm một chiều.
Nhận dạng giọng nói là một ví dụ tuyệt vời - những hệ thống đầu tiên (trợ giúp trên điện thoại) kém khủng khiếp, nhưng bây giờ chúng ta có Siri, Google Now và Cortana khá tốt dành cho nhiều người, hiểu được nhiều cụm từ. Một số người thực sự dùng chúng như những "người" phiên dịch.
Bên trong xe hơi tự lái
Nhưng khi ngữ cảnh càng không rõ ràng, máy càng khó học, bởi vì các mô hình của chúng không có đầy đủ thông tin hoặc quá lệ thuộc vào hệ quy chiếu của môi trường vận hành của riêng chúng. Xe (ô tô) tự hành là một ví dụ: xe hơi có thể tự học lái dựa trên mẫu và tín hiệu trên đường và từ những chiếc xe khác, nhưng các biến số bên ngoài khác như thời tiết, hành vi của người đi bộ và người chạy xe đạp, ô tô đậu lấn chỗ, công trường xây dựng... sẽ làm rối chuyện tự học của máy.
Liệu có thể vượt qua tất cả những khó khăn trên? Có, nhưng không phải ở tốc độ nhanh như các tay viết blog suy nghĩ.
Phân tích dự báo đi sau máy học
Trong nhiều năm, ngành CNTT đã tồn tại khái niệm phân tích dự báo (predictive analytics), mà có các tên khác như BI vận hành (operational business intelligence). Đây là một khái niệm tuyệt vời, nhưng đòi hỏi phải có việc so khớp mẫu (pattern matching), máy học (machine learning) và hệ thống thu thập - phân tích thông tin theo chiều sâu (insight). Chính chiều sâu thông tin cho phép con người đi những bước nhảy vọt, về mặt tư duy, vào lĩnh vực mới.
Phân tích dự báo không đi đâu quá xa, mà chủ yếu xác định và chấp nhận mẫu và kết quả khác thường. Chuyện này thật khó khăn, bởi trí tuệ dựa trên mẫu hay quy luật - từ hiển thị kết quả tìm kiếm, đến chọn đường cho xe chạy, đến chọn nước cờ - dựa trên giả định rằng phần lớn các mẫu và đường đi là những lựa chọn tốt nhất. Nếu không, mọi người sẽ không sử dụng chúng nhiều như vậy.
Đa số hệ thống trợ giúp dựa vào các điều kiện hiện tại để lái bạn vào một con đường đã được chứng minh. Các hệ thống dự báo kết hợp các điều kiện hiện tại và tương lai bằng cách sử dụng tất cả loại toán xác suất. Nhưng đó là những trường hợp dự báo dễ dàng.
Những dự báo thực sự quan trọng lại là những tình huống khó nhìn ra, bởi một số lý do: bối cảnh là quá phức tạp, hoặc đường đi đúng lại là một trường hợp hiếm thấy và do đó bị loại, bởi thuật toán hay người dùng.
Như bạn thấy, có rất nhiều việc cần làm, vì vậy hãy tỉnh táo khi đọc về những công nghệ bùng nổ trên báo chí hay hội thảo I/O của Google. Tương lai sẽ đến, nhưng sẽ đến chậm và có chỗ hay, chỗ dở.
Galen Gruman
Tổng Biên tập Tạp chí Infoworld Mỹ

Sunday, June 5, 2016

Elon Musk: “AI của Google rất nguy hiểm. Sức mạnh này không nên nằm trong tay một cá nhân”

Tỷ phú Elon Musk cho rằng chỉ có một công ty duy nhất đáng lo sợ khi trong tay họ đang sở hữu công nghệ trí tuệ nhân tạo, đó chính là Google.

Bên cạnh những câu trả lời về SpaceX và Tesla, 2 công ty mà Elon Musk đang làm CEO, vị tỷ phú này tiếp tục chia sẽ nhiều điều thú vị về trí tuệ nhân tạo và công ty OpenAI mà ông đang đầu tư.
Khi hai người dẫn chương trình hỏi về việc trí tuệ nhân tạo sẽ chiếm quyền kiểm soát thế giới và đe dọa làm hại toàn bộ nhân loại, Elon Musk chia sẻ: “Tôi lo ngại một chiều hướng nhất định mà AI hoàn toàn có thể trở nên không tốt trong tương lai. Không phải tất cả AI là ‘lành tính’. Nếu như chúng ta tạo ra những trí tuệ nhân tạo siêu việt, thông minh hơn con người gấp nhiều lần, chúng ta không thể đảm bảo rằng nó sẽ nằm trong tầm kiểm soát”.
Chính vì vậy mà một công ty phi lợi nhuận như OpenAI được thành lập. Mà theo chia sẻ của Elon Musk, mục đích của OpenAI là khiến cho công nghệ này trở nên dân chủ.
“Sức mạnh của AI không nên tập trung trong tay của một cá nhân nào cả. Công nghệ này được gọi là điểm kỳ dị, bởi rất khó có thể dự đoán nó sẽ tiến tới đâu. Không ai muốn sống dưới một kẻ bạo chúa với sức mạnh lớn như vậy trong tay”, Elon Musk cho biết.
Cách trả lời của vị tỷ phú này về mối đe dọa của AI thực sự nghiêm túc, hoàn toàn khác với cách trả lời hóm hỉnh lúc đầu của ông trong cuộc thảo luận này. Cho thấy rằng ông thực sự lo ngại mối đe dọa này có thể trở thành hiện thực.
Người dẫn chương trình tiếp tục hỏi: “Ông có lo lắng về bất kỳ công ty nào tại Thung lũng Silicon đang phát triển công nghệ AI?”.
Elon Musk trả lời: “Tôi sẽ không đề cập đến tên của họ, nhưng có một công ty như vậy”.
Sau đó, người dẫn chường trình tiếp tục gợi ý: "Và họ không có một chiếc ô tô để có thể cạnh tranh được với bạn?". Với ý ám chỉ tới Google, bởi trước đó Elon Musk đã từng nói rằng Google không phải đối thủ cạnh tranh của Tesla.
Elon Musk đã dừng lại một khoảng thời gian dài và sau đó nhắc lại rằng: "Chỉ có một mối lo ngại". Có lẽ ông ám chỉ rằng chính công nghệ AI của Google là thứ nguy hiểm nhất. Trong khi đó họ không hề biết cách kiểm soát thứ công nghệ mà họ đang nắm trong tay, thay vì thế họ để mặc cho nó phát triển.
Mục đích của OpenAI sẽ đúng như cái tên của nó, đó là kêu gọi các công ty chia sẻ mã nguồn mở công nghệ trí tuệ nhân tạo của họ. Để tất cả mọi người có thể sở hữu sức mạnh này và vì thế không một ai có được sức mạnh vượt trội hơn những người khác.
Giống như việc tất cả mọi người đều trở thành siêu nhân, thì sẽ không có ai là siêu nhân nữa. Tuy nhiên người dẫn chương trình Walt Mossberg cũng lo ngại rằng khi bất kỳ ai cũng có thể sử dụng công nghệ AI, những kẻ xấu có thể lợi dụng nó để tấn công những người khác.
Tuy nhiên, Elon Musk cho rằng khi tất cả mọi người đều sở hữu được công nghệ này, họ có thể dễ dàng đánh bại những kẻ xấu bằng chính thứ sức mạnh đó.
Tham khảo: Recode

Amazon tung “vũ khí mới” để đấu lại Google trong cuộc chiến đám mây

Sau nhiều năm bỏ bê, Amazon đã nhảy vào phát triển dịch vụ đám mây dành cho trí tuệ nhân tạo (AI).
Amazon đang thử nghiệm một dịch vụ mới nhằm giúp các doanh nghiệp chạy phần mềm AI trên hệ thống điện toán đám mây công ty này hiệu quả hơn. Đây là động thái gia tăng sức cạnh tranh của Amazon trước các đối thủ sừng sỏ trong lĩnh vực đám mây như Google, Microsoft và IBM.
AWS mới cho phép các doanh nghiệp vận hành nhiều chương trình AI hơn trên máy tính của Amazon. Dịch vụ này sẽ giúp thực hiện các nhiệm vụ phức tạp hơn như nhận diện cấu trúc và chuyển đổi giọng nói sang văn bản.
Đây là phân khúc hiếm hoi mà Amazon đang tụt hậu so với các gã khổng lồ công nghệ khác trong lĩnh vực điện toán đám mây, nơi Amazon đã duy trì vị thế thống trị trong nhiều năm. Vào tháng 3 năm nay, Google đã cho ra mắt một loạt dịch vụ đám mây dành cho chương trình AI máy học. IBM, Microsoft và các start-up như Clarifai và MetaMind cũng đã phát triển các dịch vụ tương tự. MetaMind đã được Salesforce mua lại vào tháng 4 năm nay.
Phát ngôn viên của Amazon cho biết công ty này đang tập trung phát triển các dịch vụ đám mây dành cho máy học. Máy học là một chương trình AI được các nhà phát triển dùng để tạo ra và vận hành các mạng nơ-ron. Đây là một dạng AI có tính năng mạnh và ngày càng phổ biến, giúp máy tính xử lý dữ liệu theo cách não bộ con người hoạt động.
Dịch vụ mới của Amazon sẽ giúp các doanh nghiệp vận hành nhiều nền tảng khác nhau trên hệ thống đám mây của mình, bao gồm cả những nền tảng được tạo ra bởi các đối thủ như Google. Năm ngoái, Google đã ra mắt một nền tảng gọi là TensorFlow.
Amazon sẽ sử dụng một loại máy tính mới, chứa 8 bộ xử lý đồ họa (GPU) của Nvidia cho dịch vụ trên, tăng so với 4 GPU của hiện tại. GPU là một loại chip phổ biến được dùng để chạy các chương trình AI. Càng có nhiều GPU, máy tính của Amazon có thể chạy phần mềm AI và xử lý dữ liệu liên quan càng nhanh.
Tuy nhiên, số GPU được tích hợp trong một máy tính của Amazon sẽ không dừng lại ở con số 8. Năm ngoái, các nhà nghiên cứu của Amazon đã thử nghiệm vận hành chương trình máy học trên 80 máy tính cùng một lúc.
Tham khảo: bloomberg

Apple đang phát triển hệ thống AI thông minh hơn tất cả mọi đối thủ

Siri sắp sửa nhận được một bản cập nhật lớn.
Apple đang có trong tay một công nghệ có thể nâng trợ lý ảo của hãng lên một tầm cao mới. Công nghệ này được phát triển bởi VocalIQ, công ty Anh Quốc Apple mua lại hồi năm ngoái.
Theo một nguồn tin quen thuộc với sản phẩm của VocalIQ, sản phẩm của hãng mạnh mẽ và có khả năng cao hơn rất nhiều so với các đối thủ cạnh tranh lớn nhất của Siri gồm Google Now của Google, Alexa của Amazon và Cortana của Microsoft.
Apple rất nhanh tay khi mua VocalIQ trước khi hãng này có thể hoàn thiện và phát hành ứng dụng cho smartphone. Sau khi mua lại, Apple giữ lại hầu hết các thành viên của nhóm VocalIQ và để họ làm việc tại văn phòng của họ ở Cambridge. Sản phẩm của VocalIQ sẽ được tích hợp vào Siri.
Trước khi được Apple mua lại, VocalIQ đã thử nghiệm sản phẩm của mình so với Siri, Google Now và Cortana và kết quả thu được khá ấn tượng. Sản phẩm của VocalIQ có thể trả lời các câu hỏi dài và phức tạp bằng ngôn ngữ tự nhiên trong khi các trợ lý ảo khác không thể.
Ví dụ, khi được hỏi "Tìm một nhà hàng Trung Quốc phù hợp với trẻ em, có bãi đỗ xe và WiFi?", hầu hết các trợ lý ảo khác không thể trả lời nhưng VocalIQ lại xử lý trơn tru. Tỷ lệ thành công của VocalIQ là 90% trong khi Google Now, Siri và Cortana chỉ đạt tỷ lệ 20% theo thời gian.
VocalIQ hoạt động như thế nào?
Sau khi viết chương trình, VocalIQ thuê các nhà thầu thông qua Mechanical Turk của Amazon để "nuôi dưỡng" chương trình bằng các câu hỏi bình thường mà con người thường dùng và giúp chương trình hiểu cách con người nói chuyện. Các nhà thầu sẽ đặt câu hỏi cho VocalIQ từ một danh sách hướng dẫn nhằm đào tạo chương trình.
Sau khoảng 3.000 đối thoại, độ chính xác của VocalIQ tăng lên rất nhiều. Khi quá trình kết thúc, VocalIQ đã thực hiện khoảng 10.000 cuộc đối thoại với các nhà thầu Mechanical Tuk.
Mỗi tuần Siri thực hiện khoảng 1 tỷ truy vấn cho người dùng và điều này khiến nó ngày càng trở nên tốt hơn. Tuy nhiên, VocalIQ chỉ cần học từ vài ngày truy vấn đã có thể đánh bại Siri.
VocalIQ có vẻ giống với Hound, một trở lý ảo mới cho Android và iOS, nhưng Hound chỉ hoạt động một phiên trong một thời điểm. Trong khi đó, VocalIQ nhớ các bối cảnh mãi mãi giống như con người. Đây là một bước đột phá lớn.
Trở lại với ví dụ nhà hàng Trung Quốc ở trên. Điều gì sẽ xảy ra nếu một tiếng sau bạn đổi ý? Đơn giản. Bạn chỉ cần nói một câu như "Tìm cho tôi một nhà hàng Mexico thay thế". VocalIQ sẽ gửi cho bạn kết quả mới trong khi vẫn giữ nguyên các thông số khác như bãi đỗ se và WiFi mà bạn đã yêu cầu trước đó. Hound, Siri và bất kỳ trợ lý ảo nào khác sẽ bắt đầu một phiên tìm kiếm mới. Nhưng VocalIQ thì ghi nhớ những gì bạn đã từng yêu cầu. Nó giống con người hơn tất cả những trợ lý ảo khác hiện tại.
Vì VocalIQ hiểu bối cảnh rất tốt nên bạn không cần nhìn vào màn hình để xem liệu nó có thực hiện đúng những gì bạn muốn hay không. Nó hữu ích trên smartphone nhưng còn tốt hơn cho các dự án đầy tham vọng khác của Apple như xe hơi hoặc hệ thống loa thông minh mà Apple có thể đang xây dựng.
Trong thực tế, VocalIQ chỉ có thể được coi là thành công khi người dùng có thể hoàn thành nhiệm vụ mà không cần nhìn vào màn hình. Siri, Google Now và Cortana thường xuyên yêu cầu người dùng nhấp vào màn hình để xác nhận nhiệm vụ.
Nó hoạt động giống một trợ lý thực sự chứ không chỉ là ứng dụng tìm kiếm bằng giọng nói
Nền tảng của VocalIQ còn được lập trình cho bất cứ điều gì bạn muốn làm. Ví dụ, nó được lập trình để có thể quản lý email trong khi smartphone vẫn nằm trong túi người dùng. Trên lý thuyết, Apple hoàn toàn có thể dạy cho Siri làm bất cứ điều gì dưới sự hỗ trợ của VocalIQ.
VocalIQ còn có thể loại bỏ tiếng ồn để nghe chính xác những gì bạn đang nói nhờ vậy nó chính xác hơn so với Siri hiện tại. Nó có thể loại bỏ gần như toàn bộ tiếng ồn như âm thanh TV, tiếng trẻ em la hét hoặc bất cứ âm thanh nào khác để nghe chính xác truy vấn của người dùng. Nó thậm chí còn học được cách thích ứng với các dấu câu khác nhau theo thời gian để cải thiện độ chính xác. Nếu bạn đã từng gặp rắc rối với Siri bạn sẽ hiểu những khả năng của VocalIQ quan trọng như thế nào.
Chưa rõ khi nào Apple sẽ tích hợp những khả năng của VocalIQ vào Siri. Một nguồn tin uy tín cho biết Apple sẽ làm điều này từ từ chứ không cập nhật ngay, một cách triệt để. Tuy nhiên, có vẻ như Apple đang muốn thay đổi hoàn toàn cách làm việc của Siri.
Apple từ chối bình luận.
Trong khi đó, có khả năng trong năm nay Siri sẽ nhận được một số cải tiến khác. Theo The Information, Apple sẽ mở cửa Siri cho các nhà phát triển, tương tự cách mà Amazon làm với trợ lý ảo Alexa của hãng. Điều này có nghĩa là các ứng dụng của bên thứ ba sẽ cho phép bạn sử dụng lệnh giọng nói để thực hiện các tác vụ ví dụ như gọi xe Uber.
Gần đây, xuất hiện nhiều nghi ngờ xung quanh các nỗ lực phát triển trí tuệ nhân tạo của Apple. Trong hội nghị thường niên vừa diễn ra của mình, Google đã trình làng một số cách sử dụng mới, hấp dẫn cho AI của hãng bao gồm Google Home, một loa thông minh với trợ lý ảo tích hợp bên trong.
Marco Arment, một nhà phát triển nổi tiếng và có ảnh hưởng lớn trong cộng đồng công nghệ, đã viết trên blog cá nhân của ông ằng nếu Apple không bắt kịp công nghệ AI và các nền tảng ra lệnh bằng giọng nói hãng này có thể chịu số phận tương tự BlackBerry.
Đương nhiên là Apple không thể ngồi yên trong khi các đối thủ của mình đặt cược tất cả vào AI.
Tham khảo BI

Công ty này đang dạy cho AI cách tưởng tượng, nhờ đó chúng có thể làm được những điều phi thường

Trong khi AlphaGo của Google chỉ biết đánh cờ thì AI của công ty này còn có thể giúp chữa trị cho bệnh nhân Ebola hay dọn sạch rác thải hạt nhân, nếu thành công.

Cuộc sống sẽ thật buồn tẻ nếu không có sự tưởng tượng. Trên thực tế, đó lại là vấn đề lớn nhất của máy tính, chúng hoàn toàn không có.
Đó cũng là niềm tin thúc đẩy các nhà sáng lập của Vicarious, một công ty AI bí ẩn được hỗ trợ bởi một số cái tên nổi tiếng nhất và thành công nhất thung lũng Silicon. Vicarious đang phát triển một cách mới để xử lý dữ liệu, lấy cảm hứng từ cách thông tin chảy qua bộ não người. Các lãnh đạo của công ty cho biết điều này sẽ giúp máy tính giống như có khả năng tưởng tượng, điều họ hy vọng sẽ giúp các cỗ máy trở nên thông minh hơn.
Vicarious - startup bí ẩn khuất phục các mạng lưới thần kinh
Về cơ bản, Vicarious đang đặt cược vào việc chống lại sự bùng nổ AI hiện nay. Các công ty bao gồm Google, Facebook, Amazon và Microsoft đang có được những tiến bộ đáng kể trong vài năm gần đây bằng cách nạp vô số dữ liệu vào các mạng lưới thần kinh khổng lồ trong quá trình được gọi là “học sâu.”
Ví dụ, khi được đào tạo đủ các mẫu, hệ thống học sâu có thể học để nhận ra một khuôn mặt cụ thể hay một loại động vật nào đó với độ chính xác cao. Nhưng các mạng lưới thần kinh đó vẫn chỉ rất thô sơ nếu so với những gì bên trong một bộ não thực sự.
Vicarious đã giới thiệu một loại thuật toán mạng thần kinh mới, được thiết kế để đưa vào nhiều tính năng vốn xuất hiện trong sinh vật hơn. Một tính năng quan trọng là khả năng hình dung những thông tin mà nó đã học được sẽ như thế nào trong các bối cảnh khác nhau – một dạng của óc tưởng tượng nhân tạo.
Các nhà sáng lập công ty tin rằng một thiết kế khác biệt cơ bản như vậy sẽ rất quan trọng để máy móc đến gần hơn với trí tuệ con người. Các máy tính sẽ chỉ phải học ít dữ liệu hơn, nhưng sẽ nhận ra các kích thích hay các khái niệm dễ dàng hơn.
Cho dù tạo ra nhiều sự phần khích, nhưng Vicarious vẫn im hơi lặng tiếng trong vài năm qua. Nhưng trong năm nay, công ty cho biết họ sẽ công bố chi tiết về nghiên cứu của mình, và nó hứa hẹn về một màn trình diễn bắt mắt, để cho thấy một máy tính với trí tưởng tượng sẽ hữu ích như thế nào.
Những nhược điểm của mạng lưới thần kinh
Trong khi đó, trụ sở chính của công ty không giống như đang ở tâm điểm của một cuộc cách mạng về trí tuệ nhân tạo. Nằm gần Vịnh San Francisco, mặt trước văn phòng đơn điệu với một bảng hiệu của McDonald và một vài tầng dành của một nha sĩ. Dù vậy, bên trong lại là nơi làm việc của một startup công nghệ cao đầy sức sống.

Nhà sáng lập và CEO của Vicarious, Scott Phoenix.
Nhà sáng lập và CEO của Vicarious, Scott Phoenix.
Vị CEO 33 tuổi của công ty, tiến sĩ Scott Phoenix, nói với lời lẽ khoa trương vừa phải cho biết. “Chúng tôi đang tiếp cận nhanh chóng với một năng lực tính toán rất lớn mà chúng tôi cần để làm một số điều thú vị trong AI.” Anh sớm nói với phóng viên sau khi bước qua cánh cửa. “Trong 15 năm tới, chiếc máy tính nhanh nhất sẽ làm được nhiều phép tính mỗi giây hơn toàn bộ số tế bào thần kinh trong tất cả bộ não của những người còn sống. Và chúng tôi đang rất gần với điểm đó.”
Dù vậy, Vicarious còn làm nhiều hơn là chỉ khai thác sức mạnh điện toán. Ông Phoenix cho biết, khả năng sáng tạo toán học của nó sẽ đáng tin hơn việc bắt chước cách xử lý thông tin được thấy ở trong bộ não người. Điều này là sự thật khi mối quan hệ giữa các mạng lưới thần kinh được sử dụng trong AI hiện tại và các tế bào thần kinh, các tế bào tua, các khớp thần kinh trong một bộ não thật sự là rất mong manh.
Ông Phoenix cho rằng, một trong những thiếu sót rõ ràng nhất của mạng lưới thần kinh nhân tạo, là thông tin chỉ chạy theo một chiều. “Nếu bạn nhìn vào một luồng thông tin trong mạng lưới thần kinh cổ điển, nó là một kiến trúc truyền thẳng (feed-forward).” Ông nói. “Còn trong bộ não, những kết nối phản hồi còn nhiều hơn kết nối truyền thẳng đó – vì vậy, bạn đang bỏ qua hơn một nửa dòng thông tin.”
Vì vậy, không thể phủ nhận được rằng trí tưởng tượng – một khả năng rất cơ bản của con người nhưng lại bí hiểm với máy tính – có thể là chìa khóa cho bước tiến tiếp theo của AI.
Óc tưởng tượng nhân tạo - chìa khóa cho các bước tiến xa hơn của máy móc
Cho đến nay, Vicarious đã cho thấy rằng cách tiếp cận của mình có thể tạo ra một hệ thống thị giác với khả năng diễn dịch khéo léo một cách đáng ngạc nhiên. Trong năm 2013, nó đã cho thấy rằng hệ thống này có thể vượt qua bất kỳ hình ảnh captcha nào. Như Phoenix đã giải thích, cơ chế phản hồi đặt bên trong hệ thống của Vicarious cho phép nó tưởng tượng ra một nhân vật trông sẽ như thế nào nếu nó không bị bóp méo hay che khuất một phần.

Năm 2013, hệ thống AI của Vicarious đã điền chính xác đến 90% Captcha.
Năm 2013, hệ thống AI của Vicarious đã điền chính xác đến 90% Captcha.
Về nguyên tắc, hệ thống thị giác có thể được sử dụng vào nhiều lĩnh vực khác nhau, như nhận diện các đối tượng trên kệ chính xác hơn hay can thiệp vào các bối cảnh thế giới thực thông minh hơn. Các nhà sáng lập của Vicarious cũng cho biết, cách tiếp cận của họ đang mở rộng sang các lĩnh vực khác phức tạp hơn của trí tuệ, bao gồm ngôn ngữ và suy luận logic.
Phoenix cho biết công ty của anh sẽ đưa ra một bản demo liên quan đến robot vào cuối năm nay. Trên thực tế, danh mục công việc trên website của công ty gồm rất nhiều bài đăng cho vị trí chuyên gia robot. Hiện tại các robot đang kém cỏi trong việc tìm ra các đối tượng không tương tự, cách sắp xếp kỳ quặc hay bị che một phần, bởi vì chúng gặp vấn đề về việc nhận ra những đối tượng đó là gì.
Nếu bạn nhìn vào những người đang chọn ra các món hàng ở nhà kho của Amazon, phần lớn thời gian họ thậm chí còn không phải nhìn xem họ đang làm gì.” Anh giải thích. “Và họ đang tưởng tượng – sử dụng các giác quan mô phỏng của mình – để xem món hàng đó đang ở đâu, và họ tưởng tượng ra điểm nào ngón tay của mình sẽ chạm vào nó.”
Trong khi Phoenix là lãnh đạo công ty, đồng sáng lập của anh, Dileep George có thể coi như người phụ trách kỹ thuật của công ty. Sinh ra ở Ấn Độ và nhận bằng tiến sĩ về kỹ thuật điện tại Đại học Stanford, nơi George hướng sự chú ý của mình đến khoa học thần kinh trong phần cuối nghiên cứu tiến sĩ của mình.
Khá khiêm tốn và ít nói, nhưng anh là người rất thực tế về các mục tiêu vĩ đại của công ty. Geroge giải thích rằng trí tưởng tượng có thể giúp các máy tính xử lý từ ngôn ngữ bằng cách gõ ra các từ ngữ hay biểu tượng, cho đến đại lượng vật lý ở mức độ thấp cho các vật của thế giới thực.
Về lý thuyết, một hệ thống như vậy, sẽ tự động hiểu được các tính chất vật lý của một số thứ như nước, do vậy nó có thể thảo luận tốt hơn về thời tiết. “Khi tôi nói ra một lời, anh sẽ hiểu điều đó nghĩa là gì bởi vì anh có thể mô phỏng các khái niệm.” Anh cho biết.
Các nhà đầu tư - những người mà ai cũng biết là ai đấy
Cho đến nay, tầm nhìn đầy tham vọng về tương lai của AI này đã giúp Vicarious kêu gọi được số vốn ấn tượng, 72 triệu USD. Danh sách các nhà đầu tư của công ty cũng chính là những người mà ai cũng biết là ai đấy của thế giới công nghệ: những người đầu tiên như Dustin Moskovitz, cựu CTO của Facebook, Adam D’Angelo đồng sáng lập của Quora, sau đó là những người như Peter Thiel, Mark Zuckerberg, Jeff Bezos, và Elon Musk. Thậm chí tên diễn viên Ashton Kutcher cũng có trong danh sách các nhà đầu tư.
Nhiều người đang nóng lòng muốn xem những gì Vicarious đã làm được ngoài việc đánh bại captcha. “Tôi sẽ yêu nó nếu họ cho chúng tôi thấy điều gì đó mới trong năm nay.” Ông Oren Etzioni, CEO của Viện trí tuệ nhân tạo Allen ở Seattle, cho biết.

Phát biểu của Dileep George, đồng sáng lập Vicarious, cho thấy tham vọng của startup này.
Phát biểu của Dileep George, đồng sáng lập Vicarious, cho thấy tham vọng của startup này.
Ngược lại với các công ty như Google, Facebook hay Baidu, Vicarious không công bố bất kỳ tài liệu hay ra mắt bất kỳ công cụ nào để nhà nghiên cứu có thể tham gia vào. “Nhiều người tham gia vào thì rất tuyệt, nhưng vấn đề mà họ tạo ra cũng rất lớn,” ông Etzioni cho biết. “Nhưng đã đến lúc để ra mắt.”
Với những người đã đặt tiền của họ vào Vicarious, các mục tiêu đáng chú ý của công ty cũng rất đáng để chờ đợi. Thậm chí ông Matt Ocko, đối tác tại Data Collective, một hãng đầu tư vào Vicarious cho rằng, nếu các tiến bộ phải mất thêm thời gian nữa, phần thưởng tiềm năng của nó vẫn lớn đến nỗi đáng để đặt cược.
Một cách tiếp cận học máy tốt hơn có thể ứng dụng vào bất cứ ngành công nghiệp nào đang phải xử lý hàng núi dữ liệu, ông Ocko cho biết. “Vicarious đã cho chúng tôi xem và trình diễn con đường đáng tin cậy nhất để các cỗ máy biết suy luận mà tôi chưa từng thấy.” Ông Ocko còn bổ sung thêm rằng Vicarious đã trình diễn bằng chứng rõ ràng việc nó có thể thương mại hóa những gì mình làm được.
Sẽ rất thú vị để xem liệu Vicarious có thể mang đến cảm hứng về lối đi riêng của mình cho các nhà nghiên cứu AI và các nhà công nghệ khác hay không. Nếu họ làm được, công ty sẽ nhanh chóng chuyển từ một trong những nơi triển vọng nhất thành một trong các doanh nghiệp tăng trưởng nhanh nhất của thung lũng.
Tham khảo Technologyreview