Mở cửa cho chatbot bên ngoài trên Skype, bỏ
hàng núi tiền mua lại Linkedin, những tính năng mới trên Office, tất cả
đều xoay quanh canh bạc cho chiến lược mới của Microsoft.
Các ứng dụng trên di động đang trở thành phương tiện kết nối người
dùng với thế giới số, và cũng như cây cần có đất, các ứng dụng cũng cần
một nền tảng để phát triển.
Dù Microsoft chưa từng công khai thừa nhận điều này, nhưng có thể
thấy trên mặt trận nền tảng di động, hãng công nghệ khổng lồ này đã là
người thua cuộc trước iOS và Android. Thiết bị với phần cứng tốt nhưng
lại đi kèm hệ điều hành non trẻ Windows Phone đã thất bại trong việc thu
hút các nhà phát triển tạo ra những ứng dụng xuất sắc cho nền tảng này.
Nhưng câu hỏi lúc này cho Microsoft không còn là làm thế nào để bắt
kịp hai đối thủ trên, mà là câu hỏi trận chiến tiếp theo sẽ diễn ra ở
đâu? Với Microsoft, họ đang đánh cược rằng những giao diện dựa trên nền
tảng trò chuyện – hay các chatbot, sẽ vượt qua các ứng dụng để trở thành
cách thức chính cho việc tìm kiếm thông tin trên Internet, cho mua sắm
và truy cập hàng loạt dịch vụ khác.
Điều gì mang lại niềm tin cho Microsoft để đặt cược vào chatbot này?
Một trong những yếu tố giúp mang lại sự lạc quan cho Microsoft đó là
Xiaoice, trợ lý ảo mà Microsoft phát triển cho WeChat, ứng dụng tin nhắn
phổ biến ở Trung Quốc. Giống như Cortana, Xiaoice có thể trả lời một số
câu hỏi đơn giản khi trò chuyện với người dùng. Chatbot này có thể biểu
lộ cảm xúc, ghi nhớ các đoạn chat. Bạn vượt qua được một cuộc chia tay,
Xiaoice còn có thể hỏi xem bạn làm như thế nào.
Chỉ sau ba ngày xuất hiện, Xiaoice đã được thêm vào 1,5 triệu cuộc
hội thoại trên WeChat. Thậm chí nó còn có tài khoản trên dịch vụ blog
Weibo của Trung Quốc và là một trong những tài khoản được theo dõi nhiều
nhất. Hiện nay chatbot này đã được sử dụng bởi hơn 40 triệu người, và
trung bình các cuộc hội thoại với người dùng kéo dài hơn 26 lượt trao
đổi, một con số ấn tượng.
Microsoft Xiaoice, chatbot bằng tiếng Trung Quốc.
Nhưng thành công của Xiaoice ở Trung Quốc không có nghĩa họ sẽ thành
công ở Mỹ. Cho đến nay vẫn chưa có chatbot nào bằng tiếng Anh mang lại
kết quả tương đương như vậy. Nhưng Microsoft tin rằng, bước khởi đầu với
Xiaoice cho thấy một tiềm năng đáng kể đối với họ.
Nhưng Microsoft không phải người duy nhất nỗ lực theo đuổi tiềm năng
này. Facebook có chatbot riêng của họ trên nền Messenger. Google vừa
giới thiệu trợ lý ảo thông minh bên trong Allo, ứng dụng trò chuyện mới
của họ và Home, đối thủ cạnh tranh với Echo của Amazon. Trong khi đó
Echo, chiếc loa thông minh như một trợ lý ảo tương tác bằng giọng nói,
cho biết nó đã xuất hiện trong 3 triệu gia đình, và bổ sung thêm 1.200
kỹ năng khác nhau thông qua các API của nó.
Với Microsoft, sau thành công vang dội với hệ điều hành Windows từ
những năm 90 cho đến nay, dù là người đi đầu trong rất nhiều công nghệ, ý
tưởng đột phá mới, nhưng cuối cùng họ thường chấp nhận nhìn các đối thủ
của mình vươn lên với những công nghệ, ý tưởng đó. Vậy lần này, niềm
tin mạnh mẽ của họ có gì khác biệt so với lịch sử?
Đó là vì chatbot của Microsoft dựa trên một tài sản độc đáo của họ,
một bộ não nhân tạo được tạo ra dựa trên những tiến bộ về máy học và bộ
xử lý ngôn ngữ tự nhiên trong hai thập kỷ qua. Và quan trọng hơn cả, tài
sản đó - trí tuệ nhân tạo đó - nằm trong một chiến lược tổng thể của
Microsoft.
Chiến lược của Microsoft
Qi Lu, một trong những trưởng nhóm cấp cao của Microsoft đang chịu
trách nhiệm giám sát các nhóm về ứng dụng và dịch vụ cho công ty. Hơn ai
hết, ông hiểu rõ những hạn chế của làn sóng Internet trên di động.
Những trải nghiệm tồi tệ trên di động làm lưu lượng truy cập web trên di
động chưa bao giờ vượt qua được lưu lượng web trên desktop. Trong khi
đó các ứng dụng, dù nổi lên như một giao diện thay thế cho trình duyệt
web trên di động, giờ đang chững lại khi người dùng ngày càng chán nản
việc phải tải và cài đặt chúng chỉ để có được một vài thông tin từ
Internet.
Nhưng nhờ các tiến bộ của kỹ thuật xử lý ngôn ngữ tự nhiên, giờ người dùng có thể “
nói” với thiết bị của mình để lấy những gì mình muốn từ Internet. Đó là lý do vì sao ông Lu cho biết, “
nền tảng trải nghiệm”
thế hệ tiếp theo sẽ bắt đầu từ đây, từ những cuộc hội thoại. Và đó cũng
là tiền đề cho chiến lược của Microsoft để giành chiến thắng trong canh
bạc lịch sử này.
Theo ông Lu, công ty cần 5 “
tài sản quyết định.” Đầu tiên, là một “
nền tảng hội thoại”
– một nơi người dùng làm nhiều điều với khả năng nói chuyện và nhắn
tin. Còn Microsoft đang có sẵn Office, Outlook, Skype và Cortana. Thứ
hai là một bộ não AI – lĩnh vực mà Microsoft đã có gần 20 năm nghiên
cứu.
Thứ ba là quyền truy cập vào một mạng xã hội do hoạt động của mọi
người trên Internet thường liên quan đến bạn bè và đồng nghiệp của họ.
Không ngạc nhiên khi mới đây Microsoft thông báo họ sẽ chi ra 26,2 tỷ
USD để thâu tóm Linkedin – mạng xã hội nghề nghiệp với 433 triệu thành
viên đã đăng ký.
Mảnh ghép thứ tư cho chiến lược của Microsoft là một nền tảng phần
cứng để trí tuệ nhân tạo có thể hoạt động trên đó. Microsoft đã có sẵn
Windows và một đại gia đình các thiết bị đang sử dụng hệ điều hành đó,
đáng kể nhất là Xbox. Và cuối cùng là một mạng lưới các nhà phát triển
sẵn sàng xây dựng các ứng dụng trên nền tảng đó và trả tiền cho đặc
quyền đó. Đó cũng là mục tiêu chính của công ty trong Hội nghị nhà phát
triển Microsoft Build vào tháng Ba vừa qua.
Nhưng mỗi tài sản đó của Microsoft đều có một đối thủ khổng lồ không
kém. Facebook đang thống trị về mạng xã hội và nền tảng hội thoại.
Google có một bộ não AI thông minh không kém khi thắng con người trong
các trò chơi phức tạp, ngoài ra họ còn có một nền tảng thiết bị với hàng
trăm triệu chiếc Android trên toàn cầu. Nhưng với tổng thể các tài sản
mình đang có, Microsoft có quyền cảm thấy lạc quan trong canh bạc này.
Những kết quả ban đầu của chiến lược này
Mặc dù chiến lược của Microsoft cần đến 5 “tài sản”
khác nhau, nhưng để tạo nên một nền tảng mang lại trải nghiệm tự nhiên
như hành vi của con người, Microsoft hiểu rằng tài sản quan trọng nhất
là một trí tuệ nhân tạo thực sự thông minh – một bộ não thực sự cho các
tài sản quan trọng còn lại của họ. Nếu nhìn vào những giá trị mà các tài
sản của Microsoft đang cung cấp, người ta sẽ càng thấy bộ não đó quan
trọng đến mức nào.
Hai năm trước, ba tháng sau khi trở thành CEO của Microsoft, ông
Satya Nadella xuất hiện tại buổi khai mạc của Hội nghị Code. Tại đây ông
đã trình diễn một tính năng mới của Skype, khả năng dịch hội thoại theo
thời gian thực. Nó cho phép hai nhân viên của Microsoft, một người nói
tiếng Anh, một người nói tiếng Đức có thể trao đổi với nhau bất chấp các
rào cản về ngôn ngữ.
Dù màn trình diễn rất ấn tượng, nhưng những vấn đề phát sinh khi trao
đổi bằng ngôn ngữ hàng ngày và sự pha tạp ngôn ngữ trong giao tiếp đã
làm bộ dịch của Skype hoạt động không trôi chảy như người bình thường.
Đó là điều làm ông Satya muốn “
tống cả nhóm Skype vào tù vì vấn đề với bộ dịch.” Những vấn đề đó buộc cả nhóm phải thay đổi lại mô hình ngôn ngữ.
Kể từ thất bại đáng nhớ đó cho đến nay, công cụ dịch thông minh của
Microsoft đã tiến một bước dài khi nó có thể dịch các cuộc hội thoại hai
chiều giữa tám ngôn ngữ khác nhau, và nó đã đi xa hơn một công cụ dịch
đơn thuần. Hiện tại Microsoft đang thử nghiệm phiên bản beta của một
phần mềm cho phép ghi lại các cuộc họp và tạo ra phụ đề theo thời gian
thực.
Bên cạnh đó, Microsoft còn đang đưa tài nguyên AI vào trong những tài
sản lớn nhất của họ: hệ điều hành Windows và phần mềm Office. Điều đó
sẽ giúp mang những trải nghiệm thông minh trên thiết bị di động xuất
hiện trên desktop. Dù chỉ là một phiên bản thử nghiệm của Windows, nhưng
với màn trình diễn của Marcus Ash, người giám sát sự phát triển của
Cortana, chúng ta có thể thấy sự tích hợp này sẽ mang lại kết quả nào.
Khi Ash truy cập vào Start Menu, Cortana hiển thị ra một loạt các
hành động gợi ý dựa trên những cái tên ý nghĩa với bạn, các tài liệu sử
dụng gần đây, và gợi ý dịch các từ tiếng Pháp phổ biến. Với sự cho phép
của bạn, Cortana sẽ kết hợp dữ liệu về danh bạ, lịch sử duyệt web và các
ứng dụng vào trong bộ gợi ý của mình.
Với Office việc nhúng AI vào trong đó thậm chí còn nhiều hơn thế.
Tháng Chín năm 2014, Microsoft giới thiệu Delve, một ứng dụng như chiếc
Fitbit để cải thiện năng suất làm việc trong Office 365. Ứng dụng này
phân tích thời gian bạn làm việc với email và các cuộc họp, đánh dấu
thời gian trên lịch những lúc bạn phải làm thêm giờ. Nó còn cho bạn biết
tỷ lệ mọi người mở email của bạn và thực sự đọc nó. Thậm chí nó còn có
thể gợi ý về những đồng nghiệp mà bạn đã không liên lạc trong một thời
gian.
Nếu bạn là một nhà quản lý, chỉ trong nháy mắt, Delve sẽ cho bạn biết
bạn đã dành bao nhiêu thời gian cho mỗi nhân viên trong tuần qua. Đó có
thể không phải một trí thông minh hấp dẫn với khả năng dự đoán trước
mọi nhu cầu của bạn – nhưng nó có thực, và nó rất hiệu quả, nếu so với
các đối thủ của mình như bộ công cụ Google Apps.
Như ông Satya Nadella đã có lần tuyên bố, bất kể tương lai của chúng
ta sẽ như thế nào, Microsoft muốn có một vị trí trong đó. Và Microsoft
tin rằng các ứng dụng thế hệ mới sẽ là cách để họ biến điều đó thành sự
thực. Các ứng dụng có thể hiểu được các khuôn mặt, các biểu cảm và các
thông tin trong ảnh và video. Tất cả các khả năng đó đều dựa trên các “
API nhận thức” – bộ não nhân tạo của Microsoft.
Đó là lý do vì sao họ đang đặt cược lớn vào AI – một canh bạc không chỉ về công nghệ, mà còn về tương lai của thế giới.
Tham khảo The Verge