Highlight

Những điều thú vị khi dùng Trí tuệ nhân tạo của Viettel

Những người dùng Internet tại Việt Nam thường lấy “chị Google” ra để… giải trí. Khi “chị” đọc văn bản hay chỉ đường cho người tham gia gi...

Monday, March 7, 2016

Rankbrain và thuật toán trí tuệ nhân tạo của Google


Thời gian vừa qua, Google đã đưa vào sử dụng hệ thống trí thông minh nhân tạo mang tên RankBrain vào cỗ máy tìm kiếm của mình. Với hệ thống này nó  sẽ giúp phân loại kết quả tìm kiếm của mình. Chúng ta đang tự hỏi liệu công trình này có phù hợp với hệ thống xếp hạng tổng thể của Google? Dưới đây là những gì chúng tôi biết về RankBrain.
slide
RankBrain sử dụng hệ thống ngôn ngữ viết để phiên dịch những thông tin mà người dùng tìm kiếm. Đôi khi, những cụm từ tìm kiếm quá mơ hồ hoặc người dùng sử dụng những tiếng lóng thành ngữ khiến thuật toán tìm kiếm không thể hiểu được. Đấy là lúc RankBrain phát huy khả năng học hỏi người dùng độc đáo của mình. Mặc dù chưa từng nghe hoặc tương tác với những dữ liệu tìm kiếm trước đây, RankBrain có thể trở thành một “sinh viên dự thính” để học hỏi về các thông trong quá khứ được ghi nhận bởi Google. Chính vì thế, hệ thống sẽ ngày càng trở nên hoàn thiện với việc tiếp cận người dùng trong tương lai.
Ờ thời điểm hiện tại, RankBrain đã cho ra những kết quả khả quan sau hơn một năm được nghiên cứu, lập trình bởi đội ngũ kỹ sư Google. Hệ thống này đã được đưa vào bộ công cụ tìm kiếm vào đầu năm 2015 và hiện đang xếp thứ 3 trong số những tín hiệu được sử dụng trong những tìm kiếm trên Google.

RankBrain là gì?
RankBrain là tên của một hệ thống trí thông minh nhân tạo tự học mới giúp đưa ra kết quả tìm kiếm, theo báo của Bloomberg và được xác nhận bởi Google. RankBrain đã không chiếm đoạt ngai vàng của PageRank. Đúng hơn nó là một phần của thuật toán lớn hơn trong việc lấy các truy vấn tìm kiếm, giải thích những gì người dùng đang tìm kiếm và nghĩ ra cách làm thế nào để gửi yêu cầu đó theo những cách mới. RankBrain là tên mà Google đặt cho một hệ thống trí tuệ nhân tạo Machine-learning được sử dụng để giúp Google xử lý kết quả tìm kiếm.
Machine-learning – Học máy: Một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kỹ thuật cho phép các hệ thống “học” tự động từ dữ liệu để giải quyết những vấn đề cụ thể. Ví dụ như các máy có thể “học” cách phân loại thư điện thử xem có phải thư rác (spam) hay không và tự động xếp thư vào mục tương ứng – Wikipedia.
Vậy AI khác Mechine-learning như thế nào? Trong trường hợp này, có vẻ như Google đang sử dụng chúng như những từ đồng nghĩa và được họ sử dụng thay thế cho nhau, hoặc bạn có thể thấy Machine-learning được dùng để mô tả các dạng trí tuệ nhân tạo được sử dụng.
Thế nào là hệ thống máy móc tự học?
Hệ thống máy tự học là khi mà máy tính tự dạy nó cách xử lý vấn đề gì đó chứ không cần phải được con người chỉ dạy chi tiết bằng thuật toán.
Trí thông minh nhân tạo là gì?
Trí thông minh nhân tạo đúng nghĩa, còn gọi là AI, là một máy tính có thể thông minh như con người, ít nhất là trong vấn đề học hỏi kiến thức từ việc được dạy hoặc tự xây dựng kiến thức và liên kết chúng lại.
Tất nhiên, AI thật sự chỉ tồn tại trong các tác phẩm khoa học viễn tương. Trong thực tế, AI được dùng để chỉ hệ thống máy tính thiết kế để tự học và liên kết thông tin.
Vậy RankBrain là cách sắp xếp kết quả tìm kiếm mới?
Không phải. RankBrain chỉ là một phần của tổng hợp nhiều thuật toán, một phần mềm máy tính có thể sắp xếp hàng tỉ trang mà nó biết và tìm những trang có kết quả phù hợp nhất với từ khóa người dùng tìm.
Tên của thuật toán tìm kiếm của Google là gì?
Nó là Hummingbird (chim nhại). Trong nhiều năm, các thuật toán không có tên gọi theo kiểu đàng hoàng. Nhưng vào giữa 2013, Google đã bắt đầu đặt tên cho thuật toán này là Hummingbird.
Vậy RankBrain là một phần của Hummingbird?
Đó là những gì chúng tôi hiểu. Hummingbird là thuật toán tổng của toàn bộ search, cũng giống như chiếc xe với một động cơ tổng thể. Động cơ đó có thể được kết hợp bởi nhiều thành phần, như lọc dầu, nhiên liệu và những thứ khác. Cũng giống vậy, Hummingbird kết hợp nhiều thành phần, RankBrain là một thành phần mới nhất. Cụ thể, chúng tôi biết RankBrain là thành phần của Hummingbird bởi vì trong báo cáo của Bloomberg đã nói rõ RankBrain không kiểm soát toàn bộ search.
Hummingbird cũng chứa những phần khác với các cái tên quen thuộc như Panda, Penguin, Payday để chống lại spam, Pigeon để tăng hiệu quả của local search, Top Heavy chống lại các trang có ad quá nặng, Mobile Friendly để tăng cơ hội xếp hạng cao cho các trang tương thích di động và Pirate để chống lại vấn đề vi phạm bản quyền.
Và nói một cách dễ hiểu, Hummingbird là thuật toán tìm kiếm tổng thể, giống như một chiếc xe có động cơ. Và các bộ phận chính được tạo ra từ nhiều bộ phận khác nhau, chẳng hạn như một bộ lọc dầu, bơm nhiên liệu hay bộ tản nhiệt. Cũng như vậy, Hummingbird gồm các bộ phận khác nhau, và RankBrain là một trong những phần mới nhất của thuật toán này.
Tôi nghĩ thuật toán này mang tên PageRank?
PageRank chỉ là một phần của thuật toán Hummingbird, nó là cách thức chấm điểm các trang dựa vào những đường link trỏ về từ các trang khác. PageRank đặc biệt bỏi nó là thành phần đầu tiên được Google đặt tên, từ năm 1998.
RankBrain? Đó có phải là SkyNet? Hoặc Agent Smith?
Không. RankBrain có nhận thức. Nói RankBrain “học” không có nghĩa là bạn có thể ngồi lại với nó, đưa cho nó những nguyên tắc cơ bản về đại số và đặt nó vào để giải quyết phương trình X.
Thay vào đó, nó được cho ăn bởi số lượng lịch sử tìm kiếm và kết quả của họ và suy ra thông tin này để tiên đoán về tương lai tìm kiếm.
Và RankBrain đã chứng minh rằng nó có thể ghi điểm thật sự xuất sắc.
Kỹ sư tìm kiếm của Google, người đã xây dựng được những thuật toán làm cơ sở cho các phần mềm tìm kiếm và dự đoán những gì chúng sẽ được xếp hạng top đầu, chúng đã làm khá tốt.
Trong thực tế, Google phát hiện ra rằng việc tắt RankBrain “sẽ làm tổn hại cho người dùng” – theo Greg Corrado, nhà nghiên cứu khoa học tại Google cho biết.
Vậy RankBrain sẽ làm gì cho SEO?
Corrado nói rằng RankBrain là “tín hiệu quan trọng thứ 3 góp phần tạo nên kết quả của một truy vấn tìm kiếm”, điều đó là hợp lý để nói rằng nó có thể và có ảnh hưởng đến SEO.
Mặc dù Google đã bắt đầu tung ra RankBrain một vài tháng trước đây, nó đã không có tác dụng tương tự giống như Penguin hay Panda đã làm được.
Còn bây giờ, RankBrain nhỏ như HAL 9000 hoặc Terminator T-800 và lớn hơn Johnny 5 hoặc Wall-E: một người bạn chứ không phải là kẻ thù.
Theo dự đoán của tôi là các tổ chức SEO thông minh sẽ bắt đầu thử nghiệm, đặc biệt là khi nói đến các doanh nghiệp nhỏ và tìm kiếm địa phương để tìm hiểu xem liệu họ có thể kéo lên bức màn về RankBrain và tìm hiểu xem điều gì khiến nó hoạt động – do đó họ sẽ có cơ hội được xếp hạng trong SERPs.
Chính xác thì RankBrain làm gì?
Từ những email với Google, RankBrain được sử dụng chủ yếu để hiểu những gì mà người dùng gõ vào ô tìm kiếm để bắt đầu tìm kiếm trang mà có thể không có chính xác từ khóa họ tìm.
Vậy Google đã từng có thuật toán để đưa ra các trang không có chính xác từ khóa chưa?
Rồi. Google đã tìm kiếm các trang không có chính xác từ khóa trong thời gian dài. Ví dụ, rất nhiều năm trước, nếu bạn gõ vào các từ như “shoe” Google sẽ không tìm thấy trang có từ “shoes”, bởi nó là 2 từ khác nhau. Với sự phát triển của mình, Google đã có sự thông minh với từ đồng nghĩa. Nếu bạn gõ vào “sneakers” thì nó có thể hiểu đó là “running shoes”. Nó còn có thể hiểu được cả ngữ cảnh để phân biệt được trang của Apple về công nghệ và “apple” nói về trái táo.
Vậy còn Knowledge Graph?
Knowledge graph ra mắt năm 2012, nó là các kết nối các từ ngữ thông minh hơn của Google. Quan trọng hơn, nó biết các làm sao để tìm kiếm các dữ liệu cho chuỗi từ khóa, như Google đã nói.
Chuỗi nghĩa chuỗi các chữ cái. Còn dữ liệu là khi người dùng tìm “Obama”, Google sẽ hiểu là “US President Barank Obama”, một người có kết nối với những người khác, địa điểm và sự kiện khác.
Knowledge Graph là một kho dữ liệu về vấn đề trên thế giới và sự liên kết giữa chúng. Đó là lý do tại sao bạn có thể tìm kiếm “vợ obama ra đời khi nào?” và có được kết quả của Michele Obama, mà không tìm kiếm tên của bà ấy
when_was_the_wife_of_obama_born_-_Google_Search-800x573
Khi nào RankBrain bắt đầu?
Google nói rằng nó đã được triển khai từ từ đầu năm 2015 và đã cập nhật hoàn toàn vài tháng trở lại đây
Những từ khóa nào bị ảnh hưởng?
Google nói với Bloomberg rằng có rất nhiều từ khóa bị ảnh hưởng bởi RankBrain. Chúng tôi hỏi thêm thông tin cụ thể nhưng họ không nói rõ ràng.
Có phải RankBrain lúc nào cũng học hỏi?
Việc học của RankBrain luôn tiến hành offline, Google đã nói vậy. Nó đưa ra danh sách các tìm kiếm và học hỏi để đưa ra dự đoán từ chúng. Những dự đoán này được kiểm tra và chứng minh rằng nó tốt, bởi vậy RankBrain đã được cập nhật hoàn toàn. Sau đó quy trình học hỏi offline và kiểm tra được lặp đi lặp lại.

No comments:

Post a Comment