Highlight

Những điều thú vị khi dùng Trí tuệ nhân tạo của Viettel

Những người dùng Internet tại Việt Nam thường lấy “chị Google” ra để… giải trí. Khi “chị” đọc văn bản hay chỉ đường cho người tham gia gi...

Monday, September 5, 2016

Cô gái Việt phát triển ứng dụng học tiếng Anh sử dụng trí tuệ nhân tạo, được báo Mỹ ca ngợi là ai?

Ít ai biết rằng, để theo đuổi đam mê với giáo dục và công nghệ, Văn Đinh Hồng Vũ từng 2 lần từ bỏ vị trí đáng mơ ước ở các tập đoàn hàng đầu thế giới.

Là gương mặt nổi bật của báo Tuổi Trẻ 10 năm trước, Văn Đinh Hồng Vũ từng chia sẻ mơ ước trở thành đại sứ của Việt Nam. Tham vọng ấy hoàn toàn trong tầm tay của cô sinh viên Ngoại thương đa tài và giỏi 3 ngoại ngữ. Mới ngoài 20 tuổi, Vũ đã tự tin đại diện thanh niên Việt Nam đi qua 10 nước, tham dự hội nghị thượng đỉnh về các vấn đề giáo dục và hướng nghiệp toàn cầu.
Song, những chuyến đi ấy dần thay đổi giấc mơ đại sứ của Vũ bằng khát vọng cải tiến giáo dục. Sau khi tốt nghiệp, cuộc đời cô là hành trình 10 năm lập nghiệp từ Đan Mạch đến Mỹ, qua 2 học bổng Thạc sĩ chuyên ngành Quản trị Kinh doanh và Giáo dục của Ðại học Stanford. Hiện tại, dừng chân ở Thung lũng Silicon, Vũ trở thành nhà xã hội - khởi nghiệp trong ngành giáo dục. Đầu năm 2011, cô lập ra Quỹ Vietseeds, cung cấp học bổng bậc đại học cho học sinh nghèo Việt Nam. Gần đây nhất (năm 2014), Vũ khởi nghiệp cùng ứng dụng nhận diện giọng nói ELSA, giúp người học ngoại ngữ khắp nơi trên thế giới phát âm sát nhất với ngôn ngữ bản xứ.
Và cũng ít ai biết rằng, để theo đuổi đam mê, Văn Đinh Hồng Vũ từng 2 lần từ bỏ vị trí đáng mơ ước ở các tập đoàn hàng đầu thế giới. 3 năm tu nghiệp ở Đan Mạch, Vũ là người châu Á đầu tiên nắm giữ vị trí trợ lý Tổng Giám đốc của Maersk, tập đoàn vận tải và năng lượng có chi nhánh trải khắp 136 quốc gia với 89.000 nhân viên. Sau đó, Vũ lại bỏ ngang vị trí trưởng dự án cấp cao cho Booz & Company, 1 trong 4 tập đoàn tư vấn đứng đầu nước Mỹ. Không chút tiếc nuối, Vũ nói: “Tôi đã thu thập đủ kiến thức quản trị và nhân tài suốt 10 năm qua. Đã đến lúc tôi bắt đầu làm điều mình muốn trong lĩnh vực công nghệ và giáo dục”.
Dạy nói với công nghệ Elsa
ELSA (English Language Speech Assistant) gắn liền với kỷ niệm lần đầu Vũ dự hội thảo sinh viên tại Đức năm 2002. Trước lúc đến, Vũ chẳng mảy may nghi ngờ khả năng tiếng Anh của bản thân. Kỳ lạ thay, không ai ở Ấn Ðộ hiểu cô nói gì. “Ngay đêm đó, tôi đã gặp một người bạn Mỹ báo sẽ rút khỏi buổi thuyết trình sáng hôm sau. Chỉ có mình tôi đại diện Việt Nam, nói không ai hiểu thì thật xấu hổ...”, Vũ nhớ lại.
Nhưng người bạn không cho phép Vũ bỏ cuộc. Anh ngồi cùng cô suốt cả đêm chỉ để đọc đi đọc lại từng câu trên bài thuyết trình, để cô bắt chước cách nhấn nhá và phát âm từng chữ. Vũ có lại sự tự tin, nhưng cô vẫn không ngừng nghĩ về lỗ hổng trong giảng dạy phát âm kể từ đấy.
“Bạn không nhận ra phát âm quan trọng đến nhường nào đâu, cho đến khi sống và làm việc ở nước ngoài”, Vũ giải thích. Gần 10 năm sống xa nhà, cô chứng kiến rất nhiều du học sinh giỏi không thể leo lên vị trí lãnh đạo trong các tập đoàn, chỉ vì cách phát âm không giống người bản xứ. Rắc rối tưởng như rất nhỏ đó lại là cản trở lớn trong ngoại giao và thăng tiến, đặc biệt trong những nghề đòi hỏi kỹ năng giao tiếp cao như tư vấn hay luật sư.

Hồng Vũ tại cuộc thi SXSWedu
Hồng Vũ tại cuộc thi SXSWedu
Thế là từ năm 2013, Vũ mời các chuyên gia dạy nói (Speech Therapist) để xây dựng nội dung cho ELSA. Mỗi giờ dạy của họ trị giá 200 USD với lượng học viên rất giới hạn, còn ứng dụng ELSA (khi hoàn tất) sẽ có giá tối ưu, nên phù hợp với nhiều người ở mọi quốc gia.
“Về phần công nghệ, ELSA được lập trình để mô phỏng cách dạy của các chuyên gia dạy nói hàng đầu nước Mỹ”, Vũ nói thêm. ELSA có đội ngũ kỹ sư và chuyên gia để thiết kế công nghệ nhận diện giọng nói hiện đại nhất ở Mỹ. Nhờ đó, ELSA không chỉ nhận diện chính xác các phát âm sai của người đọc mà còn giúp họ cải thiện từng âm sau khi luyện tập. Ngay sau vài ngày đầu phát động chiến dịch dùng thử sản phẩm, 1.000 người đăng ký dùng thử đã chen kín danh sách và hàng ngàn người đang xếp hàng chờ.
Đầu tư sâu để thay đổi cuộc đời
Trước khi dấn thân khởi nghiệp với ELSA, Văn Đinh Hồng Vũ đã là một nhà hoạt động xã hội rất tích cực. Quỹ Vietseeds của Vũ tuy bắt đầu hoạt động từ năm 2011, nhưng ý tưởng đã xuất hiện từ năm 2008 trên bài luận của cô ở khóa học Thạc sĩ Quản trị Kinh doanh tại Đại học Stanford. Từ những chuyến đi hội thảo trong quá khứ, cô nghiệm ra rằng tiền có thể giúp người một thời gian ngắn, nhưng giáo dục có thể thay đổi đời một người. Vì thế, bài luận ấy là bản kế hoạch chi tiết kết hợp cả đồng tiền và giáo dục vào lĩnh vực từ thiện.
Về cơ bản, Vietseeds quyên tiền để hỗ trợ học sinh nghèo ở Việt Nam vào đại học. Không dừng lại ở việc quyên góp, Vũ nâng mô hình này lên thành vườn ươm lãnh đạo tương lai. “Ngoài suất 1.000 USD/năm cho học hành và ăn ở suốt 4 năm đại học, các em còn được mạnh thường quân và tình nguyện viên tổ chức các khóa huấn luyện thêm kỹ năng mềm như soạn thảo văn bản, làm việc nhóm, ngoại ngữ, định hướng nghề... để các em xóa hết mặc cảm, tự tin đi đầu khi làm việc ở thành phố”, cô cho biết.
Tính đến hiện tại, Vietseeds đã quyên góp một số tiền khá lớn từ 100 nhà tài trợ trong và ngoài nước. Nhưng suất học bổng thì vẫn giữ nguyên giá trị như ngày đầu là 1.000 USD/năm. Vì vậy, năm 2014, chỉ có 100 em được hỗ trợ. Thẳng thắn và kiên quyết, Vũ giải thích: “Đúng là tôi có thể chia 1.000 USD ra cho 5 em thay vì 1 em. Nhưng số tiền bị chia nhỏ đó tuy giúp được nhiều em hơn, nhưng chỉ trong một thời gian ngắn. Tôi nguyện đầu tư sâu để thay đổi hẳn cuộc đời mỗi em”.
Sau 5 năm hoạt động, 10 em đầu tiên tốt nghiệp đại học từ hỗ trợ của Vietseeds đã được nhận vào làm ở các vị trí mơ ước, một em đã hoàn tất học Thạc sĩ tại Mỹ. Toàn bộ số tiền quyên góp được chuyển đến học sinh, còn chi phí vận hành và mở các lớp huấn luyện kỹ năng phần lớn đều đến từ 2 nhà sáng lập là Văn Đinh Hồng Vũ và Vũ Duy Thức, Tiến sĩ ngành Công nghệ Thông tin ở Đại học Stanford.
Từ “Đại sứ” đến “Nhà hoạt động xã hội - khởi nghiệp” thoạt nhìn như 2 con đường khác hẳn nhau. Nhưng với Vũ, cả 2 đều thuộc một hành trình liền mạch. “Ngày trước và bây giờ tôi đều muốn làm một điều gì đó cho quê nhà. Để góp nhiều hơn một tiếng nói thời trẻ, tôi mới chuyển sang làm kinh tế và xã hội trong giáo dục. Bằng cách này, tôi sẽ đóng góp vào giáo dục nhiều giá trị thực tiễn hơn”, cô nói.
Theo Nhịp Cầu Đầu Tư

Trí tuệ nhân tạo tiếp tục đánh bại các bác sĩ trong việc chẩn đoán ung thư phổi

Các nhà nghiên cứu của Đại học Stanford tuyên bố rằng trí tuệ nhân tạo mới do họ phát triển có khả năng nhìn hình ảnh để chẩn đoán ung thư phổi chính xác hơn cả bác sĩ chuyên khoa. Nghiên cứu này có thể tạo ra một cuộc cách mạng trong ngành y tế.

Hệ thống trí tuệ nhân tạo này được đào tạo trên 2.000 hình ảnh và đã xác định hơn 10.000 điểm khác biệt riêng để kết hợp để tạo ra một chẩn đoán chính xác. Các bác sĩ tốt nhất thường chỉ có thể kết hợp vài trăm điểm khác biệt. Các điểm khác biệt mà AI có thể xác định không chỉ bao gồm kích thước và hình dạng tế bào mà còn bao gồm hình dạng và kết cấu của các hạt nhân tế bào và các mối quan hệ giữa các tế bào khối u bên cạnh.

Các khác biệt rất nhỏ cũng được AI phát hiện ra
Các khác biệt rất nhỏ cũng được AI phát hiện ra
Nhờ trí tuệ nhân tạo này, chúng ta có thể chẩn đoán ung thư phổi tốt hơn, nhanh hơn, loại bỏ các vấn đề có thể xảy ra do yếu tố chủ quan trong chẩn đoán các căn bệnh. Thậm chí AI này còn có thể chẩn đoán chính xác hơn số ngày còn lại của bệnh nhân.
Mặc dù nghiên cứu này chỉ tập trung vào ung thư phổi nhưng các nhà nghiên cứu tin rằng phương pháp tiếp cận tương tự có thể được áp dụng cho nhiều loại ung thư khác. "Kỹ thuật này cho chúng ta góc nhìn sâu hơn vào các cơ chế phân tử của bệnh ung thư bằng cách kết nối các tính năng bệnh lý quan trọng với các dữ liệu kết quả", Snyder, giám đốc Stanford Center for Genomics and Personalized Medicine, chia sẻ.
Từ lâu đã có những nghiên cứu cho thấy máy tính tốt hơn con người trong việc tìm kiếm những mối tương quan cơ bản và một bác sĩ robot bác sĩ luôn phục vụ tốt hơn, lắng nghe những vấn đề của bạn tốt hơn mà không phàn nàn gì. Nhưng robot bác sĩ robot luôn tệ trong việc giải thích những kết quả xét nghiệm.
Có lẽ không lâu nữa robot với trí tuệ nhân tạo có thể thích ứng với bất kỳ thách thức nào một cách linh hoạt. Trong tương lai trí tuệ nhân tạo sẽ không chỉ ảnh hưởng tới y học mà còn tới các lĩnh vực khác.

Giải ngố về deep learning, công nghệ đang giúp cho trí tuệ nhân tạo sánh được với con người

Chỉ trong vài năm, deep learning đã thúc đẩy tiến bộ trong đa dạng các lĩnh vực như nhận thức sự vật, dịch tự động, nhận diện giọng nói,… - những vấn đề từng rất khó khăn với các nhà nghiên cứu trí tuệ nhân tạo.

Deep learning là gì?
Deep learning đã và đang là một chủ đề AI được bàn luận sôi nổi. Là một phạm trù nhỏ của machine learning, deep learning tập trung giải quyết các vấn đề liên quan đến mạng thần kinh nhân tạo nhằm nâng cấp các công nghệ như nhận diện giọng nói, tầm nhìn máy tính và xử lý ngôn ngữ tự nhiên. Deep learning đang trở thành một trong những lĩnh vực hot nhất trong khoa học máy tính. Chỉ trong vài năm, deep learning đã thúc đẩy tiến bộ trong đa dạng các lĩnh vực như nhận thức sự vật (object perception), dịch tự động (machine translation), nhận diện giọng nói,… - những vấn đề từng rất khó khăn với các nhà nghiên cứu trí tuệ nhân tạo.
Để hiểu hơn về deep learning, hãy nhìn lại một số khái niệm cơ bản về trí tuệ nhân tạo.
Trí tuệ nhân tạo có thể được hiểu đơn giản là được cấu thành từ các lớp xếp chồng lên nhau, trong đó mạng thần kinh nhân tạo nằm ở dưới đáy, machine learning nằm ở tầng tiếp theo và deep learning nằm ở tầng trên cùng.
Mạng thần kinh nhân tạo
Trong công nghệ thông tin, mạng thần kinh nhân tạo là một hệ thống các chương trình và cấu trúc dữ liệu mô phỏng cách vận hành của não người. Một mạng thần kinh như vậy thường bao gồm một lượng lớn các vi xử lý hoạt động song song, mỗi vi xử lý chứa đựng một vùng kiến thức riêng và có thể truy cập vào các dữ liệu trong bộ nhớ riêng của mình (đôi khi chúng không nhất thiết phải là phần cứng mà có thể là các phần mềm và giải thuật).
Nói cách khác, nếu ví mạng thần kinh nhân tạo với não người thì các neuron thần kinh chính là các node (node là đơn vị thần kinh trong mạng thần kinh nhân tạo – mỗi chiếc máy tính trong mạng thần kinh có thể được xem như 1 node) được kết nối với nhau trong một mạng lưới lớn. Bản thân từng node này chỉ trả lời được những câu hỏi hết sức cơ bản chứ không hề thông minh, nhưng khi được gộp chung với nhau thì chúng lại có sức mạnh xử lý được cả những tác vụ khó. Và điều quan trọng ở đây là bằng những thuật toán phù hợp, chúng ta có thể dạy và huấn luyện được chúng.
Machine và deep learning
Machine learning là chương trình chạy trên một mạng thần kinh nhân tạo, có khả năng huấn luyện máy tính "học" từ một lượng lớn dữ liệu được cung cấp để giải quyết những vấn đề cụ thể.
Chẳng hạn nếu muốn dạy máy tính cách băng qua đường, theo cách truyền thống bạn sẽ đưa cho nó một loạt quy tắc hướng dẫn cách nhìn trái phải hay đợi xe và người đi qua,… Thế nhưng nếu dùng machine learning, bạn sẽ cho máy tính xem 10.000 video quay cảnh người ta băng qua đường an toàn và 10.000 video quay cảnh ai đó bị xe đâm để nó tự học theo.
Phần khó nhất là làm sao cho máy tính hiểu và thẩm thấu được những video này ngay từ đầu. Qua nhiều thập kỷ, con người đã thử qua nhiều phương thức khác nhau, trong đó có cả cách “tặng thưởng” cho máy tính khi nó làm đúng (reinforcement learning), rồi so sánh chọn dần ra những cách tốt nhất.
Ngày nay, một phương pháp dạy máy tính mới đang nhanh chóng trở nên phổ biến là deep learning – một loại machine learning sử dụng nhiều lớp thần kinh nhân tạo để phân tích dữ liệu về nhiều chi tiết khác nhau.
Chẳng hạn nếu bạn dạy máy tính nhận diện hình ảnh một con mèo thì chúng ta sẽ lập trình ra nhiều lớp trong mạng thần kinh nhân tạo, mỗi lớp có khả năng xác định một đặc điểm cụ thể của con mèo như râu, vuốt, chân,… rồi cho máy xem hàng ngàn bức ảnh mèo (chỉ ra rằng “Đây là con mèo”) cùng hàng ngàn bức ảnh không phải mèo (chỉ ra rằng "đây không phải mèo"). Khi mạng thần kinh nhân tạo này xem hết các bức ảnh, các lớp node của nó sẽ dần nhận ra râu, vuốt, chân,..., biết lớp nào là quan trọng, lớp nào không. Nó cũng sẽ nhận ra rằng mèo luôn có chân nhưng những con vật không phải mèo cũng có chân nên khi cần xác định mèo, chúng sẽ tìm chân đi kèm những đặc điểm khác như vuốt hay râu.
Cuộc chơi deep learning
Năm 2011, Google khởi tạo dự án Google Brain với mục đích tạo ra một mạng thần kinh được huấn luyện bởi các thuật toán deep learning. Dự án này sau đó đã chứng minh được khả năng tiếp nhận được cả những khái niệm bậc cao của deep learning.
Năm ngoái, Facebook cũng thành lập AI Research Unit, đơn vị nghiên cứu về AI sử dụng deep learning vào việc tạo ra các giải pháp hiệu quả hơn giúp nhận diện khuôn mặt và sự vật trên 350 triệu bức ảnh và video được đăng tải lên Facebook mỗi ngày. Một ví dụ tiêu biểu khác về deep learning trong thực tế là khả năng nhận diện giọng nói của các trợ lý ảo Google Now và Siri.
Tương lai của deep learning
Deep learning đang ngày càng cho thấy một tương lai đầy hứa hẹn với ứng dụng vào điều khiển xe tự lái hay robot quản gia. Mặc dù các sản phẩm này vẫn còn nhiều hạn chế nhưng những thứ chúng làm được hiện nay thực sự rất khó tưởng tượng nổi chỉ vài năm trước đây; tốc độ nâng cấp cũng cao chưa từng thấy. Khả năng phân tích dữ liệu lớn và sử dụng deep learning vào các hệ thống máy tính có thể tự thích nghi với những gì chúng tiếp nhận mà không cần đến bàn tay lập trình của con người sẽ nhanh chóng mở đường cho nhiều đột phá trong tương lai. Những đột phá này có thể là việc thiết kế ra những trợ lý ảo, các hệ thống xe tự lái hay sử dụng vào thiết kế đồ họa, sáng tác nhạc, cho đến phát triển các nguyên liệu mới giúp robot thấu hiểu thế giới xung quanh hơn. Chính vì tính thương mại cao mà các công ty lớn, đặc biệt là Google, luôn ưu tiên các startup về robot và deep learning trong danh sách thâu tóm của mình.
Một số ứng dụng khác của deep learning:
Hệ thống gợi ý trên các nền tảng
Các nền tảng lớn hiện nay như Facebook, Amazon, Netflix,... đều có hệ thống gợi ý (recommend) rất mạnh giúp tăng đáng kể độ tương tác của người dùng. Cụ thể là chúng dựa trên các dữ liệu người dùng phát sinh ra khi dùng để gợi ý thêm những sản phẩm họ sẽ thích (trên các nền tảng mua sắm), những bộ phim họ sẽ muốn xem (vd. như trên Netflix), gợi ý các bài quảng cáo/được tài trợ (trên Facebook) hay các khóa học người học quan tâm (trên các nền tảng học online).
Nhận diện hình ảnh
Mục tiêu của công nghệ nhận diện ảnh là nhận biết và xác định các đối tượng trong ảnh cũng như hiểu được nội dung và ngữ cảnh trong đó. Ví dụ trên cho thấy dịch vụ nhận diện và xác định khuôn mặt của AlchemyVision có khả năng phân biệt hai khuôn mặt tương tự nhau giữa nam diễn viên Will Ferrell và tay trống của Red Hot Chili Peppers, Chad Smith. Công nghệ nhận diện hình ảnh cũng được đưa vào Facebook để gợi ý người dùng tag mặt bạn bè hay ứng dụng vào khoa học tội phạm và điều tra.
Phát hiện các loại bệnh hiếm gặp
Gần đây, trí tuệ nhân tạo Watson của IBM đã phát hiện ra một loại bệnh mà các bác sĩ đã bó tay không thể tìm ra ở một nữ bệnh nhân. Bằng cách so sánh bộ gen của người phụ nữ này với hơn 20 triệu kết quả nghiên cứu bệnh khác, Watson đã đưa ra kết quả là một chứng leukemia cực kỳ hiếm gặp chỉ trong 10 phút.
Mặt hạn chế
Ưu việt là vậy nhưng deep learning không phải là không có những giới hạn nhất định.
Thứ nhất, deep learning luôn đòi hỏi một lượng dữ liệu đầu vào khổng lồ để máy tính học hỏi. Quy trình này mất nhiều thời gian và sức mạnh xử lý mà chỉ có các server cỡ lớn mới làm được. Nếu không có đủ dữ liệu đầu vào, hay có đủ dữ liệu nhưng không đủ sức mạnh để xử lý, thì mọi thứ không thể diễn ra đúng như ý định, kết quả máy tính đưa ra do đó cũng không chính xác.
Thứ hai, deep learning vẫn chưa thể nhận biết được những thứ phức tạp. hay tương tự nhau. Lý do là vì hiện chưa có kĩ thuật nào đủ tốt để trí tuệ nhân tạo có thể rút ra những kết luận đó một cách logic bởi chúng chưa có được khả năng nhận biết như con người. Ví dụ như trường hợp một mạng thần kinh được yêu cầu tạo ra các hình ảnh về quả tạ 2 đầu sau khi xem loạt ảnh mẫu. Bức hình lẽ ra sẽ khá hoàn hảo nếu không chi tiết cánh tay người thừa thãi bởi máy tính vẫn chưa hiểu rằng dù có hay đi cùng hình ảnh quả tạ thì cánh tay cũng không phải là một phần của quả tạ.
Chưa hết, những công cụ trí tuệ nhân tạo thể hiện tốt hiện nay như Siri hay Cortana đều sử dụng nhiều mánh khóe để tránh né những câu hỏi khó và khiến bạn có cảm giác như đang nói chuyện với người thật vì chúng sử dụng các câu nói đùa, câu trích dẫn, các biểu hiện cảm xúc,…được set sẵn để làm bạn phân tâm và không còn chú ý đến câu hỏi ban đầu bạn đặt ra nữa.
Kết
Deep learning nói riêng hay trí tuệ nhân tạo nói chung thực sự có rất nhiều ứng dụng tuyệt vời, nhưng chúng ta hiện mới chỉ đang ở giai đoạn đầu phát triển nó nên những hạn chế là không thể tránh khỏi. Có lẽ còn phải chờ khá lâu nữa những hệ thống AI “có tri giác” mới thực sự xuất hiện, nhưng những gì các công ty lớn như Google, Facebook, IBM đang làm hiện nay cũng tương tự với việc đặt những viên gạch đầu tiên mở đường cho kỷ nguyên AI trong những thập kỷ tới.
Tham khảo OpenMind, The Verge

Ngay cả khi che mặt lại, trí tuệ nhân tạo mới này vẫn có thể nhận ra bạn là ai

Dù đây là tiến bộ của ngành trí tuệ nhân tạo nhưng nó càng làm cho quyền riêng tư của người dùng trở nên mong manh hơn bao giờ hết.

Quan niệm ngày càng được phổ biến rộng rãi giữa các cơ quan thực thi pháp luật, các nhà quảng cáo, và thậm chí cả các nhà thờ, đều cho rằng, các hệ thống nhận diện khuôn mặt, không còn nghi ngờ gì nữa, đang trở thành một trong những mối đe dọa lớn nhất cho tính riêng tư.
Bản thân khả năng xác định bất kỳ ai đó một cách tức thời chỉ bằng cách nhìn thấy khuôn mặt họ, đã tạo ra một sự mất cân bằng quyền lực to lớn, với các hậu quả nghiêm trọng có thể xảy ra cho các hoạt động tự do ngôn luận và phản kháng chính trị. Càng đáng ngại hơn khi gần đây, các nhà nghiên cứu đã trình diễn một hệ thống nhận diện, để cho dù khuôn mặt có bị làm mờ đi hoặc bị che khuất, các thuật toán được đào tạo vẫn có thể xác định được người đó bằng cách khớp nó với các mô hình trước đây, khi so sánh môi trường xung quanh đầu và cơ thể của họ.
Trong một tài liệu mới được tải lên máy chủ ArXiv, các nhà nghiên cứu tại Học viện Max Planck tại Saarbrucken, Đức đã trình diễn một phương pháp xác định các cá nhân ngay cả khi phần lớn hình ảnh của họ đã được không bị gắn tag hay được che khuất.
Hệ thống của các nhà nghiên cứu, với tên gọi “Faceless Recognition System” (Hệ thống nhận diện không cần khuôn mặt), đào tạo một mạng lưới thần kinh nhân tạo trên một bộ các bức ảnh chứa khuôn mặt và cả các bức ảnh bị che khuất gương mặt. Sau đó, họ sử dụng các kiến thức này để dự đoán danh tính của các gương mặt bị che khuất bằng cách tìm kiếm những điểm giống nhau trong các khu vực xung quanh đầu và cơ thể của người đó.
Độ chính xác của hệ thống này biến đổi tùy thuộc vào việc có bao nhiêu gương mặt xuất hiện trong bộ các bức ảnh đó. Ngay cả khi chỉ có 1,25 trường hợp khuôn mặt của một cá nhân xuất hiện hoàn toàn trong các bức ảnh, hệ thống vẫn có thể xác định được khuôn mặt bị che khuất với độ chính xác 69,6%. Nếu có 10 trường hợp gương mặt của một cá nhân xuất hiện, độ chính xác sẽ tăng lên tới mức 91,5%.
Nói cách khác, ngay cả khi bạn đã làm mọi thứ để che khuất gương mặt của mình trong phần lớn các bức ảnh trên Instagram, hệ thống này vẫn có khả năng xác định xác định được đó là bạn, miễn là đã có 1 hoặc 2 trường hợp nào đó gương mặt của bạn xuất hiện đầy đủ trong một bức ảnh.
Thế nhưng việc xác định danh tính này có thể trở nên khó hơn rất nhiều khi sử dụng một bộ các bức ảnh từ “hàng loạt các sự kiện khác nhau”, hay các yếu tố như ánh sáng chiếu vào mặt và quần áo của người trong ảnh thay đổi.
Các nhà nghiên cứu nhận ra rằng khi xác định các gương mặt bị che khuất bằng các ô vuông màu đen trên những sự kiện khác nhau, hiệu năng của hệ thống giảm đáng kể từ mức 47,4% xuống còn 14,7%. Cho dù vậy, các nhà nghiên cứu lưu ý rằng con số này vẫn chính xác hơn gấp ba lần so với phương pháp “ngây thơ” khi xác định các gương mặt bị che khuất thông qua việc đoán mò.
Trong quá khứ, Facebook đã cho thấy sức mạnh của thuật toán nhận diện khuôn mặt của mình, khi nó có thể dự đoán danh tính của người dùng khi họ che khuất gương mặt của mình với độ chính xác đến 83%, bằng cách sử dụng các dấu hiệu như dáng đứng của họ và hình dáng cơ thể. Nhưng các nhà nghiên cứu cho biết hệ thống của họ là hệ thống đầu tiên được đào tạo bằng cách sử dụng đầy đủ các dấu hiệu xung quanh các gương mặt bị làm mờ và bôi đen.
Từ góc độ của tính riêng tư, kết quả này càng làm gia tăng thêm mối lo ngại,” các nhà nghiên cứu viết trong tài liệu của mình. “Rất có thể có những hệ thống chưa bị tiết lộ, tương tự như hệ thống được mô tả trong tài liệu này, đã sẵn sàng hoạt động trực tuyến. Chúng tôi tin rằng đó là trách nhiệm của cộng đồng thị giác máy tính để xác định, và phổ biến về mối liên hệ giữa tính riêng tư và hình ảnh người dùng chia sẻ trực tuyến.”
Tham khảo Motherboard

Trí tuệ nhân tạo đang giúp phát hiện các lỗ hổng nghiêm trọng trước khi các hacker kịp tận dụng nó

Việc phát hiện ra các lỗ hổng an ninh trước khi chúng bị những hacker tìm ra và khai thác sẽ giúp các chuyên gia an ninh mạng đi trước một bước trong cuộc chiến này.

Vào tháng Hai năm 2015, Microsoft xác định được một lỗ hổng nghiêm trọng trong hệ điều hành Windows của mình, có thể cho phép một kẻ tấn công đầy ác ý chiếm quyền điều khiển máy tính từ xa đối với máy tính mục tiêu. Lỗ hổng này ảnh hưởng đến hàng loạt phiên bản hệ điều hành Windows từ Vista, Windows 7, 8 và các phiên bản khác dành cho máy chủ và máy tính di động.
Công ty đã ngay lập tức phát hành một bản sửa lỗi này. Nhưng những chi tiết về lỗ hổng cũng không mất quá nhiều thời gian để lan rộng trong cộng đồng hacker.
Vào tháng Tư 2015, các chuyên gia an ninh mạng tìm thấy một lỗi khai thác dựa trên lỗ hổng này được rao bán trên thị trường web đen, với cái giá mà người bán yêu cầu là 15.000 USD. Vào tháng Bảy, malware đầu tiên sử dụng lỗ hổng này xuất hiện. Một phần của malware, trojan Dyre Banking, được thiết kế để nhắm đến mục tiêu là người dùng trên toàn thế giới, nhằm ăn cắp số thẻ tín dụng từ các máy tính bị nhiễm virus này.
Các mốc sự kiện này cho ta một cái nhìn sâu sắc về cách malware ngày nay tiến hóa như thế nào. Trong thời gian chỉ vài tháng, các hacker đã chuyển từ một lỗ hổng thành một lỗi khai thác, đem rao bán nó, và sau đó ung dung ngồi nhìn nó phát triển thành malware khi lọt vào tay những kẻ hacker.
Trong trường hợp này, Microsoft đã nhận thức được lỗ hổng này trước khi nó có thể bị khai thác và vì vậy họ có thể phát hành một bản vá cho nó. Nhưng khi malware khai thác các lỗ hổng chưa từng được biết tới trước đây, những người sở hữu phần mềm phải phát triển một bản vá ngay lập tức, ngay trong ngày zero day (ngày số không), vì vậy nó được đặt tên “các cuộc tấn công zero-day”.
Mục tiêu quan trọng của các chuyên gia an ninh mạng là xác định các lỗi khai thác zero-day trước khi chúng chuyển thành malware. Với Eric Nunes và các bạn của mình tại Đại học bang Arizona, trường hợp trojan Dyre Banking mang đến một nguồn cảm hứng quan trọng cho một cách tiếp cận mới về an ninh mạng.
Vào thứ Sáu tuần trước, những chàng trai này đã tiết lộ về một hệ thống thu thập một cách thông minh mối đe dọa về an ninh mạng, bằng cách sử dụng trí tuệ nhân tạo để nghiên cứu các diễn đàn về hacker và các sàn giao dịch trên các web đen cũng như web ngầm. Hệ thống này săn tìm các manh mối về các lỗ hổng mới xuất hiện.
Và ngay sau đó, hệ thống mới của họ đã có một khởi đầu khá ấn tượng. “Hiện tại, hệ thống này đang thu thập trung bình 305 các cảnh báo chất lượng cao về an ninh mạng mỗi tuần.”
Đầu tiên hãy xét đến bối cảnh hiện tại. Các hacker và những tên tội phạm bất chính khác có xu hướng che giấu các diễn đàn của họ và các sàn giao dịch của chúng theo một trong hai cách. Đầu tiên, họ sử dụng rộng rãi phần mềm Tor để ẩn giấu băng thông từ các trang web này, khi chúng di chuyển trên Internet và ngăn chặn chúng có thể bị lần ra. Cách làm này còn được biết đến với tên gọi “dark net” (mạng lưới đen).
Một sự lựa chọn khác của trang web này là sử dụng các website được đặt trên những phần mở của Web nhưng chúng không được lập chỉ mục bởi các engine tìm kiếm. Các trang này được gọi là “deep net” (mạng lưới ngầm), và cách này sẽ làm cho việc điều hướng đến các trang web này trở nên tương đối khó.
Để kiểm soát các hoạt động của hacker trong những khu vực này, Nunes và nhóm của anh đã phát triển một crawler (một phần mềm phân tích dữ liệu) nhằm thu thập thông tin từ các trang HTML đặt trên deep net và dark net. Rõ ràng đây là một phần rất quan trọng của hệ thống này, khi họ khởi đầu bằng việc đặt các crawler vào các trang tốt nhất về lĩnh vực này, một tác vụ được làm thủ công bởi những người vốn quen thuộc với các trang web này. Sau đó nhóm nghiên cứu trích xuất thông tin cụ thể về hoạt động hack, trong khi loại bỏ tất cả các thông tin có liên quan đến ma túy, vũ khí và những thứ tương tự như vậy.
Cuối cùng, họ sử dụng một thuật toán máy học để phát hiện các sản phẩm có liên quan và các chủ đề đang được thảo luận trên những trang này. Họ làm được điều này bằng cách gắn nhãn cho 25% dữ liệu bằng tay, chỉ ra dữ liệu nào liên quan và dữ liệu nào không. Sau đó họ đào tạo cho thuật toán sử dụng bộ dữ liệu được gắn nhãn và kiểm tra phần dữ liệu còn lại. Bình thường một người sẽ mất một phút để gắn nhãn 5 sản phẩm trên sàn giao dịch hoặc hai chủ đề trên một diễn đàn, nhưng thời gian này sẽ được giảm xuống khi máy tính học được cách gắn nhãn và phân loại.
Kết quả thu được rất thú vị. “Với việc sử dụng các mô hình máy học, chúng tôi có thể nhận ra 92% số sản phẩm trên các sàn giao dịch và 80% cuộc thảo luận trên các diễn đàn liên quan đến việc tấn công ác ý với độ chính xác cao.” Nunes cho biết.
Kỹ thuật này đã tiết lộ một số hoạt động bất chính. “Trong suốt 4 tuần, chúng tôi phát hiện 16 lỗi khai thác zero-day từ dữ liệu trên sàn giao dịch.” Nhóm cho biết. Các phát hiện này cũng bao gồm một lỗi khai thác nghiêm trọng của Android, đang được rao bán với giá khoảng 20.000 USD và một lỗi liên quan đến Internet Explorer 11 với giá khoảng 10.000 USD.
Nhóm nghiên cứu cũng tìm kiếm các tài khoản trên mạng xã hội có liên quan đến các hacker sử dụng những diễn đàn và sàn giao dịch này. Họ cho biết có 751 người dùng đã xuất hiện trên nhiều hơn một sàn giao dịch và đưa ra ví dụ về một nhà cung cấp, người đang hoạt động trên 7 sàn giao dịch khác nhau và một diễn đàn, để cung cấp khoảng 80 sản phẩm liên quan đến việc chiếm quyền đầy ác ý.
Đây rõ ràng là một ngành kinh doanh béo bở. “Nhà cung cấp này có điểm đánh giá trung bình là 4,7/5,0, được đánh giá bởi người dùng trên sàn giao dịch với hơn 7.000 giao dịch thành công, cho thấy độ tin cậy của những sản phẩm và độ phổ biến của nhà cung cấp này.” Nunes cho biết.
Đây là một bước tiến hữu ích trong cuộc chiến chống lại tội phạm mạng. Với việc hệ thống này hiện phát hiện hơn 300 mối đe dọa mạng mỗi tuần, nó cũng thu hút sự chú ý từ thị trường thương mại. Quả thật, nhóm của Nunes cho biết hiện họ đang chuyển đổi hệ thống cho một đối tác thương mại.
Nếu nhóm này có thể phát hiện các lỗ hổng zero-day trước khi chúng được phát triển thành các sản phẩm độc hại, họ có thể giúp những người sở hữu phần mềm phát triển các bản vá một cách nhanh chóng. Và đó sẽ là một sự giúp đỡ đáng kể cho các chuyên gia an ninh mạng.
Tất nhiên, đây sẽ là một phần của trò chơi mèo đuổi chuột trong an ninh mạng. Vì vậy, sẽ rất thú vị để xem các hacker sẽ thay đổi hành vi của họ như thế nào khi hiện tại họ đã biết rằng mình đang bị theo dõi một cách có hệ thống. Và khi điều đó xảy ra, trò chơi đuổi bắt sẽ lại được bắt đầu một lần nữa.
Tham khảo Technologyreview

Sau khi xem màn AI đánh nhau này, có khi hacker và chuyên viên bảo mật cũng sợ thất nghiệp

Bạn đã bao giờ thấy một trận chiến giữa các hacker AI đối đầu với AI chưa? Đó chính là những gì đang xảy ra tại Cyber Grand Challenge.

Ngày hôm nay đã diễn ra trận đấu chung kết vô cùng kịch tính trong giải đấu Cyber Grand Challenge (CGC), do DARPA tổ chức. Đây là giải đấu tập hợp 7 đội hacker hàng đầu thế giới, với giải thưởng cao nhất trị giá tới 2 triệu USD.
Tuy nhiên, đây không phải là màn so tài giữa các hacker con người, mà là cuộc chiến giữa các trí tuệ nhân tạo. Đó là các AI được phát triển để có thể tự động tìm những lỗ hổng bảo mật an ninh, sau đó tự động tìm cách khắc phục bằng những bản vá.

Một cuộc chiến giữa các AI.
Một cuộc chiến giữa các AI.
Nếu như các chuyên gia bảo mật hàng đầu, để có thể phát hiện và khắc phục các lỗ hổng bảo mật phải mất rất nhiều thời gian, có khi tới 1 năm trời. Thì các hệ thống AI này có thể đảm nhận trong thời gian rất ngắn, khiến cho những cuộc tấn công mạng của các hacker sẽ bị ngăn chặn khi chưa bắt đầu.
Giải đấu Cyber Grand Challenge của DARPA.
Các thử thách mà những hệ thống AI này phải vượt qua tại CGC bao gồm phá khóa bảo mật, chiến tranh robot, Scavenger hunt và Capture the Flag (cướp cờ). Capture the Flag là thể loại khá phổ biến trong các cuộc thi giữa các hacker, nhưng chưa từng có một hệ thống AI nào thử sức với thể loại này.

Những hệ thống máy tính siêu khủng.
Những hệ thống máy tính siêu khủng.
Trong Capture the Flag, các AI sẽ phải cố gắng hạ gục lớp bảo mật của đối phương để lấy được dữ liệu đích. Thể loại này cũng giống với trò cướp cờ rất quen thuộc, trong khi tấn công các AI cũng phải đồng thời phòng thủ trước những đợt tấn công của đối phương.
DARPA cho biết, các cuộc thi như CGC là bước đầu để chúng ta xây dựng những hệ thống bảo vệ tự động để chống lại hacker. AI sẽ có thể phát hiện các lỗ hổng, tự động tìm cách khắc phục và cảnh báo theo thời gian thực, mà không cần tới sự theo dõi và can thiệp của con người.
Nếu bạn quan tâm tới cuộc thi vô cùng đặc biệt này, các bạn có thể tham khảo thêm nhiều thông tin và xem stream trực tiếp của cuộc thi tại đây.
Tham khảo: thenextweb