Sự trỗi dậy của những cỗ máy

Trí tuệ nhân tạo đã gần với con người hơn bao giờ hết, những thành công từ các cỗ máy có thể hỗ trợ chúng ta nhưng cũng tiềm tàng mối đe dọa trong tương lai.

Elon Musk được ví như siêu anh hùng công nghệ trong đời sống thực với những câu chuyện mới, hấp dẫn giống như Iron Man trong phim ảnh. Anh ta bận rộn với việc xây dựng và kiến tạo tương lai con người bằng những dự án công nghệ mà trước đây chỉ thấy trong khoa học viễn tưởng. Dù vậy, đối với Elon Musk thì không phải tất cả công nghệ trong tương lai đều có thể khiến giấc mơ trở thành hiện thực.

Musk đã mô tả việc tạo ra trí tuệ nhân tạo (artificial intelligence – AI) giống như “triệu hồi quỷ dữ” và đối thủ cho trí thông của con người có lẽ là mối đe dọa lớn nhất đối với thế giới. Quan điểm này không chỉ của riêng Elon Musk mà trên thế giới người ta đã nhắc đến rất nhiều. Các nhà triết học tại Đại học Oxford đã phát triển khái niệm về “Những rủi ro hiện sinh” đe dọa nhân loại nói chung thì trí tuệ nhân tạo là một trong số đó, cùng với chiến tranh hạt nhân và thảm họa thiên thạch. Hay như Giáo sư Stephen Hawking đã cho rằng “Việc phát triển đầy đủ trí tuệ nhân tạo sẽ dẫn tới sự chấm dứt loài người”.

“Việc phát triển đầy đủ trí tuệ nhân tạo sẽ dẫn tới sự chấm dứt loài người”- Stephen Hawking

Dữ liệu trở nên khổng lồ bởi số lượng thiết bị kết nối Internet trên toàn thế giới ngày càng tăng, và lượng thông tin này được xử lý bởi những những hệ thống có sức mạnh tính toán phi thường. Việc thu thập càng nhiều dữ liệu có nghĩa là thuật toán xử lý ngày càng trở nên thông minh hơn, không chỉ nhận biết được hình ảnh mà còn có khả năng hiểu được nhiều ngôn ngữ. Giới kinh doanh cũng nhanh chóng nắm bắt xu hướng này, và đã không ít người lo lắng về việc công nghệ sẽ lấy đi công ăn việc làm của mình. Điều này có thể liên tưởng tới cuộc cách mạng khoa học của thế kỷ 17 trước khi máy móc tự động, năng suất cao dần thay thế con người trong công việc.

Những quan ngại như vậy chính là hình ảnh phản chiếu tương lai phát triển của trí tuệ nhân tạo với sự tiến bộ vượt bậc trong vài năm qua. Những công ty công nghệ khổng lồ như Google, Facebook, Amazon và Baidu đã bước vào một cuộc chạy đua AI, săn lùng các nhà nghiên cứu, xây dựng phòng thí nghiệm và mua công ty khởi nghiệp trong lĩnh vưc này.

Những dấu hiệu chạy đua AI hiện hữu khắp mọi nơi. Năm 2014, Google đã chi 400 triệu USD để mua DeepMind – một công ty khởi nghiệp về trí tuệ nhân tạo. Trong khi đó, Microsoft đầu tư hơn một phần tư nguồn nhân lực của phòng nghiên cứu, phát triển của mình để tập trung vào dự án trí tuệ nhân tạo. Các hãng công nghệ lớn đến từ Trung Quốc cũng không bỏ lỡ cuộc đua này khi Baidu nhanh tay mời Andrew Y. Ng – người đã từng đặt nền móng cho cỗ máy trí tuệ Google Brain về lãnh đạo bộ phận chuyên về máy thông minh và deeplearning.

Các công ty nhỏ khác như Narrative Science ở Chicago thì hi vọng trí tuệ nhân tạo có thể trở thành phóng viên chuyên nghiệp với khả năng viết lách chẳng kém ai. Cỗ máy đến từ Narrative Science cũng đã từng viết về một vài điều cơ bản về tài chính trên tạp chí Forbes. Đó chỉ là một phần nhỏ mà trí tuệ nhân tạo có thể làm. Hồi tháng 4/2015, IBM đưa ra kế hoạch sử dụng siêu máy tính Watson nhằm phân tích các loạt hồ sơ y tế, thu thập dữ liệu những đánh giá bác sỹ và bệnh nhân sau khi bệnh nhân xuất viện…

Những chiếc máy học tập

Nghiên cứu về trí tuệ nhân tạo không có gì mới kể từ thời điểm những chiếc máy tính xuất hiện. Điểm bùng nổ tại thời điểm hiện tại là khả năng học hỏi con người của máy, được gọi là “Deep Learning – học sâu”, hay phương thức máy tự học thông qua lượng dữ liệu khổng lồ đang có bằng sức mạnh tính toán của mình. Sự gia tăng về phần cứng cùng các thuật toán đã giúp máy mở rộng trí tuệ của mình, làm được những điều mà từ trước tới nay được cho là không thể. Những điều khó khăn với con người có thể dễ dàng với những cỗ máy và ngược lại. Máy tính có thể giúp chúng ta nhanh chóng giải được những phương trình phức tạp nhưng chúng lại gặp khó khăn với những giác quan mà con người thấy bình thường như nhận diện khuôn mặt, giải mã lời nói hay xác định các đối tượng trong hình ảnh.

Để hiểu rõ vấn đề này hơn bằng cách để con người làm những điều họ thấy khó khăn, chẳng hạn như giải phương trình vi phân, các bước phải thực hiện là tổ hợp nhiều quy tắc được quy định sẵn để thực hiện. Tuy nhiên trên thực tế thì không chỉ tính toán khiến con người cảm thấy khó khăn. Lấy một ví dụ là vụ án nổi tiếng ở Mỹ vào thập niên 60, trong đó đề cập đến chuyện người có thể phân biệt nội dung khiêu dâm từ nội dung nhạy cảm.. Các xác định đơn giản nhất đó chính là nhìn, và ông thẩm phán trong vụ án này đã tuyên bố “khiêu dâm thật khó định nghĩa nhưng tôi mà nhìn thấy khiêu dâm thì biết ngay là khiêu dâm”.

3 lớp nơron thần kinh của trí tuệ nhân tạo

Machine learning cũng sử dụng phương thức như vậy để học khi chúng ta cho phép máy nhìn thấy những điều chúng ta muốn mà các quy tắc lập trình không thể xác định. Máy sẽ làm điều này bằng các phân tích thống kê rất nhiều dữ liệu để có thể nhìn thấy một cái gì đó.

Nhiều hệ thống sử dụng mạng thần kinh – công nghệ AI đã được thiết kế và có sự nghiên cứu khá lâu. Nơ-ron thần kinh cho máy tính đã được phát minh vào những năm 1950 bởi các nhà nghiên cứu mong muốn tạo ra một bộ não điện tử giống con người. Bộ não này xử lý thông tin với các tế bào thần kinh là bóng bán dẫn. Nếu chúng ta có thể mô phỏng các bóng bán dẫn liên kết với nhau giống như tế bào thần kinh và các tín hiệu điện truyền qua đạt được một mức độ nhất định thì những hành vi phản ánh trí thông minh sẽ tái hiện.

Giấc mơ kì lạ của trí tuệ nhân tạo Google

Mạng lưới tương lai

Nơ-ron vô cùng phức tạp, thậm chí ngày nay, các mô phỏng được sử dụng trong AI với cốt lõi là mô hình toán học định nghĩa bởi phép thử Turing (Alan Turing- nhà toán học, người được xem là cha đẻ của trí tuệ nhân tạo). Nhưng kết quả ban đầu cho thấy rằng ngay cả các mạng nơ-ron đơn giản nhất cũng thực hiện tốt một số nhiệm vụ. Trong lĩnh vực trí tuệ nhân tạo, mạng nơ-ron đã được áp dụng thành công trong các nhận dạng tiếng nói, xử lý ảnh và điều khiển thích nghi (adaptive control). Còn đối với khả năng nhận thức thì việc mô phỏng con người cũng đạt được một số thành tựu như mô hình phản xạ thần kinh tủy sống của con người. Chris Bishop, một nhà nghiên cứu AI của Microsoft chỉ ra rằng các công ty điện thoại kể từ năm 1960 đã sử dụng công nghệ loại bỏ tiếng vọng được tạo thành từ thuật toán phát hiện bởi các mạng thần kinh. Nhưng sau thành công ban đầu, ý tưởng này dần mất sức hấp dẫn. Sức mạnh tính toán trong mạng thần kinh mô phỏng bị giới hạn công nghệ phần cứng.

Trong vài năm qua, sức mạnh tính toán ngày càng tăng của chip xử lí dành cho các công việc đòi hỏi tính khắt khe như đồ họa, bản vẽ, video game đã làm hồi sinh sự hấp dẫn của mạng nơ-ron. Mạng lưới thần kinh được mở rộng đến từ hàng chục hoặc hàng trăm tỷ tế bào thần kinh, thường được tổ chức như một lớp duy nhất. Gần đây nhất là sự thành công của Google trong việc tạo ra con số 1 tỷ tế bào mô phỏng. Với nhiều tế bào thần kinh điện tử có sẵn, các nhà nghiên cứu có đủ khả năng tái tạo một phần của não bộ và tổ chức chúng với lớp phân cấp. Đó là việc sử dụng các lớp liên kết sâu này lại với nhau và trở thành “deep learning – học sâu”.

Thuật toán nhận diện khuôn mặt của DeepFace

Mỗi lớp của mạng giao dịch với mức độ trừu tượng khác nhau. Để xử lý hình ảnh, ví dụ, lớp thấp nhất đưa ra những hình ảnh thô, ghi chú những tham số như độ sáng và màu sắc của điểm ảnh cá nhân, và cách thức phân phối tài nguyên để xử lý hình ảnh. Lớp tiếp theo kết hợp những dữ liệu từ quan sát, xác định góc cạnh, đổ bóng và các loại tương tự. Các lớp sau đó sẽ phân tích cạnh và bóng để lần lượt tìm kiếm sự kết hợp nhằm nhận biết các bộ phận khác như mắt, môi và tai. Và sau đó tất cả có thể được kết hợp thành khuôn mặt, không hẳn là hoàn thiện nhất nhưng hệ thống có thể nhận diện bởi khả năng so sánh với một khuôn mặt cụ thể mà trước đây mạng thần kinh đã nhìn thấy.

Để là được những công việc đó, máy học cần phải được đào tạo. Đối với máy tính, để chương trình tự động nhận dạng khuôn mặt, nó sẽ được giới thiệu hàng ngàn bức ảnh khác nhau, một số chứa khuôn mặt, một số thì không, một số khác thì được gắn nhãn. Các hình ảnh đầu vào sẽ được hệ thống xác định “khuôn mặt” hay “không khuôn mặt” trước khi đưa ra kết quả. Nhiệm vụ của máy tính là sử dụng quy tắc thống kê tương quan với loạt hình ảnh đầu vào và cho kết quả chính xác nhất ở đầu ra. Để làm điều đó, máy sẽ tìm kiếm mọi mức độ trừu tượng về khuôn mặt được thể hiện phổ biến trong những tấm hình. Một khi sự tương quan đủ tốt, máy sẽ có khả năng nhận dạng đáng tin cậy và bước tiếp theo là máy tạo ra quy tắc để có thể triển khai trong thế giới thực

Bằng cách làm việc từ dưới lên, các thuật toán giúp máy học cách nhận ra các tính năng, khái niệm và danh mục mà con người hiểu được bằng cách diễn đạt thông qua các đoạn mã. Chương trình này cần sự gợi ý từ các nhà thiết kế, xử lý thủ công với các đoạn mã nhằm tạo ra tác vụ cụ thể như phát hiện hình ảnh hay nhận dạng giọng nói.

Mạng lưới thần kinh trước đây chỉ gặp vấn đề về giới hạn dữ liệu và bổ sung thông tin để tăng hiệu suất xử lý của máy. Hệ thống hiện đại có khả năng tinh chỉnh và tương tác tốt hơn bởi máy có thể dễ dàng thu thập dữ liệu hơn trước rất nhiều. Các công ty Internet lớn như Baidu, Google và Facebook có lợi thế bởi lượng thông tin dồi dào được tạo ra bởi người dùng của họ. Dữ liệu thu thập từ email, thông tin tìm kiếm, lịch sử mua sắm, hình ảnh tải lên… và tất cả đều nằm trong máy chủ của họ. Thông tin nhiều có vẻ là tốt nhưng cũng gây ra hiện tượng quá tải. Điều này được khắc phục bằng các thuật toán nhằm tìm kiếm những mẩu dữ liệu hữu ích, nằm trong quy tắc.

Trong năm 2014 Facebook đã giới thiệu một thuật toán gọi DeepFace có thể nhận ra khuôn mặt của con người. Độ chính xác của phương pháp đạt tới 97,25%, ngay cả khi gương mặt ở độ sáng yếu hoặc một phần ẩn. Microsoft thì công bố ứng dụng tương tự được phát triển cho Cortana, có khả năng phân biệt hình ảnh của 2 giống chó Pembroke Welsh Corgi và Cardigan Welsh Corgi có bề ngoài giống hệt nhau.

Ngoài ra, một số quốc gia sử dụng công nghệ nhận diện khuôn mặt để phục vụ xác thực nhập cảnh. Hay như báo cáo gần đây được công bố hồi 5/5/2015 cho thấy những điệp viên của Mỹ sử dụng phần mềm nhận dạng giọng nói để chuyển đổi các cuộc gọi điện thoại thành văn bản nhằm phục vụ việc tìm kiếm dễ dàng hơn.

Nhưng Internet là một kho dữ liệu khổng lồ và gần như không có giới hạn, còn thuật toán máy học lại phát triển trên nguồn tài nguyên hữu hạn. Vì lý do này, một thế hệ AI mới có thể tiếp tục phát triển với các thuật toán Học không có giám sát (unsupervised-learning) mà không cần sự giúp đỡ của con người. Sự tiến bộ được thể hiện trên nhiều dự án thực tế. Năm 2012, nhóm nghiên cứu tại Google chỉ ra rằng Học không có giám sát có thể xử lý hàng triệu hình ảnh video YouTube. Máy học có thể phân loại những điều phổ biến mà nó có thể nhìn thấy, kể cả khuôn mặt con người.

Andrej Karpathy và Li Fei-Fei tại Đại học Stanford đã mô tả một hệ thống máy tính có thể gắn nhãn cho các thành phần của hình ảnh nhất định. Ví dụ như bữa ăn sáng với khả năng xác định hoa quả, tách café hay những bông hoa, thậm chí có thể tạo ra chú thích hình ảnh bằng tiếng Anh mặc dù công nghệ này vẫn chưa thực sự hoàn hảo. Các công ty Internet lớn như Google quan tâm đến công việc này vì nó có thể trực tiếp ảnh hưởng lĩnh vực mà họ đang nắm giữ. Phân loại hình ảnh tốt hơn sẽ giúp cải thiện khả năng của các công cụ tìm kiếm phục vụ nhu cầu người sử dụng. Về lâu dài công nghệ này có thể thay đổi và hữu ích với các nhà nghiên cứu robot, phục vụ cho ngành công nghiệp xe tự hành hay công việc điều hướng theo thời gian thực.

Phân loại hình ảnh cũng là công nghệ cho phép tính năng “tăng cường thực tế” trong các thiết bị đeo như Glass của Google hay HoloLens của Microsoft hoạt động hiệu quả. Enlitic, một công ty có trụ sở tại San Francisco hy vọng sẽ sử dụng công nghệ nhận dạng hình ảnh để phân tích X-quang, MRI nhằm tìm kiếm những vấn đề mà bác sĩ có thể bỏ sót.

Và học sâu – deep learning không chỉ giới hạn ở phần hình ảnh. Đây chỉ giống như một mô hình chung được thực hiện để mọi người xác nhận các kĩ thuật, nguyên tắc trong việc truy cập, sử dụng lượng lớn dữ liệu để tạo ra thông tin hữu ích. Một cuộc thi gần đây được tổ chức bởi phòng thí nghiệm hạt nhân CERN, những thuật toán deep learning đã tìm thấy các điểm đặc trưng của hạt hạ nguyên tử (hạt cấu thành nguyên tử) mặc dù các nhà lập trình này không có kiến thức chuyên sâu về vật lý.

Những chiếc máy dịch thuật cũng được cải thiện bởi thuật toán deep learning, nó sử dụng mạng thần kinh để kết nối với lượng văn bản khổng lồ trực tuyến với nhiều ngôn ngữ khác nhau nhằm tăng cường khả năng chuyển ngữ. Baidu cho rằng chương trình nhận diện giọng nói tốt chạy trên điện thoại thông minh có thể giúp nhiều người giao tiếp với thế giới, bỏ qua giới hạn ngôn ngữ.

Tại thời điểm này, trong lĩnh vực tìm kiếm chỉ có khoảng 10% được tiến hành bằng giọng nói, con số này được kì vọng là 50% vào năm 2020. Một số trí tuệ nhân tạo có thể liên kết với nhau tạo thành hệ thống có sức mạnh lớn hơn.

Thay thế con người

Google đã phát triển hệ thống mạng nơ-ron nhân tạo (ANN) nhằm phục vụ quá trình xử lý, nhận dạng hình ảnh và giọng nói. Và từ đó hệ thống này được trang bị thuật toán giúp máy tính có thể tưởng tượng vẽ ra hình ảnh mà nó tự học sau khi xem qua hàng triệu bức ảnh. Những hình ảnh này được thực hiện một cách máy móc bởi thuật toán. Cũng giống như công nghệ dịch máy của Microsoft, không ai trong chúng ta có thể nhầm lần lời thoại của một chiếc máy với người phiên dịch chuyên nghiệp. Mặc dù không được trôi chảy nhưng công cụ này cũng truyền tải được ý nghĩa cơ bản sau khi dịch, điều này có thể chưa phù hợp với ngành dịch thuật trong tương lai nhưng lại giúp con người giải quyết được giới hạn ngôn ngữ. Những lo lắng rằng AI khiến giới tài chính trở thành nạn nhân giống như những gì diễn ra trong cuộc cách mạng công nghiệp. Một ví dụ thực tế là công ty tài chính Kensho trang bị hệ thống kỹ thuật số Narrative Science, được thiết kế nhằm phân tích các truy vấn tìm kiếm từ ngôn ngữ tự nhiên. Sau đó sử dụng khả năng phân tích, kết hợp với dữ liệu để cho ra các báo cáo tài chính hay số liệu thị trường như thế nào. Yseop, một công ty của Pháp, sử dụng phần mềm ngôn ngữ tự nhiên để giải thích thắc mắc và trả lời bằng tiếng Anh, tiếng Tây Ban Nha, tiếng Pháp hoặc tiếng Đức cho hơn 3.000 trang tài liệu chỉ trong vòng 1 giây. Và trước đây, các công ty như L’Oréal và VetOnline.com đã sử dụng hệ thống này để hỗ trợ khách hàng trên trang web của họ.

Những cỗ máy vô hồn

Những chiếc điện thoại thông minh hay những robot thời thượng có thể mang đến cho con người những điều tốt đẹp, gỡ bỏ hạn chế về tri thức. Điều này biện minh cho những lo lắng hiện sinh mà Elon Musk và nhiều người khác đề cập đến. Có thể hiện tại máy tính chỉ tự lập trình để làm những công việc đơn giản nhưng một khi những hệ thống này thông minh hơn con người thì vấn đề gì sẽ xảy ra? Bản thân AI là do con người tạo ra nên nó trở nên nguy hiểm hay không là do chính chúng ta quyết định.

Máy tính hiện nay có thể làm một số nhiệm vụ hạn hẹp và chúng không có mục tiêu, không động lực và không có ý thức tồn tại của chính mình. Điều này sẽ thay đổi nếu chúng ta cố gắng tái tạo hoạt động của bộ não con người và khiến AI đủ thông minh để nhận ra điều gì là đúng là sai. Trước khi điều đó xảy ra, chúng ta chính là những người quyết định sự ảnh hưởng của AI tới xã hội, và nếu để AI can thiệp quá sâu vào cuộc sống con người thì lúc đó những lo lắng của Stephen Hawking sẽ sớm trở thành hiện thực. “Con người, vốn bị giới hạn bởi sự tiến hóa sinh học chậm, sẽ không thể cạnh tranh được và sẽ bị qua mặt” – Giáo sư Hawking đã nhật xét về hình thức trí thông minh nhân tạo và tương lai của con người.

PC World VN, 08/2015

Advertisements

Posted on August 30, 2015, in Tin học and tagged . Bookmark the permalink. Leave a comment.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: