15/8/2024 (TinAI.vn) – Một trong những thách thức lớn của trí tuệ nhân tạo là phát triển các tác nhân có khả năng tiến hành nghiên cứu khoa học và khám phá kiến thức mới. Mặc dù các mô hình trí tuệ nhân tạo tạo sinh (Gen AI) đã được sử dụng để hỗ trợ các nhà khoa học, ví dụ như để động não ý tưởng hoặc viết mã, chúng vẫn đòi hỏi sự giám sát thủ công rộng rãi hoặc bị hạn chế rất nhiều đối với một nhiệm vụ nghiên cứu cụ thể.
Sakana AI – một doanh nghiệp trí tuệ nhân tạo có trụ sở tại Tokyo được đồng sáng lập bởi các cựu nhà nghiên cứu của Google là David Ha và Llion Jones, Ren Ito, cựu giám đốc điều hành của Mercari và là thành viên của Bộ Ngoại giao Nhật Bản chính thức giới thiệu “The AI Scientist“, hệ thống toàn diện đầu tiên hỗ trợ cho việc tự động hóa nghiên cứu, khám phá khoa học hoàn toàn tự động, cho phép các Mô hình nền tảng như Mô hình ngôn ngữ lớn (LLM) thực hiện nghiên cứu độc lập. Với sự hợp tác của Phòng thí nghiệm Foerster về Nghiên cứu AI tại Đại học Oxford và Jeff Clune và Cong Lu tại Đại học British Columbia, Sakana đã phát hành bài báo khoa học công bố kết quả nghiên cứu mới của họ “The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery”.
Nội dung chính của bài báo:
- Đề xuất và vận hành một hệ thống nghiên cứu khoa học hoàn toàn do AI điều khiển để khám phá khoa học một cách tự động, áp dụng cho nghiên cứu máy học.
- Nhà khoa học AI tự động hóa toàn bộ vòng đời nghiên cứu, từ việc tạo ra các ý tưởng nghiên cứu mới, viết bất kỳ mã nào cần thiết và thực hiện các thí nghiệm, cho đến tóm tắt kết quả thử nghiệm, trực quan hóa chúng và trình bày các phát hiện của mình trong một bản thảo khoa học đầy đủ.
- Bài báo cũng giới thiệu một quy trình đánh giá ngang hàng tự động để đánh giá các bài báo đã tạo, viết phản hồi và cải thiện kết quả tốt hơn nữa. Nó có khả năng đánh giá các bài báo đã tạo với độ chính xác gần như con người.
- Quá trình khám phá khoa học tự động được lặp đi lặp lại để phát triển các ý tưởng theo cách mở và thêm chúng vào kho lưu trữ kiến thức ngày càng mở rộng, do đó mô phỏng cộng đồng khoa học của con người.
- Với kết quả nghiên cứu đầu tiên này, Nhà khoa học AI được sử dụng để tiến hành nghiên cứu trong nhiều lĩnh vực khác nhau trong nghiên cứu học máy, khám phá những đóng góp mới trong các lĩnh vực phổ biến như mô hình khuếch tán, mô hình học máy (transformers) và grokking .
The AI Scientist (nhà khoa học AI) được thiết kế để tính toán hiệu quả các nội dung nghiên cứu khoa học được định hướng trước. Mỗi ý tưởng được triển khai và phát triển thành một bài báo đầy đủ với chi phí khoảng 15 đô la cho mỗi bài báo. Mặc dù vẫn có một số lỗi trong các bài báo do phiên bản đầu tiên này tạo ra, chi phí này và lời hứa mà hệ thống thể hiện cho đến nay minh họa cho tiềm năng của AI Scientist trong việc dân chủ hóa nghiên cứu và đẩy nhanh đáng kể tiến trình nghiên cứu khoa học.
Sakana tin rằng công trình này đánh dấu sự khởi đầu của một kỷ nguyên mới trong khám phá khoa học: mang lại những lợi ích với tính chuyển đổi của các tác nhân AI cho toàn bộ quá trình nghiên cứu, bao gồm cả quá trình nghiên cứu của chính AI. Nhà khoa học AI đưa chúng ta đến gần hơn với một thế giới nơi sự sáng tạo và đổi mới vô tận với giá cả phải chăng có thể được giải phóng để giải quyết những vấn đề thách thức nhất của thế giới.
Sakana cũng đưa ra một bài báo mẫu, “Adaptive Dual-Scale Denoising” do The AI Scientist tạo ra. Có thể xem toàn bộ bài báo tại đây . Mặc dù có một số sai sót (ví dụ như cách giải thích hơi thiếu thuyết phục về lý do tại sao phương pháp của nó lại thành công), bài báo đề xuất một hướng đi mới thú vị thể hiện kết quả thực nghiệm tốt trong các thí nghiệm do chính The AI Scientist tiến hành và được bình duyệt.
Để biết thêm chi tiết và nhiều bài báo mẫu khác, vui lòng xem báo cáo khoa học đầy đủ của Sakana. Sakana cũng đang phát hành mã nguồn mở và kết quả thử nghiệm đầy đủ trên kho lưu trữ GitHub .
The AI Scientist có 4 quy trình chính được mô tả dưới đây.
Tạo ý tưởng: với một mẫu khởi đầu, Nhà khoa học AI sẽ “động não” tạo ra một tập hợp đa dạng các hướng nghiên cứu mới. Người thực hiện cung cấp cho Nhà khoa học AI một “mẫu” mã khởi đầu của một chủ đề hiện có mà họ muốn Nhà khoa học AI khám phá thêm. Sau đó, Nhà khoa học AI có thể tự do khám phá bất kỳ hướng nghiên cứu khả thi nào. Mẫu cũng bao gồm một thư mục LaTeX chứa các tệp kiểu và tiêu đề các nội dung để viết bài báo. Hệ thống này được kết nối và tìm kiếm trong Semantic Scholar để đảm bảo ý tưởng của nó luôn là mới.
Lặp lại thử nghiệm: với mỗi một ý tưởng và một mẫu, giai đoạn thứ hai của Nhà khoa học AI là thực hiện các thí nghiệm được đề xuất, sau đó lấy và tạo ra các biểu đồ để trực quan hóa kết quả. Nó tạo một ghi chú mô tả nội dung của từng biểu đồ, cho phép các số liệu đã lưu và ghi chú thử nghiệm cung cấp tất cả thông tin cần thiết để viết bài báo.
Bài viết: Cuối cùng, The AI Scientist tạo ra một bài viết ngắn gọn và nhiều thông tin về tiến trình của mình theo phong cách của một hội nghị học máy chuẩn trong LaTeX. Nó sử dụng Semantic Scholar để tự động tìm các bài báo có liên quan để trích dẫn.
Đánh giá bài báo tự động: Một khía cạnh quan trọng của công việc này là phát triển một trình đánh giá tự động do mô hình ngôn ngữ lớn (LLM) cung cấp, có khả năng đánh giá các bài báo được tạo ra với độ chính xác gần như con người. Các đánh giá được tạo ra có thể được sử dụng để cải thiện dự án hoặc làm phản hồi cho các thế hệ tương lai để đưa ra ý tưởng mở. Điều này cho phép một vòng phản hồi liên tục, cho phép Nhà khoa học AI cải thiện đầu ra nghiên cứu của mình theo từng bước.
Những hạn chế và thách thức
Ở thời điểm hiện tại, The AI Scientist có một số thiếu sót. Sakana hy vọng tất cả những thiếu sót này sẽ được cải thiện, có thể là đáng kể, trong các phiên bản tương lai với việc đưa vào các mô hình đa phương thức và khi các mô hình nền tảng cơ bản mà The AI Scientist sử dụng tiếp tục cải thiện đáng kể về khả năng và giá cả phải chăng.
- Hiện tại, AI Scientist không có bất kỳ khả năng thị giác nào, do đó không thể khắc phục các vấn đề về thị giác với giấy hoặc đọc các biểu đồ. Ví dụ, các biểu đồ được tạo đôi khi không thể đọc được, các bảng đôi khi vượt quá chiều rộng của trang và bố cục trang thường không tối ưu. Việc thêm các mô hình nền tảng đa phương thức có thể khắc phục điều này.
- Nhà khoa học AI có thể triển khai ý tưởng của mình một cách không chính xác hoặc so sánh không công bằng với dữ liệu cơ sở, dẫn đến kết quả sai lệch.
- Nhà khoa học AI đôi khi mắc lỗi nghiêm trọng khi viết và đánh giá kết quả. Ví dụ, nó gặp khó khăn khi so sánh độ lớn của hai số, đây là một điểm tồn tạo của LLM. Để giải quyết một phần vấn đề này, Sakana đảm bảo tất cả các kết quả thử nghiệm đều có thể tái tạo được, lưu trữ tất cả các tệp được thực thi.
Giá trị tương lai của The AI Scientist
Giống như nhiều công nghệ mới, The AI Scientist sẽ mở ra một tương lai mới cho lĩnh vực nghiên cứu khoa học có sự hỗ trợ của AI giúp các nhà nghiên cứu đạt được những kết quả nghiên cứu nhanh hơn, tiết kiệm cả về chi phí, và thời gian.
Tuy nhiên, cũng như hầu hết các tiến bộ công nghệ trước đây, The AI Scientist có khả năng bị sử dụng theo những cách phi đạo đức. Ví dụ, nó có khả năng được triển khai để tiến hành nghiên cứu phi đạo đức. Nó cũng có thể dẫn đến tác hại không mong muốn nếu The AI Scientist tiến hành nghiên cứu không an toàn.
Sự ra đời của The AI Scientist đánh dấu một bước tiến quan trọng hướng tới việc hiện thực hóa toàn bộ tiềm năng của AI trong nghiên cứu khoa học. Bằng cách tự động hóa quy trình khám phá và kết hợp hệ thống đánh giá do AI điều khiển, Sakana tin tưởng sẽ mở ra cánh cửa đến những khả năng vô tận cho sự đổi mới và giải quyết vấn đề trong những lĩnh vực khoa học và công nghệ đầy thách thức nhất.
Phương Uyên