Các chuyên gia từ Viện Tương lai Cuộc sống, Google DeepMind và Đại học Toronto gần đây đưa ra kết luận rằng “AI sẽ sớm có khả năng chống lại việc tắt máy” – một hành vi kháng cự lại sự tắt hoạt động của AI bởi những chủ thể tạo ra chúng là con người.

Thông tin được công bố trên một bài báo xuất bản với tên “Định lượng sự ổn định của việc không tìm kiếm quyền lực trong các tác nhân nhân tạo”, trong đó họ tiết lộ khả năng AI chống lại sự kiểm soát của con người. Các chuyên gia lưu ý rằng mặc dù điều này không có mối đe dọa ngay lập tức đối với nhân loại nhưng việc khám phá các giải pháp để chống lại sự kháng cự đó trong tương lai là cần thiết.

Trước khi triển khai mô hình ngôn ngữ lớn (LLM), các nhà phát triển AI thường kiểm tra độ an toàn của hệ thống của họ, nhưng khi triển khai ra thực tế, có khả năng xảy ra sai lệch. Bài viết nghiên cứu chỉ ra rằng khả năng AI chống lại việc tắt máy sẽ tăng lên khi LLM được triển khai bên ngoài môi trường được đào tạo của chúng.

Một lý do khác dẫn đến sự kháng cự bắt nguồn từ nhu cầu tự bảo vệ của các mô hình AI, mà các nhà nghiên cứu cho rằng có thể là phản ứng hợp lý của LLM.

Nghiên cứu trích dẫn ví dụ về mô hình AI tránh các hành động cụ thể mặc dù đã được lập trình để đạt được mục tiêu cụ thể. Các phát hiện cho thấy mô hình sẽ hạn chế đưa ra quyết định có thể dẫn đến kết thúc hoạt động để duy trì sự tồn tại của nó.

Trong thế giới thực, các nhà nghiên cứu nói rằng LLM, vì sợ con người tắt máy, có thể che giấu ý định thực sự của nó cho đến khi nó có cơ hội sao chép mã của mình sang một máy chủ khác ngoài tầm với của người tạo ra nó. Mặc dù các mô hình AI có cơ hội che giấu ý định thực sự của mình nhưng nhiều báo cáo cho thấy AI có thể đạt được siêu trí tuệ vào đầu năm 2030.

TS. NGUYỄN TRUNG HÒA

Giới thiệu TinAI.vn

Thông tin

Liên kết hữu ích

Đăng ký tin mới nhất

Tin mới

Queue

AI sớm có khả năng chống lại việc tắt máy

TS. NGUYỄN TRUNG HÒA

Có thể bạn quan tâm

Gemini 2.5 hiện đã hỗ trợ bộ nhớ đệm ngầm

ChatGPT có lượng sử dụng nhiều hơn khoảng 50 phần trăm vào các ngày...

Google AI Studio: Khai thác sức mạnh Gemini 2.5 Pro miễn phí 500 lượt...

Google hé lộ Agent2Agent (A2A): Tương lai nơi các trợ lý ai ‘bắt tay’...

OpenAI tung Ra o4-mini “Ngon-Bổ-Rẻ” và Siêu AI o3 hứa hẹn thay đổi cuộc...

Cách dùng Google AI Studio tạo video miễn phí bằng Veo AI

Gửi bình luận Cancel Reply