Trí tuệ nhân tạo (AI) chắc chắn đã cách mạng hóa nhiều ngành công nghiệp, từ chăm sóc sức khỏe đến tài chính. Tuy nhiên, công nghệ này không phải là không có những vấn đề khiếm khuyết – nổi bật nhất trong số đó là tính thiên vị cố hữu ngày càng trở nên rõ ràng trong các hệ thống AI. Nadi Abusaada, một nhà khoa học người Palestine qua quá trình làm việc với ChatGPT – một mô hình AI xử lý ngôn ngữ phổ biến của công ty OpenAI, cho biết nhận thấy rõ tính thiên vị cố hữu này. ChatGPT, khi được hỏi về quyền tự do của người Israel và người Palestine, đã đưa ra những câu trả lời hoàn toàn trái ngược nhau, làm nổi bật những định kiến xã hội ẩn chứa bên trong.
Biểu hiện của sự thiên vị trong hệ thống AI
Một so sánh chặt chẽ giữa ChatGPT và Alpaca, đã nhấn mạnh thêm sự thiên vị giới tính phổ biến trong việc tạo văn bản. Tương tự, cuộc điều tra của Bloomberg Graphics về Stable Diffusion – một hệ thống AI được sử dụng để chuyển đổi văn bản thành hình ảnh – cho thấy nó có vấn đề trong việc duy trì và thậm chí khuếch đại các định kiến về chủng tộc và giới tính. Những trường hợp này nhấn mạnh thực tế rằng các thuật toán AI, được thúc đẩy bởi dữ liệu đào tạo sai lệch và xu hướng được lập trình sẵn của con người, có thể vô tình củng cố những định kiến xã hội.
Gốc rễ của vấn đề
Mấu chốt của vấn đề nằm ở quá trình học tập của AI. AI phụ thuộc rất nhiều vào các ví dụ và dữ liệu đầu vào cho chức năng của nó. Tuy nhiên, những dữ liệu đầu vào này thường có thể bị sai lệch hoặc rập khuôn, dẫn đến kết quả mang tính phân biệt đối xử. Một trường hợp điển hình là phần mềm AI của Amazon để đọc sơ yếu lý lịch, phần mềm này đã học cách từ chối sơ yếu lý lịch của phụ nữ, phản ánh sự thiên vị về giới tính đã cố hữu trong dữ liệu đào tạo của họ.
Giải quyết sự thiên vị
Giải quyết vấn đề này đòi hỏi phải kiểm tra kỹ lưỡng dữ liệu, thuật toán học máy và các thành phần khác có liên quan. Rà soát dữ liệu đào tạo để phát hiện những thành kiến và đảm bảo sự đại diện công bằng cho các nhóm được đại diện quá mức hoặc thiếu đại diện là một bước quan trọng. Báo cáo của IBM nhấn mạnh sự cần thiết phải xem xét kỹ lưỡng như vậy, đặc biệt là trong các thuật toán nhận dạng khuôn mặt. Vấn đề thiên vị cũng mở rộng đến các hệ thống cá nhân hóa thuật toán như nền tảng quảng cáo của Google, hệ thống này có thể vô tình duy trì thành kiến giới tính bằng cách học hỏi từ hành vi của người dùng.
Ý nghĩa tương lai
Mặc dù AI đã đạt được những bước tiến đáng kể trong nhiều lĩnh vực khác nhau nhưng vấn đề thiên vị của AI vẫn là một thách thức ghê gớm. Việc giải quyết nó đòi hỏi một cách tiếp cận nhiều lớp bao gồm kiểm tra dữ liệu cẩn thận và điều chỉnh thuật toán. Điều này sẽ đảm bảo rằng AI đóng vai trò là một công cụ trung lập, không thiên vị vì lợi ích của tất cả mọi người. Theo Yann LeCun, nhà khoa học AI trưởng của Meta, cho rằng AI không nên nằm dưới sự kiểm soát độc quyền của một số tổ chức doanh nghiệp. Sự phát triển của AI phải là một quá trình hợp tác và minh bạch, như được minh họa bằng việc Meta ra mắt Llama 2 – một mô hình ngôn ngữ lớn nguồn mở.
Phương Uyên