31/8/2024 (TinAI.vn) – Nghiên cứu mới đây cho thấy các mô hình AI được thiết kế để dự đoán khả năng thành công của học sinh thường đưa ra dự đoán sai đối với học sinh da đen và gốc Tây Ban Nha.
Các công nghệ AI dự đoán thường được các trường cao đẳng và đại học sử dụng, nhưng nghiên cứu gần đây cho thấy chúng có nhiều khả năng dự đoán sai về tỷ lệ thất bại của sinh viên da đen và gốc Tây Ban Nha hơn là sinh viên da trắng. Các công cụ này cũng ít có khả năng dự đoán đúng về tỷ lệ thành công của sinh viên da màu hơn là sinh viên da trắng.
Những gì các nhà nghiên cứu tìm thấy về khả năng dự đoán mức độ thành công của AI
Denisa Gándara, đồng tác giả của nghiên cứu và là phó giáo sư tại Khoa Giáo dục thuộc Đại học Texas ở Austin, cho biết: “Nghiên cứu của chúng tôi được thúc đẩy bởi việc sử dụng ngày càng nhiều máy học (ML) và trí tuệ nhân tạo (AI) cho các hoạt động của trường cao đẳng và đại học, bao gồm cả việc nâng cao kết quả thành công của sinh viên”. “Các trường cao đẳng và đại học tận dụng ML để dự đoán kết quả khả năng thành công của sinh viên, chẳng hạn như tỷ lệ kiên trì và tốt nghiệp. Họ làm điều này vì nhiều lý do, bao gồm cả việc đưa ra quyết định tuyển sinh hoặc nhắm mục tiêu can thiệp”.
Gándara nói thêm rằng bà và các đồng tác giả lấy cảm hứng thực hiện nghiên cứu này vì các nghiên cứu từ các lĩnh vực khác như chăm sóc sức khỏe và tư pháp hình sự trước đây đã tiết lộ sự thiên vị đối với các nhóm thiểu số về mặt xã hội.
Bà cho biết: “Trong giáo dục đại học, những thành kiến như vậy có thể làm trầm trọng thêm bất bình đẳng xã hội hiện có, ảnh hưởng đến các quyết định quan trọng như tuyển sinh và phân bổ các dịch vụ hỗ trợ sinh viên”.
Các mô hình mà Gándara và các đồng nghiệp của bà nghiên cứu đã dự đoán không chính xác một sinh viên sẽ không tốt nghiệp 12% thời gian nếu sinh viên đó là người da trắng và 6% thời gian nếu sinh viên đó là người châu Á. Nếu sinh viên đó là người gốc Tây Ban Nha, các mô hình đã sai 21% và nếu sinh viên đó là người da đen, các mô hình đã sai 19%.
Một mô hình tương tự được áp dụng để dự đoán thành công. Các mô hình dự đoán sai thành công của học sinh da trắng và châu Á ở mức lần lượt là 65% và 73%, so với chỉ 33% đối với học sinh da đen và 28% đối với học sinh gốc Tây Ban Nha.
Nghiên cứu được tiến hành như thế nào?
Trong nghiên cứu này, các nhà nghiên cứu đã thử nghiệm bốn công cụ học máy dự đoán được sử dụng rộng rãi trong giáo dục đại học. Sau đó, các công cụ này được đào tạo trên dữ liệu 10 năm từ Trung tâm Thống kê Giáo dục Quốc gia thuộc Bộ Giáo dục Hoa Kỳ, bao gồm 15.244 sinh viên.
Gándara cho biết: “Chúng tôi đã sử dụng một tập dữ liệu lớn, đại diện cho toàn quốc, bao gồm các biến thường được sử dụng để dự đoán khả năng thành công của sinh viên đại học”. Chúng bao gồm các biến thành tích học tập và nhân khẩu học.
Các nhà nghiên cứu đã sử dụng 80% dữ liệu này để đào tạo các mô hình và sau đó kiểm tra khả năng đưa ra dự đoán của từng mô hình với 20% dữ liệu còn lại. Quá trình này có thể có nghĩa là các mô hình được cung cấp dữ liệu đào tạo tốt hơn so với nhiều trường đại học đang sử dụng.
“Các trường học và cao đẳng thường sử dụng các tập dữ liệu hành chính nhỏ hơn bao gồm dữ liệu về chính sinh viên của họ”, Gándara cho biết. “Có sự khác biệt lớn về chất lượng và số lượng dữ liệu được sử dụng ở cấp độ tổ chức”.
Tác động của nghiên cứu này là gì
Với việc các công cụ AI ngày đang trở nên phổ biến hơn trong giáo dục, thì kết quả của nghiên cứu này là rất đáng để tham khảo. “Các mô hình dự đoán không chỉ giới hạn ở các trường cao đẳng và đại học — chúng cũng được sử dụng rộng rãi trong các trường K-12 (khối phổ thông),” Gándara nói. “Nếu các mô hình dự đoán được sử dụng trong các quyết định tuyển sinh đại học, những học sinh thiểu số về chủng tộc có thể bị từ chối tuyển sinh một cách bất công nếu các mô hình dự đoán tỷ lệ thành công thấp hơn dựa trên phân loại chủng tộc của họ.”
Ngoài việc tuyển sinh, những thông tin không chính xác này có thể tạo ra các vấn đề khác. “Trong giáo dục K-12 hoặc giáo dục đại học, học sinh từ các nhóm thiểu số về chủng tộc được định hướng theo các lộ trình giáo dục ít thách thức hơn”, Gándara nói.
Ngoài ra, những dự đoán không chính xác về mức độ thành công của sinh viên có thể khiến trường học hoặc nhà giáo dục cung cấp nhiều nguồn lực hơn cho những học sinh có thể không cần những can thiệp đó.
Gándara cho biết: “Bằng chứng về sự thiên vị thuật toán và những hàm ý đa dạng của nó nhấn mạnh tầm quan trọng của việc đào tạo người dùng cuối, bao gồm các viên chức tuyển sinh, cố vấn học tập và giảng viên hoặc giáo viên, về khả năng thiên vị”. “Nhận thức về sự thiên vị thuật toán, hướng đi của nó và các nhóm bị ảnh hưởng có thể giúp người dùng ngữ cảnh hóa các dự đoán và đưa ra quyết định sáng suốt hơn”.
Phương Uyên
(Theo Erik Ofgang – Tech & Learning)