Các công cụ phát hiện AI cũng có độ sai lệch nhất định. Chúng gán nhăn các bài luận có khả năng “do AI tạo ra” dù thực tế là do sinh viên tự viết.Từ khi ChatGPT ra mắt, trường học và giảng viên đă liên tục phải điều chỉnh phương pháp dạy và học để thích ứng. Tuy nhiên, những công cụ phát hiện AI vẫn chưa đạt đến mức hoàn hảo.
Trong hàng triệu bài tập được nộp mỗi năm, một tỷ lệ sai sót nhỏ cũng đủ gây ra hệ lụy nghiêm trọng, đặc biệt là khi học sinh vô t́nh bị gán mác gian lận.
Bị đổ oan là đạo văn do AI viết
Moira Olmsted là một trường hợp điển h́nh. Cô trở lại học sau khi nghỉ một thời gian v́ dịch bệnh và muốn sớm hoàn tất khóa học để trở thành giáo viên. Trong học kỳ đầu tại Đại học Central Methodist, cô đă nhận điểm “0” cho bài tập v́ bị công cụ phát hiện AI gắn cờ là “do AI tạo ra”.
Dù cố gắng giải thích về cách viết “chuẩn mực” của ḿnh v́ cô thuộc phổ tự kỷ (ASD) và có cách diễn đạt cụ thể, Olmsted vẫn bị giáo viên cảnh cáo rằng nếu xảy ra lần nữa, cô sẽ bị xem như đă đạo văn.
Không chỉ riêng Olmsted, hàng trăm, hàng ngh́n sinh viên khác cũng đang phải đối mặt với áp lực tương tự. Theo một khảo sát của Center for Democracy & Technology, có đến 2/3 giáo viên thường xuyên sử dụng công cụ phát hiện AI để đánh giá bài làm của học sinh. Một lỗi nhỏ trong các công cụ này cũng có thể gây ra hậu quả lớn khi áp dụng ở quy mô toàn quốc, thậm chí toàn cầu.Bloomberg đă thử nghiệm 2 công cụ phát hiện AI hàng đầu, GPTZero và Copyleaks, trên 500 bài luận nộp vào Đại học Texas A&M năm 2022, trước khi ChatGPT xuất hiện. Kết quả cho thấy các công cụ phát hiện AI có độ sai lệch từ 1-2%. Chúng gán nhăn các bài luận này có khả năng “do AI tạo ra” dù thực tế là do sinh viên tự viết.
Những lỗi sai này càng gây khó khăn cho những học sinh không sử dụng tiếng Anh như ngôn ngữ mẹ đẻ, hoặc có phong cách viết đơn giản, dễ bị hiểu nhầm là máy móc. Theo nghiên cứu từ Đại học Stanford năm 2023, khi kiểm tra các bài viết của học sinh lớp 8 sinh ra tại Mỹ, công cụ phát hiện AI hoạt động gần như hoàn hảo. Tuy nhiên, khi kiểm tra các bài viết của học sinh không phải người bản ngữ, hơn một nửa đă bị gắn cờ là “do AI tạo ra”.
Ken Sahib, một học sinh từng sống tại Italy và sau đó chuyển đến học tại New York, cũng rơi vào t́nh huống tương tự. Một bài tóm tắt trong môn Nhập môn Mạng máy tính tại Berkeley College đă bị điểm “0”. Khi anh chất vấn, giáo viên chỉ trả lời: “Mỗi công cụ tôi thử đều cho ra kết quả rằng bài này là do AI viết”. Cuối cùng, Sahib vẫn qua môn nhưng mối quan hệ của anh với giáo viên dần rạn nứt.
Mặc dù một số giáo viên đă ngừng sử dụng công cụ phát hiện AI và thay đổi chương tŕnh giảng dạy để tích hợp công nghệ, nhiều trường đại học và trung học vẫn dựa vào những công cụ này để phát hiện gian lận. Kể từ năm 2019, các startup trong lĩnh vực phát hiện AI đă thu hút khoảng 28 triệu USD đầu tư, hầu hết là từ khi ChatGPT ra mắt.
Với các công ty phát hiện deepfake, có thể kiểm tra văn bản, h́nh ảnh, âm thanh và video do AI tạo ra, họ huy động được hơn 300 triệu USD vào năm 2023, tăng từ khoảng 65 triệu USD của năm trước, theo PitchBook.
Bot phát hiện AI cũng có điểm mù
Điều này đă tạo nên một bầu không khí lo lắng và căng thẳng trong lớp học. Nhiều sinh viên phải dành thêm thời gian để đảm bảo bài làm của ḿnh không bị hiểu sai.
Nathan Mendoza, sinh viên ngành kỹ thuật hóa học tại Đại học California, sử dụng GPTZero để kiểm tra trước các bài viết của ḿnh, thậm chí phải chỉnh sửa lại cách diễn đạt để không bị nhận diện là AI.
Các công cụ hỗ trợ như Grammarly - một ứng dụng trị giá 13 tỷ USD, từng được sinh viên sử dụng rộng răi nhưng giờ đây cũng có thể làm tăng khả năng bài viết bị cho là do AI tạo ra.
Một số sinh viên đă gỡ bỏ các ứng dụng như Grammarly v́ lo ngại sử dụng chúng sẽ khiến bài viết của họ bị gắn mác AI. Trong khi đó, các dịch vụ như “AI Humanizer” đă trở thành giải pháp tạm thời.
Chúng có thể gợi ư ngữ pháp, chỉnh sửa cấu trúc và từ vựng nhằm giúp bài viết trở nên giống người viết hơn, qua đó có thể vượt qua các công cụ phát hiện AI. Tuy nhiên, điều này lại càng tạo ra một ṿng lặp giữa công cụ phát hiện và công cụ “nhân hóa” AI.Edward Tian, người sáng lập và CEO của GPTZero, cho biết: “Mọi máy phát hiện AI đều có điểm mù”. Tian đă xây dựng GPTZero vào đầu năm 2023 và hiện có 4 triệu người dùng tính đến tháng 7/2024.
Tŕnh phát hiện AI thường đánh giá độ phức tạp trong văn bản để xem là người hay máy viết. Giáo sư khoa học dữ liệu y sinh James Zou tại Đại học Stanford cho biết: “Nếu từ ngữ mang hàm ư chung chung, có tính công thức hơn, văn bản đó có nguy cơ bị gắn mác là AI viết cao hơn”.
Đơn cử như website phát hiện AI QuillBot khuyến cáo rằng “nội dung do AI tạo ra có thể chứa các từ lặp đi lặp lại, cách diễn đạt vụng về và mạch viết không tự nhiên, bị ngắt quăng”.
Trong khi đó, GPTZero lại đo lường mức độ phức tạp thay đổi xuyên suốt một văn bản. Theo công ty, không giống như AI, “mọi người thường thay đổi cách viết câu và diễn đạt rất nhiều lần trong suốt một tài liệu”.
Theo Bloomberg, học sinh giờ đây đang phải đối mặt với nỗi lo bị gán ghép với những lời buộc tội “do AI tạo ra” mà không có cơ hội để tự minh oan. Những người như Olmsted thận trọng đến mức phải dùng Google Docs, ghi lại toàn bộ quá tŕnh làm bài của ḿnh để có bằng chứng chứng minh.
Với nhiều người, AI không phải là điều cần loại bỏ mà là một công cụ cần được sử dụng thông minh và linh hoạt hơn. Adam Lloyd, giáo sư tiếng Anh tại Đại học Maryland, cho rằng thay v́ cấm cản, giáo viên cần có một cái nh́n khách quan hơn.
“Việc xem AI là thứ cần phải loại bỏ khỏi lớp học hoặc không khuyến khích học sinh sử dụng là một sai lầm”, ông nói. Bởi lẽ, công nghệ là một phần không thể tránh khỏi của tương lai.
|
|