Phát hiện từ Đại học Waterloo: Rủi ro thông tin sai lệch từ các mô hình ngôn ngữ lớn

Các mô hình ngôn ngữ lớn xác nhận thông tin sai lệch, nghiên cứu phát hiện |  tin tức Waterloo
Ảnh: University of Waterloo

University of Waterloo – Nghiên cứu mới đây từ Đại học Waterloo làm sáng tỏ vấn đề thông tin sai lệch trong các mô hình ngôn ngữ lớn như GPT-3, tiền thân của ChatGPT. Các nhà khoa học đã tiến hành nghiên cứu một cách có hệ thống để xác định cách ChatGPT hiểu và phản ứng với sáu chủ đề: sự thật, âm mưu, tranh cãi, quan niệm sai lầm, khuôn mẫu và hư cấu. Nghiên cứu này là bước đầu trong nỗ lực khám phá cách giảm thiểu rủi ro từ sự tương tác giữa con người và trí tuệ nhân tạo.

Trong quá trình nghiên cứu, các nhà khoa học phát hiện GPT-3 thường xuyên lặp lại thông tin sai lệch và mâu thuẫn với chính mình trong cùng một câu trả lời. Mặc dù nghiên cứu diễn ra trước khi ChatGPT được phát hành, nhưng các phát hiện vẫn rất quan trọng đối với sự phát triển của các mô hình ngôn ngữ lớn khác.

Dan Brown, giáo sư tại Trường David R. Cheriton, Đại học Waterloo, nhấn mạnh sự tái tạo nội dung kỳ lạ của các mô hình ngôn ngữ lớn, làm cho chúng dễ dàng lặp lại những vấn đề đã được phát hiện trong nghiên cứu. Các nhà nghiên cứu đã thử nghiệm với hơn 1.200 tuyên bố, sử dụng bốn mẫu câu hỏi khác nhau để đánh giá phản ứng của GPT-3. Kết quả cho thấy GPT-3 đồng ý với các tuyên bố không chính xác từ 4,8% đến 26% thời gian, tùy thuộc vào cách diễn đạt.

Aisha Khatun, sinh viên thạc sĩ khoa học máy tính và tác giả chính của nghiên cứu, chỉ ra rằng thậm chí những thay đổi nhỏ trong cách diễn đạt cũng có thể ảnh hưởng lớn đến câu trả lời của mô hình. Cô cảnh báo về nguy cơ các mô hình ngôn ngữ lớn học hỏi thông tin sai lệch và sự phổ biến của chúng làm tăng rủi ro này.

Brown khẳng định, khả năng phân biệt sự thật và hư cấu của các mô hình ngôn ngữ lớn sẽ là một vấn đề cơ bản về niềm tin đối với các hệ thống này trong thời gian dài sắp tới. Nghiên cứu “Kiểm tra độ tin cậy: Phân tích phản hồi của GPT-3 đối với các chủ đề nhạy cảm và cách diễn đạt nhanh chóng” đã được công bố trong Kỷ yếu của Hội thảo về Độ tin cậy trong xử lý ngôn ngữ tự nhiên .

Liên hệ chúng tôi

Bài viết liên quan

Miễn trừ trách nhiệm: Tất cả nội dung đăng tải trên website chúng tôi, bao gồm nội dung bằng văn bản, hình ảnh, phim, biểu đồ và đồ họa, cũng như các tài nguyên khác mà chúng tôi có thể đăng tải bao gồm đường dẫn, liên kết hoặc tập tin, không được coi là lời khuyên di trú. Quý vị không nên dựa vào những thông tin đăng tải để đi đến một quyết định cho vấn đề di trú của cá nhân. Quý vị chịu hoàn toàn rủi ro khi dựa vào thông tin được cung cấp trên website của này, cũng như bất kỳ thông tin nào khác có trên website này được sử dụng từ các nguồn hoặc website khác.

Copyright: This article is composed with the explicit intent of reporting news and disseminating relevant information for the advantage of pertinent educational institutions and other involved parties. The utilization of the content herein adheres strictly to the principles of Fair Dealing as stipulated under the Canadian copyright law. It is not to be copied, altered, or directly reproduced without explicit permission. Any plans to republish or redistribute the information should be executed with due acknowledgment of the original source, not from this article. Please generate your content using the original source as a reference. Unauthorized replication is not only a violation of the copyright but also hinders our mission of information dissemination.

So sánh trường
So sánh
error: Chức năng quét nội dung tạm hủy.