Phát hiện từ Đại học Waterloo: Rủi ro thông tin sai lệch từ các mô hình ngôn ngữ lớn

Ngày 21 tháng 12 năm 2023

Giáo Dục Canada

Ảnh: University of Waterloo

University of Waterloo – Nghiên cứu mới đây từ Đại học Waterloo làm sáng tỏ vấn đề thông tin sai lệch trong các mô hình ngôn ngữ lớn như GPT-3, tiền thân của ChatGPT. Các nhà khoa học đã tiến hành nghiên cứu một cách có hệ thống để xác định cách ChatGPT hiểu và phản ứng với sáu chủ đề: sự thật, âm mưu, tranh cãi, quan niệm sai lầm, khuôn mẫu và hư cấu. Nghiên cứu này là bước đầu trong nỗ lực khám phá cách giảm thiểu rủi ro từ sự tương tác giữa con người và trí tuệ nhân tạo.

Trong quá trình nghiên cứu, các nhà khoa học phát hiện GPT-3 thường xuyên lặp lại thông tin sai lệch và mâu thuẫn với chính mình trong cùng một câu trả lời. Mặc dù nghiên cứu diễn ra trước khi ChatGPT được phát hành, nhưng các phát hiện vẫn rất quan trọng đối với sự phát triển của các mô hình ngôn ngữ lớn khác.

Dan Brown, giáo sư tại Trường David R. Cheriton, Đại học Waterloo, nhấn mạnh sự tái tạo nội dung kỳ lạ của các mô hình ngôn ngữ lớn, làm cho chúng dễ dàng lặp lại những vấn đề đã được phát hiện trong nghiên cứu. Các nhà nghiên cứu đã thử nghiệm với hơn 1.200 tuyên bố, sử dụng bốn mẫu câu hỏi khác nhau để đánh giá phản ứng của GPT-3. Kết quả cho thấy GPT-3 đồng ý với các tuyên bố không chính xác từ 4,8% đến 26% thời gian, tùy thuộc vào cách diễn đạt.

Aisha Khatun, sinh viên thạc sĩ khoa học máy tính và tác giả chính của nghiên cứu, chỉ ra rằng thậm chí những thay đổi nhỏ trong cách diễn đạt cũng có thể ảnh hưởng lớn đến câu trả lời của mô hình. Cô cảnh báo về nguy cơ các mô hình ngôn ngữ lớn học hỏi thông tin sai lệch và sự phổ biến của chúng làm tăng rủi ro này.

Brown khẳng định, khả năng phân biệt sự thật và hư cấu của các mô hình ngôn ngữ lớn sẽ là một vấn đề cơ bản về niềm tin đối với các hệ thống này trong thời gian dài sắp tới. Nghiên cứu “Kiểm tra độ tin cậy: Phân tích phản hồi của GPT-3 đối với các chủ đề nhạy cảm và cách diễn đạt nhanh chóng” đã được công bố trong Kỷ yếu của Hội thảo về Độ tin cậy trong xử lý ngôn ngữ tự nhiên .

Liên hệ chúng tôi

Bài viết liên quan

Các nhà nghiên cứu của U of T thiết kế phương pháp tái chế thép mới có thể giảm lượng khí thải carbon của ngành công nghiệp

Đại học Toronto phát triển phương pháp tái chế thép giảm lượng khí thải carbon.

Hai sinh viên đang cầm tờ chương trình tại Ngày hội mở cửa trước biểu ngữ Doanh nghiệp xã hội và Quản lý phi lợi nhuận

STU giới thiệu chương trình Khởi nghiệp Xã hội và Quản lý Phi lợi nhuận

COTR triển khai chứng chỉ mới cho học kỳ mùa thu

College of the Rockies giới thiệu chứng chỉ Nghệ thuật, Nhân văn và Khoa học Xã hội mới

Lethbridge Polytechnic sẽ cung cấp các chứng chỉ mới về Y tá chăm sóc ban đầu, Nghệ thuật và Khoa học tổng quát và Nghề

Humber Hawks cất cánh với sự công nhận chương trình thể thao quốc gia hàng đầu

Humber Hawks tại Cao Đẳng Humber được vinh danh là chương trình thể thao hàng đầu của CCAA

Đại học Algoma và Altitude Accelerator hợp tác thúc đẩy sự đổi mới của sinh viên

Đại học Algoma hợp tác với Altitude Accelerator thúc đẩy đổi mới và tăng trưởng kinh doanh

Giải đấu Golf thường niên của Cao đẳng Portage gây quỹ được 23.400 đô la để hỗ trợ học bổng cho sinh viên

Giải đấu Golf thường niên của Cao đẳng Portage quyên góp 23.400 đô la cho Quỹ học bổng

NSCAD ra mắt Kế hoạch chiến lược sáng tạo nghiêm túc

NSCAD công bố Kế hoạch chiến lược sáng tạo thận trọng 2024-2030

Cao đẳng Camosun Trao 600.000 Đô Tài Trợ Nghiên Cứu Ứng Dụng

Miễn trừ trách nhiệm: Tất cả nội dung đăng tải trên website chúng tôi, bao gồm nội dung bằng văn bản, hình ảnh, phim, biểu đồ và đồ họa, cũng như các tài nguyên khác mà chúng tôi có thể đăng tải bao gồm đường dẫn, liên kết hoặc tập tin, không được coi là lời khuyên di trú. Quý vị không nên dựa vào những thông tin đăng tải để đi đến một quyết định cho vấn đề di trú của cá nhân. Quý vị chịu hoàn toàn rủi ro khi dựa vào thông tin được cung cấp trên website của này, cũng như bất kỳ thông tin nào khác có trên website này được sử dụng từ các nguồn hoặc website khác.

Copyright: This article is composed with the explicit intent of reporting news and disseminating relevant information for the advantage of pertinent educational institutions and other involved parties. The utilization of the content herein adheres strictly to the principles of Fair Dealing as stipulated under the Canadian copyright law. It is not to be copied, altered, or directly reproduced without explicit permission. Any plans to republish or redistribute the information should be executed with due acknowledgment of the original source, not from this article. Please generate your content using the original source as a reference. Unauthorized replication is not only a violation of the copyright but also hinders our mission of information dissemination.

Phát hiện từ Đại học Waterloo: Rủi ro thông tin sai lệch từ các mô hình ngôn ngữ lớn

Liên hệ chúng tôi

Bài viết liên quan

So sánh trường