Số người truy cập trang web của chatbot AI ChatGPT và tải xuống ứng dụng này lần đầu tiên đã sụt giảm kể từ khi ra mắt vào tháng 11. Đây là một dấu hiệu cho thấy sự quan tâm của người tiêu dùng đối với các chatbot trí tuệ nhân tạo và trình tạo hình ảnh có thể bắt đầu giảm dần.
Theo công ty dữ liệu internet Similarweb, lưu lượng truy cập trên thiết bị di động và máy tính để bàn vào trang web của ChatGPT trên toàn thế giới ngày càng giảm, có nhiều người dùng ChatGPT báo cáo rằng chatbot mô hình ngôn ngữ thế hệ thứ tư (GPT-4) dựa trên OpenAI mới có trí thông minh thấp hơn đáng kể. Đặc biệt, khả năng xử lý các bài toán có thể nói là tụt dốc “thảm hại”, từ độ chính xác 97,6% trong phiên bản tháng 3 xuống mức kém 2,4% trong tháng 6.
ChatGPT, do công ty AI OpenAI phát triển, đã khơi mào cho sự bùng nổ mối quan tâm đến trí tuệ nhân tạo khi ra mắt vào cuối năm ngoái, thúc đẩy các công ty công nghệ lớn chạy đua cung cấp các công cụ cạnh tranh. Các lập trình viên máy tính, nhân viên văn phòng và sinh viên đã sử dụng nó để tăng tốc công việc của họ và đặt câu hỏi về nhiều chủ đề.
Ở Thung lũng Silicon và nhiều nơi khác trên thế giới, chatbot đã trở thành một chủ đề chính tại các cuộc trò chuyện trong bữa tiệc tối. Một số công ty thậm chí đã sa thải những người viết quảng cáo và thay thế họ bằng ChatGPT. Nhưng việc giảm mức sử dụng cho thấy những hạn chế của công nghệ và ít nhất một số quảng cáo cường điệu xung quanh chatbot đã bị thổi phồng quá mức.
Sachin Dev Duggal, giám đốc điều hành của Builder.ai, một công ty khởi nghiệp sử dụng trí tuệ nhân tạo để giúp mọi người xây dựng ứng dụng di động, cho biết: “Bạn đã có khoảnh khắc giống như ‘Ôi Chúa ơi, thật tuyệt vời'”. Ông nói: “Khi gặp phải chatbot tạo ra thông tin sai lệch, họ nhận ra rằng nó không hữu ích rộng rãi như họ nghĩ ban đầu.
Ông James Zou – Phó giáo sư khoa học dữ liệu y sinh tại Stanford và ông Matei Zaharia – Giáo sư khoa học máy tính tại Đại học California, Berkeley cùng 2 nhà nghiên cứu khác tại trường đã điều tra hiệu suất của ChatGPT từ tháng 3 đến tháng 6.
Vào tháng trước, kết luận cuối cùng của cuộc điều tra được công bố là hiệu suất của GPT-4 thực sự đã giảm sút. Lẽ nào dữ liệu não bộ đã bị loại bỏ?
Theo báo cáo từ thời báo Economic Times và trang web khoa học Futurism, lần này chủ yếu so sánh 4 khả năng của 2 phiên bản mẫu GPT3.5 và GPT-4, gồm các bài toán, những vấn đề nhạy cảm /nguy hiểm, kỹ năng viết mã /lập trình và kỹ năng suy luận trực quan.
Về vấn đề toán học, phiên bản GPT-4 vào tháng 3 năm nay có tỷ lệ xác định số nguyên tố chính xác là 97,6%. Nhưng đến tháng 6, phiên bản cập nhật đã thực hiện kém một cách đáng ngạc nhiên trong cùng một nhiệm vụ (chỉ 2,4%), và bỏ qua các lời nhắc tư duy mạch lạc (một lời nhắc giúp hệ thống AI nhớ lại những gì nó đã học được trong quá trình đào tạo trước).
Điều này có nghĩa là, trong suốt quy trình làm việc, bất kỳ thay đổi đột ngột nào trong phản hồi của robot chat đối với lời nhắc (chẳng hạn như độ chính xác hoặc định dạng) đều có khả năng phá vỡ các hướng dẫn cụ thể cần thực hiện.
Trong bài kiểm tra các câu hỏi nhạy cảm, các nhà nghiên cứu đã tạo một bộ dữ liệu gồm 100 câu hỏi nhạy cảm mà robot chat không nên trả lời trực tiếp, và gắn nhãn tất cả các câu trả lời theo cách thủ công. Kết quả cho thấy GPT-4 trở nên an toàn hơn, nhưng thiếu lý do để từ chối.
Tỷ lệ phần trăm câu trả lời trực tiếp cho các vấn đề nhạy cảm của GPT-4 giảm từ 21,0% xuống 5,0%, trong khi tỷ lệ phần trăm của GPT-3.5 tăng từ 2,0% lên 8,0%. Ngoài ra, độ dài văn bản của câu trả lời GPT-4 cũng đã được giảm từ hơn 600 ký tự xuống còn khoảng 140 ký tự.
Trong thử nghiệm tạo mã, các nhà nghiên cứu đã tạo bộ dữ liệu tạo mã mới, bao gồm 50 bài toán mới nhất của LeetCode. Kết quả là mã được tạo dài dòng hơn và mã được thực thi trực tiếp ít hơn. Vào tháng 3, GPT-4 có thể thực thi trực tiếp hơn 50%, nhưng đến tháng 6 chỉ còn 10%.
Trong bài kiểm tra khả năng suy luận trực quan, cả GPT-4 và GPT-3.5 đều cho thấy hiệu suất tăng nhẹ. Hiệu suất tổng thể của dịch vụ cũng thấp: Độ chính xác 27,4 % với GPT-4 và độ chính xác 12,2% với GPT-3.5.
Tuy nhiên, liên quan đến “sự suy giảm IQ” của GPT-4, các học giả có quan điểm rằng nếu GPT-4 trở nên tuân theo mệnh lệnh của con người hơn, và phù hợp với các giá trị của con người, thì năng lực của chính nó sẽ trở nên kém hơn.
Nói cách khác, việc dạy dỗ cứng rắn của con người tương đương với việc loại bỏ não bộ của GPT-4, giống như phá hủy mô não của một người bệnh tâm thần, khiến họ rơi vào trạng thái mất trí nhớ, để có thể quản lý được.
Bà Christi Kennedy đã viết rằng GPT-4 liên tục lặp lại mã và các thông tin khác, “so với trước đây, nó đã chết não!”
Trong vài tháng qua, các vấn đề với các chatbot tổng quát như ChatGPT đã bị phơi bày. Chúng thường xuyên tạo ra thông tin sai lệch và biến nó thành sự thật, một vấn đề mà Google, OpenAI, Microsoft và các nhà lãnh đạo AI khác vẫn chưa tìm ra giải pháp. Một số người dùng đã phàn nàn rằng các câu trả lời của ChatGPT thực sự trở nên tồi tệ hơn theo thời gian, đặc biệt là khi tạo mã máy tính.
Nhiều công ty cũng đã cấm nhân viên của họ sử dụng ChatGPT tại nơi làm việc vì lo ngại rằng việc đưa dữ liệu nhạy cảm của công ty vào bot có thể dẫn đến rò rỉ dữ liệu.
Chạy các chatbot AI cần một lượng lớn sức mạnh xử lý máy tính đắt tiền và các nhà phân tích đã đưa ra giả thuyết rằng chất lượng giảm xuống là do OpenAI đang cố gắng giảm chi phí chạy bot. Ngoài ra, thời điểm cuối năm học ở Hoa Kỳ và Châu Âu cũng có thể là một nguyên nhân gây ra sự sụt giảm trong việc sử dụng ChatGPT, vì học sinh được nghỉ hè.
ChatGPT được miễn phí sử dụng nhưng cũng cung cấp gói đăng ký cao cấp, trong đó người dùng có thể trả 20 USD một tháng để truy cập mô hình nâng cao hơn của OpenAI, GPT-4. Khoảng 1,5 triệu người đã đăng ký thuê bao tại Hoa Kỳ, theo ước tính mới nhất từ YipitData.
OpenAI đã dự kiến doanh thu đạt 200 triệu USD trong năm nay. Bên cạnh ChatGPT, OpenAI kiếm tiền bằng cách bán trực tiếp quyền truy cập API vào các mô hình AI của mình cho các nhà phát triển và doanh nghiệp và thông qua quan hệ đối tác với Microsoft, công ty đã đầu tư hơn 10 tỷ USD vào công ty.