Nhà sản xuất ChatGPT OpenAI cho biết hôm thứ Hai (13/5) rằng họ sẽ phát hành một mô hình AI mới có tên GPT-4o, có khả năng trò chuyện bằng giọng nói thực tế cũng như có thể tương tác qua văn bản và hình ảnh, động thái mới nhất của họ nhằm dẫn đầu trong cuộc đua thống trị thị trường kỹ thuật khẩn cấp.
Các nhà nghiên cứu của OpenAI đã trình bày tại một sự kiện phát trực tiếp rằng các khả năng âm thanh mới cho phép người dùng nói chuyện với ChatGPT và nhận được phản hồi theo thời gian thực mà không bị chậm trễ, cũng như làm gián đoạn ChatGPT khi nó đang nói.
“Cảm giác giống như AI trong phim… Nói chuyện với máy tính chưa bao giờ thực sự tự nhiên đối với tôi; bây giờ nó đã như vậy,” Giám đốc điều hành OpenAI Sam Altman viết trong một bài đăng trên blog.
Microsoft OpenAI được hỗ trợ phải đối mặt với sự cạnh tranh và áp lực ngày càng tăng trong việc mở rộng cơ sở người dùng của ChatGPT, sản phẩm chatbot phổ biến của họ đã khiến cả thế giới phải kinh ngạc với khả năng tạo ra nội dung bằng văn bản giống con người và mã phần mềm hàng đầu.
Tại sự kiện phát trực tiếp, các nhà nghiên cứu của OpenAI đã trình diễn khả năng trợ lý giọng nói mới của ChatGPT. Trong một bản demo, ChatGPT đã sử dụng khả năng thị giác và giọng nói của mình để nói chuyện với nhà nghiên cứu cách giải phương trình toán học trên một tờ giấy.
Giám đốc công nghệ của OpenAI, Mira Murati, cho biết tại sự kiện rằng mô hình mới sẽ được cung cấp miễn phí vì nó tiết kiệm chi phí hơn so với các mô hình trước đây của công ty.
Bà cho biết, người dùng GPT-4o trả phí sẽ có giới hạn dung lượng lớn hơn so với người dùng miễn phí của công ty. Công ty cho biết mẫu GPT-4o sẽ có mặt trong ChatGPT trong vài tuần tới.
Ngay sau khi ra mắt vào cuối năm 2022, ChatGPT được gọi là ứng dụng nhanh nhất từ trước đến nay đạt 100 triệu người dùng hoạt động hàng tháng. Tuy nhiên, theo công ty phân tích Sameweb , lưu lượng truy cập trên toàn thế giới vào trang web của ChatGPT đã tăng vọt trong năm qua và hiện chỉ mới quay trở lại mức cao nhất vào tháng 5/2023.