- Tham gia
- 11/12/2023
- Bài viết
- 182
Rạng sáng ngày 14-5 (theo giờ Việt Nam), OpenAI đã chính thức ra mắt GPT-4o, một mô hình AI hoàn toàn mới mà công ty cho biết là có thể nói, cười, hát và nhìn như con người.
Công ty cũng đang phát hành một ứng dụng dành cho máy tính để bàn cho ChatGPT. Mô hình GPT-4o cũng có khả năng nhận biết cảm xúc, cho phép bạn ngắt lời giữa chừng và phản hồi nhanh gần như con người trong các cuộc trò chuyện.
Chia sẻ trong buổi thuyết trình trực tiếp, CTO Mira Murati của OpenAI cho biết người dùng miễn phí cũng có thể sử dụng GPT-4o với một số hạn chế. “Đây là lần đầu tiên chúng tôi đạt được một bước tiến lớn về mặt dễ sử dụng.”
Để sử dụng GPT-4o miễn phí, bạn chỉ cần mở ChatGPT trên trình duyệt web, sau đó bấm Thử ngay bây giờ trong cửa sổ hiện ra.
Trong buổi thuyết trình, OpenAI đã giới thiệu tính năng dịch trực tiếp của GPT-4o giữa tiếng Anh và tiếng Ý, giúp một nhà nghiên cứu giải phương trình tuyến tính trong thời gian thực trên giấy và cung cấp hướng dẫn về cách thở sâu cho một giám đốc điều hành OpenAI khác chỉ bằng cách lắng nghe hơi thở của anh ta.
Chữ “o” trong GPT-4o là viết tắt của “omni”, ám chỉ khả năng đa phương thức của mô hình. OpenAI cho biết GPT-4o đã được đào tạo về văn bản, hình ảnh và âm thanh, có nghĩa là tất cả đầu vào và đầu ra đều được xử lý bởi cùng một mạng thần kinh. Điều này khác với các mẫu trước đây của công ty, GPT-3.5 và GPT-4, vốn cho phép người dùng đặt câu hỏi chỉ bằng cách nói nhưng sau đó chuyển lời nói thành văn bản. Điều này đã loại bỏ giai điệu và cảm xúc, đồng thời làm cho quá trình tương tác diễn ra chậm hơn.
OpenAI sẽ cung cấp mô hình mới cho tất cả mọi người, bao gồm cả người dùng ChatGPT miễn phí, trong vài tuần tới, đồng thời phát hành phiên bản ChatGPT dành cho máy tính để bàn, ban đầu dành cho Mac, người dùng trả phí sẽ có quyền truy cập bắt đầu từ hôm nay.
Thông báo của OpenAI được đưa ra một ngày trước Google I/O, hội nghị nhà phát triển thường niên của Google (14-5). Ngay sau khi OpenAI tiết lộ GPT-4o, Google đã giới thiệu một phiên bản của Gemini, chatbot AI của riêng họ, với các khả năng tương tự.
Nguồn tin: Báo Pháp Luật TP.HCM
Công ty cũng đang phát hành một ứng dụng dành cho máy tính để bàn cho ChatGPT. Mô hình GPT-4o cũng có khả năng nhận biết cảm xúc, cho phép bạn ngắt lời giữa chừng và phản hồi nhanh gần như con người trong các cuộc trò chuyện.
Chia sẻ trong buổi thuyết trình trực tiếp, CTO Mira Murati của OpenAI cho biết người dùng miễn phí cũng có thể sử dụng GPT-4o với một số hạn chế. “Đây là lần đầu tiên chúng tôi đạt được một bước tiến lớn về mặt dễ sử dụng.”
Để sử dụng GPT-4o miễn phí, bạn chỉ cần mở ChatGPT trên trình duyệt web, sau đó bấm Thử ngay bây giờ trong cửa sổ hiện ra.
Trong buổi thuyết trình, OpenAI đã giới thiệu tính năng dịch trực tiếp của GPT-4o giữa tiếng Anh và tiếng Ý, giúp một nhà nghiên cứu giải phương trình tuyến tính trong thời gian thực trên giấy và cung cấp hướng dẫn về cách thở sâu cho một giám đốc điều hành OpenAI khác chỉ bằng cách lắng nghe hơi thở của anh ta.
Chữ “o” trong GPT-4o là viết tắt của “omni”, ám chỉ khả năng đa phương thức của mô hình. OpenAI cho biết GPT-4o đã được đào tạo về văn bản, hình ảnh và âm thanh, có nghĩa là tất cả đầu vào và đầu ra đều được xử lý bởi cùng một mạng thần kinh. Điều này khác với các mẫu trước đây của công ty, GPT-3.5 và GPT-4, vốn cho phép người dùng đặt câu hỏi chỉ bằng cách nói nhưng sau đó chuyển lời nói thành văn bản. Điều này đã loại bỏ giai điệu và cảm xúc, đồng thời làm cho quá trình tương tác diễn ra chậm hơn.
OpenAI sẽ cung cấp mô hình mới cho tất cả mọi người, bao gồm cả người dùng ChatGPT miễn phí, trong vài tuần tới, đồng thời phát hành phiên bản ChatGPT dành cho máy tính để bàn, ban đầu dành cho Mac, người dùng trả phí sẽ có quyền truy cập bắt đầu từ hôm nay.
Thông báo của OpenAI được đưa ra một ngày trước Google I/O, hội nghị nhà phát triển thường niên của Google (14-5). Ngay sau khi OpenAI tiết lộ GPT-4o, Google đã giới thiệu một phiên bản của Gemini, chatbot AI của riêng họ, với các khả năng tương tự.
Nguồn tin: Báo Pháp Luật TP.HCM