Tin tức, Tính năng mới

ChatGPT ra mắt tính năng thoại và tạo hình ảnh mới

2Q==

(RepuAI & ChatGPT.pro.vn) OpenAI tung ra các tính năng thoại và hình ảnh cho ChatGPT, làm cho các cuộc trò chuyện trở nên tự nhiên và trực quan hơn.

ĐIỂM CHÍNH

1. ChatGPT hiện có khả năng thoại và sinh hình ảnh.
2. Các tính năng mới cho phép trò chuyện trực quan hơn với AI.
3. OpenAI đang dần triển khai các tính năng tiên tiến với trọng tâm là an toàn.

OpenAI ra mắt tính năng thoại và hình ảnh mới

OpenAI đã bắt đầu tung ra các tính năng thoại và hình ảnh mới cho chatbot hỗ trợ AI phổ biến của mình, ChatGPT.

Những tính năng mới này cho phép bạn có những cuộc trò chuyện tự nhiên hơn với ChatGPT bằng cách nói chuyện với ChatGPT và khả năng tạo hình ảnh của ứng dụng này.

Điều này cho phép bạn có nhiều cách hơn để sử dụng ChatGPT trong các thói quen hàng ngày. Ví dụ, trong khi đi du lịch, bạn có thể gửi cho ChatGPT một bức ảnh về một khoảnh khắc đáng nhớ và trò chuyện với ChatGPT theo thời gian thực về bức hình cũng như khoảnh khắc này.

Tương tự, ở nhà, bạn có thể chụp ảnh nội dung tủ lạnh của mình và thảo luận về ý tưởng bữa ăn hoặc yêu cầu công thức từng bước (nghe phê nhỉ, đỡ bao thời gian suy nghĩ hôm nay ăn gì? 😀 )

Trong những tuần tới, OpenAI sẽ triển khai các tính năng này cho người dùng Plus và Enterprise. Khả năng giọng nói sẽ có sẵn trên các ứng dụng di động, trong khi chức năng hình ảnh sẽ có thể truy cập được trên tất cả các nền tảng (ứng dụng cũng như trình duyệt Web).

img 8441

ChatGPT hỗ trợ Đầu vào bằng giọng nói cho phép trò chuyện hai chiều

Tính năng giọng nói mới cho phép bạn nói chuyện với ChatGPT, giờ đây có thể phản hồi bằng âm thanh bằng một trong năm giọng nói tổng hợp.

Bạn có thể chọn sử dụng tính năng này thông qua cài đặt ứng dụng di động iOS và Android để bật giọng nói.

Theo OpenAI, khả năng giọng nói sử dụng mô hình chuyển văn bản thành giọng nói tiên tiến được đào tạo trên các mẫu từ các diễn viên lồng tiếng. Để nhận dạng giọng nói, nó tận dụng Whisper, hệ thống giọng nói nguồn mở của OpenAI.

Sử dụng Hình ảnh để cung cấp bối cảnh 1 cách trực quan cho ChatGPT

Bây giờ bạn có thể hiển thị ChatGPT một hoặc nhiều hình ảnh để cung cấp bối cảnh trực quan và tập trung cuộc trò chuyện.

Ví dụ, chia sẻ ảnh của một thiết bị bị hỏng có thể giúp ChatGPT chẩn đoán sự cố và đề xuất các bản sửa lỗi. Trên thiết bị di động, một công cụ vẽ cho phép khoanh tròn hoặc chỉ ra các phần cụ thể của hình ảnh.

Các tính năng hình ảnh sử dụng phiên bản đa phương thức (multimodal) GPT-3.5 và GPT-4 được tinh chỉnh để hỗ trợ đầu vào bằng hình ảnh. OpenAI đã kiểm tra rộng rãi khả năng hình ảnh về các rủi ro an toàn trước khi triển khai.

Triển khai dần dần, tập trung vào sự an toàn

OpenAI lưu ý rằng họ đang thực hiện một cách tiếp cận dần dần để triển khai các tính năng này.

Công nghệ giọng nói mới mở ra các ứng dụng sáng tạo nhưng cũng có những rủi ro như mạo danh các nhân vật của công chúng. Để giảm thiểu rủi ro, giọng nói hiện chỉ giới hạn trong trò chuyện.

Đối với hình ảnh, OpenAI cho biết họ đã hạn chế khả năng của ChatGPT trong việc phân tích trực tiếp con người trong ảnh và tư vấn chống lại các trường hợp sử dụng có nguy cơ cao mà không cần xác minh.

Kết luận

Khả năng thoại và hình ảnh mới của ChatGPT cung cấp cho người dùng một cách tự nhiên hơn để tương tác với hệ thống AI.

Tuy nhiên, OpenAI đang triển khai những tính năng mới này từ từ và liên tục đo lường. Ban đầu sẽ hạn chế tiếp cận với những tính năng mới này chỉ cho 1 số người dùng và mở rộng từ từ vì những rủi ro tiềm ẩn.

Khi các tính năng này mở rộng, bạn cần nhớ những hạn chế của ChatGPT và tránh ứng dụng nếu thấy rủi ro cao mà không thể xác minh.

Nguồn: ChatGPT.pro.vn & RepuAI biên tập từ Search Engine Land

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *