Tin KHCN nước ngoài
ChatGPT của OpenAI được nâng cấp với giọng nói nhân văn và hiểu cảm xúc (13/08/2024)
-   +   A-   A+   In  

Chế độ giọng nói của ChatGPT không chỉ được thiết kế để trở nên tự nhiên hơn, giống với giọng nói con người mà còn có khả năng nhận biết cảm xúc và cười đùa cùng người dùng.

Vừa qua, OpenAI đã gây ấn tượng mạnh mẽ khi ra mắt phiên bản mới của ChatGPT với chế độ giọng nói nâng cao. Khác với những giọng nói AI trước đây còn mang tính máy móc, giọng nói trong phiên bản này đã được cải tiến để tự nhiên hơn, gần giống với con người và có thể cười đùa cũng như hiểu được cảm xúc của người sử dụng. Chế độ giọng nói mới không chỉ phản hồi ngay lập tức mà còn có khả năng điều chỉnh khi bị ngắt lời. Ngoài ra, ChatGPT phiên bản mới có thể đánh giá trạng thái cảm xúc của người nói dựa trên giọng điệu của họ.

Trong một đoạn video giới thiệu phiên bản mới, OpenAI đã khéo léo trình bày chế độ giọng nói nâng cao thông qua một tình huống chuẩn bị đi phỏng vấn: trong đoạn video này, nhân vật Rocky bắt đầu cuộc trò chuyện với AI bằng cách hỏi về tình trạng sức khỏe của nó. AI đáp lại với một giọng điệu vui vẻ và hỏi thăm ngược lại Rocky. Khi Rocky chia sẻ rằng sắp có buổi phỏng vấn tại OpenAI, AI đã đáp lại một cách hóm hỉnh, thể hiện rằng nó hiểu rõ về công ty này và khuyến khích Rocky. Rocky sau đó hỏi về trang phục của mình, và AI đã đưa ra lời khuyên hài hước rằng Rocky có vẻ như đã làm việc suốt đêm, gợi ý rằng nên chăm chút thêm ngoại hình trước khi đi phỏng vấn. Khi Rocky quyết định đội mũ, AI cũng không quên nhận xét một cách khéo léo rằng đó là một lựa chọn táo bạo, nhưng có thể không phù hợp với buổi phỏng vấn. Phản hồi của AI trong video này được đánh giá là hóm hỉnh nhưng vẫn chân thật, tạo cảm giác thoải mái và thân thiện cho người dùng.

Video quảng bá đã thu hút nhiều sự chú ý và phản hồi từ người xem trên Youtube. Một người nhận xét rằng đoạn video này là yêu thích nhất của họ, vì nó cho thấy ChatGPT có khả năng nhận biết ngoại hình của người dùng và truyền đạt điều đó một cách tinh tế, thể hiện trí tuệ cảm xúc cao. Một người khác thì hài hước cho rằng AI này còn có cá tính hơn cả họ, điều này khiến họ cảm thấy không thoải mái.

Sự ra mắt của chế độ giọng nói nâng cao cũng dẫn đến nhiều câu hỏi lớn từ phía người dùng: Công cụ này có sở hữu trí tuệ cảm xúc riêng không? Liệu đây có phải là tương lai của giao tiếp giữa con người và máy móc? Và liệu người dùng có dần trở nên quá phụ thuộc vào trợ lý AI này không?

Từ tháng 8/2024, một số người dùng ChatGPT Plus đã được trải nghiệm chế độ giọng nói nâng cao này. OpenAI dự định sẽ mở rộng tính năng này cho tất cả người dùng trả phí vào mùa thu năm nay.

Để đạt được khả năng phản hồi ngay lập tức cho hàng triệu người dùng cùng lúc, OpenAI đã phải hoãn việc triển khai chế độ giọng nói nâng cao thêm hai tháng. Trong quá trình đó, công ty đã thử nghiệm tính năng này với hơn 100 người dùng, đại diện cho 29 vùng địa lý và nói tổng cộng 45 ngôn ngữ khác nhau. Đây là một phần trong nỗ lực của công ty nhằm đảm bảo rằng công cụ này có thể phục vụ đa dạng người dùng với các đặc điểm ngôn ngữ và văn hóa khác nhau.

OpenAI cũng đã áp dụng nhiều biện pháp để đảm bảo rằng chế độ giọng nói sẽ không bị lạm dụng. Người dùng chỉ có thể sử dụng bốn tùy chọn giọng nói được lập trình sẵn bởi các diễn viên lồng tiếng, nhằm tránh việc mạo danh. Chế độ giọng nói này cũng sẽ chặn các yêu cầu tạo ra âm nhạc hoặc các âm thanh có bản quyền và tuân theo các quy định tương tự như chế độ văn bản của ChatGPT để ngăn chặn việc tạo ra những nội dung bất hợp pháp.

Chế độ giọng nói nâng cao của ChatGPT là một bước đột phá trong công nghệ. Khả năng tương tác tự nhiên và phản hồi theo thời gian thực của công cụ này đang đặt ra những thách thức mới cho các đối thủ cạnh tranh trong ngành.

Nguồn: NASATI

Số lượt đọc: 969

Về trang trước Về đầu trang