صوت "شات جي بي تي" أصبح أكثر تشبها بالبشر

أعلنت شركة الذكاء الاصطناعي "OpenAI"، يوم السبت، تحديث "وضع الصوت المتقدم" (Advanced Voice Mode) في روبوت الدردشة شات جي بي تي.
وسيجعل هذا التحديث صوت "شات جي بي تي" طبيعيًا أكثر ومشابهًا أكثر بالبشر.
وبعد الإعلان عن التحديث، أصبحت ردود "شات جي بي تي" الصوتية تتضمن إيقاعًا واقعيًا يشمل التوقفات والتأكيدات، بالإضافة إلى تعبير أكثر دقة عن بعض المشاعر مثل التعاطف والسخرية، بحسب تقرير لموقع "Neowin" المتخصص في أخبار التكنولوجيا، اطلعت عليه "العربية Business".
ويُقدم هذا التحديث أيضًا دعمًا للترجمة، حيث يُمكن لمستخدمي "شات جي بي تي" الآن استخدام "وضع الصوت المتقدم" للترجمة بين اللغات.
وكل ما يحتاج إليه المستخدم هو أن يطلب من "شات جي بي تي" البدء في الترجمة إلى لغة محددة، وسيستمر في ترجمة كل ما سيقوله المستخدم طوال المحادثة حتى يُطلب منه التوقف. وتُغني هذه الميزة فعليًا عن الحاجة إلى تطبيقات الترجمة الصوتية المُخصصة.
ويتوفر حاليًا "وضع الصوت المتقدم" المُحدث فقط لمستخدمي حسابات "شات جي بي تي" المدفوعة.
وأشارت "OpenAI" إلى أن هذا التحديث الأخير قد يؤدي أحيانًا إلى انخفاض طفيف في جودة الصوت، مثل تغيرات غير متوقعة في إيقاع وطبقة الصوت، وتوقعت تحسن ثبات جودة الصوت مع مرور الوقت.
وكانت "OpenAI" طرحت "وضع الصوت المتقدم" في "شات جي بي تي" العام الماضي، بالتزامن مع إطلاق نموذج الذكاء الاصطناعي "GPT-4o". ويتيح هذا الوضع لروبوت الدردشة الرد على مدخلات صوتية في وقت يصل إلى أقل من 232 مللي ثانية، بمتوسط يبلغ 320 مللي ثانية، وهو مشابه لوقت استجابة الإنسان في المحادثة العادية.