(Adnkronos) – OpenAI ha annunciato l'inizio della distribuzione della versione alpha del nuovo Advanced Voice Mode a un piccolo gruppo di utenti di ChatGPT Plus. La nuova funziona implementa conversazioni più naturali e in tempo reale, con la capacità di interrompere in qualsiasi momento e di percepire e rispondere alle emozioni dell'utente.
Nel corso delle prossime settimane, OpenAI espanderà gradualmente l'accesso a più utenti Plus, con l'obiettivo di rendere disponibile questa funzionalità a tutti gli utenti Plus in autunno. Coloro che partecipano alla versione alpha riceveranno un avviso nell'app ChatGPT e un'email con le istruzioni su come utilizzarla. Tuttavia, la condivisione di video e schermo non sarà inclusa nella versione alpha, ma verrà lanciata successivamente.
OpenAI si è concentrata sulla qualità e sicurezza delle conversazioni vocali GPT-4o per garantire un'esperienza ottimale agli utenti di ChatGPT. La capacità del modello di supportare milioni di conversazioni vocali simultanee in tempo reale è stata rafforzata, mantenendo bassa latenza e alta qualità. A giugno, OpenAI ha annunciato miglioramenti nella capacità del modello di rilevare e rifiutare contenuti inappropriati. Negli ultimi due mesi, le capacità vocali del modello sono state testate con oltre 100 red teamer esterni, che parlano collettivamente 45 lingue diverse e rappresentano 29 aree geografiche. Basandosi sul feedback di 100 red teamer esterni, che parlano collettivamente 45 lingue diverse e rappresentano 29 aree geografiche e sui propri test interni, OpenAI ha implementato diverse misure di sicurezza.
Advanced Voice Mode utilizzerà quattro diverse voci preimpostate, create in collaborazione con doppiatori, per garantire che ChatGPT non possa impersonare altre persone, inclusi personaggi pubblici, bloccando output che differiscono da queste voci preimpostate. Inoltre sono stati aggiunti nuovi filtri per riconoscere e bloccare richieste di generare musica o altri contenuti audio protetti da copyright. Le medesime tecniche di sicurezza applicate alla modalità testuale sono state estese alle conversazioni vocali, assicurando che GPT-4o sia conforme alle leggi applicabili e non generi contenuti dannosi. —tecnologiawebinfo@adnkronos.com (Web Info)
Commenta per primo