Secciones
Servicios
Destacamos
Que seamos capaces de interactuar con sistemas de inteligencia artificial de la forma más natural posible es uno de los mayores retos de quienes los desarrollan. Por eso, la voz es uno de los elementos clave: tanto en el reconocimiento de comandos como en la ... comunicación de resultados, para lo que es imprescindible un buen procesamiento del lenguaje natural. Si, además, la IA tiene una voz atractiva, mejor. Siri y Alexa, por ejemplo, han ido puliendo el tono robótico de sus voces femenina y masculina para hacerlas más naturales.
Pero puede que la última versión de ChatGPT se haya pasado de la raya, porque su asistente de voz, Sky, suena como Scarlett Johansson en el papel de asistente virtual de la película 'Her'. Teniendo en cuenta que la actriz no ha tenido nada que ver con el programa de OpenAI, el debate sobre la propiedad intelectual del material con el que se entrena la IA generativa ha vuelto a estallar. Aunque la empresa asegura que Johansson no tiene nada que ver con la voz de Sky, ayer decidió pausar el servicio, «uno de los más apreciados de los usuarios», y arrojar luz sobre cómo se genera la voz.
«Cada una de las cinco voces que se escuchan han sido cuidadosamente seleccionadas a través de un largo proceso que ha durado cinco meses y en el que se han involucrado actores de voz profesionales, agencias de talento, directores de cásting y consultores», explica OpenIA en un comunicado en el que hace hincapié en que quienes ponen la voz «son remunerados por encima de las tarifas del mercado, y lo seguirán siendo mientras se utilicen sus voces», tratando así de despejar los temores de los intérpretes que ven el peligro de ser sustituidos por la IA generativa.
La compañía no rehúye la polémica, y asegura que Sky «no imita la voz de Scarlett Johansson, sino que es la voz natural de otra actriz», aunque no revela de quién «para proteger su privacidad». Sí que detalla las cualidades que tiene, de acuerdo con los requerimientos para el trabajo: «Que pueda hablar múltiples idiomas, que suene atemporal, que resulte cercanas e inspire confianza, que sea carismática y rica en tonos, y que suene natural».
her
— Sam Altman (@sama) May 13, 2024
Siempre según la versión de OpenAI, se recibieron más de 400 currículos de voz y se hizo una criba para dar con 14 finalistas. Los cinco seleccionados grabaron sus muestras en septiembre del año pasado, y la IA genera el discurso con esos sonidos que dan voz al ChatGPT 4o. «Iremos añadiendo nuevas voces para responder mejor a los intereses y las preferencias de los usuarios», concluye OpenAI. De momento, ninguna será la que enamoró a Joaquin Phoenix.
¿Ya eres suscriptor/a? Inicia sesión
Publicidad
Publicidad
Te puede interesar
Publicidad
Publicidad
Esta funcionalidad es exclusiva para suscriptores.
Reporta un error en esta noticia
Comentar es una ventaja exclusiva para suscriptores
¿Ya eres suscriptor?
Inicia sesiónNecesitas ser suscriptor para poder votar.