Smart13

Nueva inteligencia artificial clona voces a partir de audios de tan solo 15 segundos de duración

Inteligencia artificial Voice Engine

Bárbara Valladares V.

2 de Abril de 2024 - 12:46 hrs.

Esta nueva inteligencia artificial viene a exigir nuevas reglas en el juego, con tal de que no se use de manera maliciosa.

Señal
T13 En Vivo

La inteligencia artificial está creciendo a pasos agigantados y nadie puede detener su avance, a pesar de las reiteradas peticiones de los expertos en la materia y la insistencia de las Naciones Unidas en regular su uso.

Esto se refleja en el hecho de que cada día surgen nuevas plataformas que operan con esta tecnología y que, por lo general, superan a las ya existentes. La que ahora está en boca de todos es Voice Engine, una nueva herramienta creada por OpenAI (los mismos propietarios de ChatGPT), que utiliza entrada de texto y una muestra de audio de 15 segundos para generar un habla natural que se asemeja estrechamente al hablante original.

Si bien no está disponible para todas las personas, la inteligencia artificial tras Voice Engine sorprende por su increíble capacidad de imitar a la perfección la voz de alguien con solo escuchar 15 segundos de audio.

OpenAI explicó en su página web que desarrollaron esta plataforma por primera vez a finales de 2022 para "alimentar las voces predefinidas disponibles en la API de texto a voz, así como en ChatGPT Voice y Read Aloud". Sin embargo, destacan que ahora mismo están adoptando un enfoque cauteloso e informado para un lanzamiento más amplio "debido al potencial de abuso de la voz sintética".

Por lo mismo, Voice Engine todavía no está disponible porque la compañía espera iniciar conversaciones con autoridades y expertos sobre el "despliegue responsable de las voces sintéticas y cómo la sociedad puede adaptarse a estas nuevas capacidades".

¿Cuándo será lanzada esta inteligencia artificial?

Voice Engine no tiene fecha de lanzamiento porque OpenAI todavía no está seguro de ponerla a disposición de todos los usuarios de internet porque, según explican, "en línea con nuestro enfoque en la seguridad de la IA y nuestros compromisos voluntarios, hemos decidido presentar pero no lanzar ampliamente esta tecnología en este momento".

En tanto, antes de poner esta plataforma a disposición del público, la compañía sugiere fortalecer la resistencia social contra los desafíos que traen los modelos generativos cada vez más convincentes, como:

Eliminar gradualmente la autenticación basada en voz como medida de seguridad para acceder a cuentas bancarias y otra información sensible.
Explorar políticas para proteger el uso de las voces de las personas en la inteligencia artificial.
Educar al público sobre la comprensión de las capacidades y limitaciones de las tecnologías de IA, incluida la posibilidad de contenido de IA engañoso.
Acelerar el desarrollo y la adopción de técnicas para rastrear el origen del contenido audiovisual, para que siempre quede claro cuando estás interactuando con una persona real o con una IA.

Sin más que agregar, compartieron ejemplos de cómo funciona esta inteligencia artificial, los cuales están disponibles en su página web, haciendo clic aquí.

Etiquetas de esta nota

Nueva inteligencia artificial clona voces a partir de audios de tan solo 15 segundos de duración

¿Cuándo será lanzada esta inteligencia artificial?

Lo más reciente