OpenAI quiere recrear voces humanas, incluida la tuya

by Andreas  - abril 29, 2024

Imagina que te oyes a ti mismo recitar una frase impecable en francés, mandarín o japonés, aunque nunca hayas estudiado esos idiomas. OpenAI acaba de presentar una herramienta de audio generativo que promete hacerlo. Al parecer, Voice Engine es capaz de recrear los tonos y los matices que hacen que la voz de una persona sea única, utilizando sólo una muestra de 15 segundos como material de partida.

Y así se escucha:

Learning Spanish: Estoy buscando a un niño que pueda ayudarme a aprender a leer en español.
La amistad es un tesoro universal aporta alegría apoyo y risas a nuestras vidas sin importar donde estemos en el mundo. Los verdaderos amigos están con nosotros en las buenas y en las malas compartiendo nuestras alegrías y aliviando nuestras penas. Celebremos los lazos de amistad que nos conectan a todos a través de cada idioma y cultura.
Freundschaft ist ein universeller Schatz. Sie bringt Freude, Unterstützung und Lachen in unser Leben, egal wo auf der Welt wir uns befinden. Wahre Freunde stehen uns durch dick und dünn zur Seite, teilen unsere Freuden und lindern unsere Sorgen. Feiern wir das Band der Freundschaft, das uns alle verbindet, über alle Sprachen und Kulturen hinweg.
友 誼 是 一 種 普 遍 的 財 富、 無 論 我們 身 在 世界 何 處 它 都 會 給 我們的 生活 帶 來 快 樂、 支持 和 笑 聲。 真 正 的 朋友 在 我們 經 歷 風 風 雨 雨 時 與 我們 並 肩 分享 我們的 快 樂、 減 輕 我們的 悲 傷。 讓 我們 牵 着 友 誼 的 紐 帶、 让它 跨 越 每 一 種 語 言 和 文 化, 將 我們 所有 人 連 接 在 一起。
L’ amitié est un trésor universel. D’où que nous venons, elle apporte joie, soutien et rires dans nos vies. Les vrais amis se tiennent toujours à nos côtés: contre vents et marées, ils partagent nos joies et soignent nos chagrins. Chérissons les liens d’amitié qui nous unissent, par delà la diversité de nos langues ou de nos cultures.

¿Qué puede hacer Voice Engine?

  • Traducir vídeos y podcasts a otros idiomas
  • Crear avatares de aspecto humano para marketing de productos o tutoriales.
  • Ofrecer una nueva herramienta de comunicación a las personas que no hablan o que han perdido la capacidad de hablar.

¿Cuándo podremos usarlo?

Pronto. OpenAI está actuando con cautela, ya que la nueva tecnología podría hacer mucho daño si cayera en las manos equivocadas, especialmente durante un año electoral (en EEUU).

¿Cómo aborda OpenAI estas preocupaciones?

Dice que creará una marca de agua digital que avise a los oyentes cuando un clip de audio se haya generado con Voice Engine. También podría prohibir el uso de determinadas voces, como las de políticos y famosos.

A pesar de los riesgos, la nueva plataforma tiene mucho potencial:

Voice Engine permitiría, por ejemplo, que los niños y los no lectores recibieran ayuda para leer de una voz que suena realmente como la de un ser humano. Los investigadores de la Universidad de Brown dicen que también están utilizando la herramienta para ayudar a personas con afecciones degenerativas del habla a recuperar gradualmente su voz.

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}

REGALO

Quieres nuestro "Manual del Emprendedor Digital"?

Quizás Te Interese...

>