Información

La conversión de texto a voz de Microsoft AI es increíblemente realista

La conversión de texto a voz de Microsoft AI es increíblemente realista

Microsoft y los investigadores chinos pueden haber descubierto una forma eficaz de convertir texto a voz. Hasta ahora, esta conversión había ido evolucionando de manera muy ingeniosa e imaginativa; sin embargo, los problemas del tiempo de capacitación y los recursos para crear resultados que suenen naturales estaban causando retrasos.

RELACIONADO: NUEVOS PRINCIPIOS DE INTELIGENCIA ARTIFICIAL DE LA OCDE: LOS GOBIERNOS ACUERDAN NORMAS INTERNACIONALES PARA LA IA FIABLE

Lo que han hecho Microsoft y los investigadores chinos es crear una Inteligencia Artificial (IA) de texto a voz con IA que utiliza 200 muestras de voz para crear un habla con un sonido realista que coincida con las transcripciones. Esto significa aproximadamente 20 minutos.

¿Cómo se relaciona con el cerebro?

Al igual que las neuronas cerebrales, el sistema utiliza en parte Transformers o redes neuronales profundas. Al igual que nuestras sinapsis cerebrales, los Transformers pesan y procesan toda la información de entrada y salida sobre la marcha. Esto les ayuda a recorrer secuencias largas y complicadas de una manera bien organizada, por ejemplo, una oración compleja.

Trabajando con relativamente poca información, incluido un codificador de eliminación de voz agregado a la mezcla, como es en este caso, la IA puede, independientemente, manejarse bastante bien.

Incluso con sonidos ligeramente robóticos, la inteligibilidad de las palabras de las grabaciones es del 99,84 por ciento. Además de eso, esto puede hacer que el texto en voz sea más accesible. Para crear voces que suenen realistas, no se necesitaría mucho más trabajo.

Los investigadores trabajan continuamente para mejorar el sistema y tienen la esperanza de que, en el futuro, se necesitará aún menos trabajo para generar un discurso realista.


Ver el vídeo: como convertir de texto a voz en office (Enero 2022).