Re: traductor de voz a escritura!
Hola,
Me voy a arriesgar a contestar. Espero no decir tonterías. En ese caso, por
favor, corregidme.
> Me llama la atencion que no encuentro nada terminado para convertir voz
> a texto! Sabe alguien, cual podria ser la dificultad?
Es normal puesto que (hasta donde yo sé) es mucho más sencillo. Date cuenta
de que pasar de texto a voz sólo requiere una asociación entre una palabra
y su pronunciación. La palabra es totalmente universal (en cada idioma) y
todo el mundo la escribe igual. Habría diferencias entre la forma de
escribir de cada uno (en papel), pero éste no es el caso ya que el
programa leería palabras escritas en el ordenador. Así pues, la componente
personal no existe.
Por supuesto, esto también es complicado si partes de los sonidos básicos
(vocales y consonantes), pero los sonidos ya están en una base de datos en
el propio equipo y se trata de leer, ni más ni menos, es decir, utilizar
unas reglas de lectura para la construcción de la palabra utilizando una
voz.
> Yo no se mucho de esto, pero segun veo, seria de grabar la voz y
> convertirla en texto. Gracias anticipadas, se agradece cualquier
> informacion.
En cuanto a la transcripción de una conversación la cosa cambia. El
programa tiene que detectar la voz, reconocer las palabras y asociar esas
palabras dichas con las que tiene en el diccionario. Aquí, el problema
principal, según creo, está en las particularidades de cada forma de
hablar. Cada uno hablamos de un modo distinto, con acentos distintos, más
rápido o más lento, vocalizando mejor o peor, etc. Eso introduce un ruido
inmenso. De hecho, lo que se hace en estos programas, es "entrenarlos"
para cada usuario, al modo de las redes neuronales. Así, el programa
obtiene las peculiaridades de cada forma de hablar y es capaz de conseguir
extraer la información léxica de entre toda la que tiene. Vamos, que lo
hace es quitar el "ruido" introducido por cada uno. Es como cuando hablas
con alguien de una región de tu país en la que hablan muy cerrado y apenas
se entiende. ¿Por qué no se entiende? Porque no estás acostumbrado a esa
manera de hablar. En cuanto te pasas 1 mes en ese lugar, los entiendes
mucho mejor, aparte de que se te acaba pegando la forma de hablar... pero
eso es otra historia.
En cuanto qué hacer con tu proyecto. Si no encuentras software libre que te
permita hacer lo que quieres y sientes muchos deseos de hacerlo o te hace
falta, puedes probar con programas comerciales y con wine. Nunca lo he
probado para utilizar un programa como el Viavoice y no sé si se podrá
usar pero se supone que sí.
Espero haberte ayudado un poco.
Pablo.
Reply to: