[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: traductor de voz a escritura!



Hola,

Me voy a arriesgar a contestar. Espero no decir tonterías. En ese caso, por 
favor, corregidme.

> Me llama la atencion que no encuentro nada terminado para convertir voz
> a texto! Sabe alguien, cual podria ser la dificultad?

Es normal puesto que (hasta donde yo sé) es mucho más sencillo. Date cuenta 
de que pasar de texto a voz sólo requiere una asociación entre una palabra 
y su pronunciación. La palabra es totalmente universal (en cada idioma) y 
todo el mundo la escribe igual. Habría diferencias entre la forma de 
escribir de cada uno (en papel), pero éste no es el caso ya que el 
programa leería palabras escritas en el ordenador. Así pues, la componente 
personal no existe.
Por supuesto, esto también es complicado si partes de los sonidos básicos 
(vocales y consonantes), pero los sonidos ya están en una base de datos en 
el propio equipo y se trata de leer, ni más ni menos, es decir, utilizar 
unas reglas de lectura para la construcción de la palabra utilizando una 
voz.

> Yo no se mucho de esto, pero segun veo, seria de grabar la voz y
> convertirla en texto.  Gracias anticipadas, se agradece cualquier
> informacion.

En cuanto a la transcripción de una conversación la cosa cambia. El 
programa tiene que detectar la voz, reconocer las palabras y asociar esas 
palabras dichas con las que tiene en el diccionario. Aquí, el problema 
principal, según creo, está en las particularidades de cada forma de 
hablar. Cada uno hablamos de un modo distinto, con acentos distintos, más 
rápido o más lento, vocalizando mejor o peor, etc. Eso introduce un ruido 
inmenso. De hecho, lo que se hace en estos programas, es "entrenarlos" 
para cada usuario, al modo de las redes neuronales. Así, el programa 
obtiene las peculiaridades de cada forma de hablar y es capaz de conseguir 
extraer la información léxica de entre toda la que tiene. Vamos, que lo 
hace es quitar el "ruido" introducido por cada uno. Es como cuando hablas 
con alguien de una región de tu país en la que hablan muy cerrado y apenas 
se entiende. ¿Por qué no se entiende? Porque no estás acostumbrado a esa 
manera de hablar. En cuanto te pasas 1 mes en ese lugar, los entiendes 
mucho mejor, aparte de que se te acaba pegando la forma de hablar... pero 
eso es otra historia.

En cuanto qué hacer con tu proyecto. Si no encuentras software libre que te 
permita hacer lo que quieres y sientes muchos deseos de hacerlo o te hace 
falta, puedes probar con programas comerciales y con wine. Nunca lo he 
probado para utilizar un programa como el Viavoice y no sé si se podrá 
usar pero se supone que sí.

Espero haberte ayudado un poco.

Pablo.



Reply to: