[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: heu provat programari de conversió d'àudio a text?



+1 amb SoftCatalà.

Des de fa temps que jo també al·lucino amb què es facin diferents idiomes dins el llenguatge de gestos (signes).

Espero que el somriure ningú no l'arribi a subdividir en idiomes.


El 3/2/23 a les 11:24, jam ha escrit:
Hola,

molt bon treball Joan. Com sempre softcatalà treballant per a la comunitat.

A on estic ara l'han rebut molt bé i segurament el començaran a fer servir aviat.

Això sí, sempre hi ha algú que li agrada posar reptes. Em demanen si existeix alguna aplicació que detecti llenguatge de signes català i els passi a text.

He al·lucinat perquè efectivament hi ha alguna cosa de reconeixement de llenguatge de signes, però en "argentí" i tb hi ha un indi:

https://github.com/hthuwal/sign-language-gesture-recognition

https://github.com/emnikhil/Sign-Language-To-Text-Conversion

Sabeu si hi ha alguna cosa semblant per la llengua de signes en català?

Merci



On 02/02/2023 16:56, Joan Montané wrote:
Responc entre paràgrafs,

Missatge de Narcis Garcia <debianlists@actiu.net> del dia dj., 2 de febr. 2023 a les 8:35:

    Gràcies Joan;
    Un parell de preguntes:

    1. Quina diferència hi ha entre un model «petit» i un de «mitjà»?


El model petit és més lleuger, ocupa menys. En general, la mida afecta la qualitat de forma proporcional i la rapidesa d'inferència de forma inversa. Això és, amb caràcter general, un model petit obtindrà resultats de menys qualitat, però de forma més ràpida, que no pas un model mitjà.


    2. És programari lliure?


Whisper? Això és d'OpenAI. El codi i els models són lliures, però les dades emprades per a crear el model no ho són. Més informació sobre Whisper aquí: https://openai.com/blog/whisper/ i https://github.com/openai/whisper

La part de Softcatalà consisteix en:
- Un formulari web per a enviar la petició: https://github.com/Softcatala/wp-softcatala/blob/master/templates/transcribe.twig - Un servei que gestiona la cua de peticions, crida al motor de transcripció i envia un correu a l'usuari quan la tasca s'ha enllestit: https://github.com/Softcatala/transcribe-service - Una pàgina de retorn que permet: https://github.com/Softcatala/wp-softcatala/blob/master/templates/transcribe-results.twig
  a) Baixar-se la transcripció.
  b) Addicionalment, editar la transcripció des del navegador en un oTranscribe: https://github.com/Softcatala/wp-softcatala/blob/master/static/js/otranscribe.js

Per tant, sí, la part de Softcatalà és lliure. Amb tot, en ser un servei que s'executa en la banda de servidor, per molt que sigui lliure, sempre hi ha el punt que no saps del cert què passa a l'altra banda. Per això, entre altres motius, enllacem Buzz, que és una molt bona opció en local. La llàstima és que només hi ha versió per a Windows i Mac :_(

He de dir que no he participat en la programació, Així que no puc respondre gaires aspectes tècnics. Però qualsevol comentari és benvingut. Sigui de l'experiència d'usuari o de la implementació. Gràcies.

Joan Montané


--
____________________________________________________

     El 2003 el català era la llengua habitual del 46 % dels catalans. Al 2018 només del 36 %. Si els castellanoparlants no actuem, desapareixerà.

     El 3 de novembre representa el moment de l'any en el que les dones deixen de cobrar en comparació amb els homes. Hem d’ajudar a les dones a eliminar aquesta data.

     L’administració pública cada any es gasta milions d’euros en llicències de programari privatiu. Utilitzant programari lliure estalviem costos i incentivem l’economia local.

La neutralitat davant les desigualtats acaba accentuant-les.


--
Narcis Garcia


Reply to: