[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [rech] parser ? Picture to pdf ou text ?



Le samedi 21 janvier 2023 à 16:40:04 UTC+1, Basile Starynkevitch a écrit :
> On 21/01/2023 12:49, ptilou wrote:
> Bonjour,
> 
> J’attaque un travail dedroit compare, il y a pas que les [grands] informaticiens et donc je cherche un parser, mais ausi un stockage qui m’indexerai beaucoup de document texte ?
> Je serais intéressé à comprendre de quel travail de droit comparé s'agit-il....
> 
> Pour l'analyse de texte on pourrait coder quelque chose en utilisant un générateur de parser comme GNU bison ou ANTLR ou menhir (qui est français) ou Lemon.
> 
> On peut aussi s'inspirer du code de certains shells en logiciel libre (par exemple GNU bash ou zsh) ou d'autres logiciels libres comme RefPerSys ou CAIA ou Sqlite.
> 
> Pour le stockage, je suggère d'utiliser une base de données en logiciel libre, par exemple PostGreSQL ou MariaDB ou Redis ou Sqlite.
> MaxWeberEconomyAndSociety.pdf (archive.org), voila pourquoi je cherche le parser !
> 
> Pour l’indexation j’ai beaucoup de document je me demande si c’est pas possible que freeperso interoge et indexe des base comme legifrance ou hudoc ?
> Je n'ai pas compris la question. Free utilise bien sûr des bases de données.
> 
> Et concernant vos documents, combien de documents (ou de gigaoctets ou de petaoctets) voulez vous stocker?
> 
> La lecture du livre de Pierre Delort, collection Que Sais-je au PUF, sur le Big Data serait probablement utile!
> 

C’est pas du bigdata …
Je veux interoger au coup par coup, sunon ,l’ordre ordinaire juridiction ca fait mois de 5 goi pour 40 000 documents, et,doinc avant y avait un rendu avec une fonctioin en batsh qui interroge un grep, y avait une prefecture sur bsd qui avait sortie des variante enncas de faute de grammaire et conjugaison et orthographe, et le programme fesait moins de 1 Mo la c’est d’interroger et d’avoir un rendu, en passant par free, qui utilise php et mysql !

> Librement.
> -- 
> Basile Starynkevitch                  <bas...@starynkevitch.net>
> (only mine opinions / les opinions sont miennes uniquement)
> 92340 Bourg-la-Reine, France
> web page: starynkevitch.net/Basile/

Merci

— 
Ptilou


Reply to: