Re: [rech] parser ? Picture to pdf ou text ?
Le samedi 21 janvier 2023 à 16:40:04 UTC+1, Basile Starynkevitch a écrit :
> On 21/01/2023 12:49, ptilou wrote:
> Bonjour,
>
> J’attaque un travail dedroit compare, il y a pas que les [grands] informaticiens et donc je cherche un parser, mais ausi un stockage qui m’indexerai beaucoup de document texte ?
> Je serais intéressé à comprendre de quel travail de droit comparé s'agit-il....
>
> Pour l'analyse de texte on pourrait coder quelque chose en utilisant un générateur de parser comme GNU bison ou ANTLR ou menhir (qui est français) ou Lemon.
>
> On peut aussi s'inspirer du code de certains shells en logiciel libre (par exemple GNU bash ou zsh) ou d'autres logiciels libres comme RefPerSys ou CAIA ou Sqlite.
>
> Pour le stockage, je suggère d'utiliser une base de données en logiciel libre, par exemple PostGreSQL ou MariaDB ou Redis ou Sqlite.
> MaxWeberEconomyAndSociety.pdf (archive.org), voila pourquoi je cherche le parser !
>
> Pour l’indexation j’ai beaucoup de document je me demande si c’est pas possible que freeperso interoge et indexe des base comme legifrance ou hudoc ?
> Je n'ai pas compris la question. Free utilise bien sûr des bases de données.
>
> Et concernant vos documents, combien de documents (ou de gigaoctets ou de petaoctets) voulez vous stocker?
>
> La lecture du livre de Pierre Delort, collection Que Sais-je au PUF, sur le Big Data serait probablement utile!
>
C’est pas du bigdata …
Je veux interoger au coup par coup, sunon ,l’ordre ordinaire juridiction ca fait mois de 5 goi pour 40 000 documents, et,doinc avant y avait un rendu avec une fonctioin en batsh qui interroge un grep, y avait une prefecture sur bsd qui avait sortie des variante enncas de faute de grammaire et conjugaison et orthographe, et le programme fesait moins de 1 Mo la c’est d’interroger et d’avoir un rendu, en passant par free, qui utilise php et mysql !
> Librement.
> --
> Basile Starynkevitch <bas...@starynkevitch.net>
> (only mine opinions / les opinions sont miennes uniquement)
> 92340 Bourg-la-Reine, France
> web page: starynkevitch.net/Basile/
Merci
—
Ptilou
Reply to: