[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [rech] parser ? Picture to pdf ou text ?




On 21/01/2023 12:49, ptilou wrote:
Bonjour,

J’attaque un travail dedroit compare, il y a pas que les [grands] informaticiens et donc je cherche un parser, mais ausi un stockage qui m’indexerai beaucoup de document texte ?

Je serais intéressé à comprendre de quel travail de droit comparé s'agit-il....


Pour l'analyse de texte on pourrait coder quelque chose en utilisant un générateur de parser comme GNU bison ou ANTLR ou menhir (qui est français) ou Lemon.


On peut aussi s'inspirer du code de certains shells en logiciel libre (par exemple GNU bash ou zsh) ou d'autres logiciels libres comme RefPerSys ou CAIA ou Sqlite.


Pour le stockage, je suggère d'utiliser une base de données en logiciel libre, par exemple PostGreSQL ou MariaDB ou Redis ou Sqlite.


MaxWeberEconomyAndSociety.pdf (archive.org), voila pourquoi je cherche le parser !

Pour l’indexation j’ai beaucoup de document je me demande si c’est pas possible que freeperso interoge et indexe des base comme legifrance ou hudoc ?

Je n'ai pas compris la question. Free utilise bien sûr des bases de données.


Et concernant vos documents, combien de documents (ou de gigaoctets ou de petaoctets) voulez vous stocker?


La lecture du livre de Pierre Delort, collection Que Sais-je au PUF, sur le Big Data serait probablement utile!


Librement.

-- 
Basile Starynkevitch                  <basile@starynkevitch.net>
(only mine opinions / les opinions sont miennes uniquement)
92340 Bourg-la-Reine, France
web page: starynkevitch.net/Basile/


Reply to: