[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Suppression de sauts de ligne dans un fichier texte (sous conditions)



Bonjour à tous les utilisateurs et développeurs de Debian (et à David Prévot en particulier) :

Tout d'abord, merci à David de m'avoir répondu à mon message (envoyé le 24/08/12 à 9:52). :-)


> Le 24/08/12 18:56, David Prévot a écrit :
> 
> Pas la moindre idée de ce que tu veux en faire, mais as-tu jeté un œil
> du côté de dctrl-tools qui permet d'extraire ce genre de données de ce
> genre de fichier, et comme le dit la Charte [0], ses listes sont
> conformes à la RFC 5322, donc plutôt que de réinventer la roue,
> peut-être que ça vaut le coup d'utiliser des outils existants pour
> analyser ces champs normalisés.
> 


Hier matin, j'ai installé le paquet dctrl-tools (ainsi que ses éventuelles dépendances, recommandations et suggestions) à l'aide du logiciel Aptitude et j'ai consulté les pages de manuel des commandes grep-dctrl, join-dctrl, sort-dctrl et tbl-dctrl.

D'après à ce que j'ai pu comprendre (car c'est en anglais et cette langue n'est pas vraiment mon fort), tbl-dctrl semble plutôt intéressante par rapport à ce que je compte faire avec le fichier Package.

En effet, avec la commande suivante (par exemple) :
tbl-dctrl -c 'Package=Package' -c 'Version=Version' -c 'Description=Description' -c 'Source=Source' -d ";" Packages > Packages2

On aura (en consultant le fichier Packages2) :
Package;Version;Description;Source
Nom du 1er paquet;sa version;sa description;son paquet source
Nom du 2ème paquet;sa version;sa description;son paquet source
Nom du 3ème paquet;sa version;sa description;son paquet source
etc

Par contre, si on fait :
tbl-dctrl -c 'Package=Package' -c 'Tag=Tag' -d ";" Packages > Packages3

Le contenu du fichier Packages3 est très différent de ce qu'on devrait avoir. :-(

Comme je l'ai déjà expliqué dans mon précédent message, pour certains paquets, les données du champ Tag s'étalent sur 2 ou 3 (voire plus) lignes et tbl-dctrl semble avoir du mal à bien interpréter les sauts de ligne.

Bien sûr, une solution est de renoncer aux données "Tag" mais cela serait vraiment dommage car ce champ apporte, à priori, des informations intéressantes.

Selon vous, qu'est-ce que je dois faire (avec tbl-dctrl ou autre commande) à partir du fichier initial Packages pour que dans un nouveau fichier Packages2, j'ai les données "Tag" correctement formatées ?

Mon but final est de transformer Packages en un fichier de type CSV (avec les données des champs que j'aurai sélectionnés) afin que je puisse exporter dans le tableur OpenOffice Calc. Ainsi, je pourrai, entre autres, faire des filtres ou des tris parmi les données. ;-)

Si vous souhaitez d'autres informations en lien avec mon problème, n'hésitez pas en me demander. :-)

Je vous remercie d'avance pour vos réponses.

Cordialement et à bientôt,
Stéphane.



Une messagerie gratuite, garantie à vie et des services en plus, ça vous tente ?
Je crée ma boîte mail www.laposte.net


Reply to: