[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Archives DUF en format maildir ou mbox



Le mercredi 15 février de l'année 2012, vers 15 heures et 09 minutes, David Prévot écrivait:
> Le 15/02/2012 13:15, Yves Rutschle a écrit :
> > On Wed, Feb 15, 2012 at 11:03:03AM -0400, David Prévot wrote:
> >> Il y a d'autres données que celles en ligne, comme les adresses IP, les
> >> en-têtes spécifiques au client de messagerie utilisé, etc.
> > 
> > Ok, ça tient debout. Ne peut-on pas faire des mailbox qui
> > retirent ces champs (et qui contiendraient donc les même
> > données que publiées sur le site)?
> 
> Si quelqu'un propose un script pour traiter les archives de cette façon,
> les administrateurs de liste pourraient considérer les remettre en
> ligne. Ça vaut le coup de tâter le terrain avant (peut-être d'autres
> problèmes existe comme l'espace disque, la bande passante, le « coût »
> machine de traitement, etc.) et puisqu'il s'agit d'un sujet récurrent,
> mieux vaut essayer de prendre conscience de ce qui c'est déjà dit.
> 
> http://lists.debian.org/debian-devel/2011/08/msg00119.html


Bonsoir, 
Merci David pour ces pistes d'interprétation. 

Mais je me demande si le script pour traiter les archives et les
anonymiser est le coeur du problème; ou disons qu'il s'agit de l'un
des ventricules. La position " Current status is that listmasters do
not plan to publish any mboxes" ne mentionne d'ailleurs aucune raison
particulière.

Supposons que nous arrivions à déterminer TOUTES les informations
potentiellement "privacy-cides (privacides)" et que nous réalisions un
script pour les éliminer des mails; comme le précise Y. Rutschle, il
s'agit en fait de réaliser une mbox à partir des archives déjà en
ligne. Mais poursuivons le raisonnement. Supposons que nous arrivions
à faire ce travail. Est-ce que les listmasters mettraient en œuvre le
script pour autant ?

La réponse "We will see. I am currently not sure about it." (Alex Wirt)
est encourageante et précise le problème selon moi. En effet, pourquoi
un format mbox... si en plus cela risque de nous rajouter du travail
(ils en ont bien assez) ?

La requête d'Andreas Tille est pourtant claire et courageuse (merci
pour le lien) : il propose de faire des statistiques pour mieux observer
l'activité des contributeurs. Mais pourquoi faire ? Quel serait
l'utilité de ce genre de statistiques ? D'ailleurs, est-ce le rôle de
Debian de donner accès à ces données ? "Debian is not *collecting*
data (like in a web form were you fill in data to do some research) but
we are rather logging information people are providing" (A. Tille).

J'ai déjà vu Andréas à l'oeuvre, il réalise des stats qui lui
permettent de coordonner sa propre activité avec celle des autres
contributeurs, mais passons là n'est pas le sujet. En ayant en tête
l'outil de coordination qu'il pourrait mettre en place, il a évoqué
le nom "It sometimes is important who says something." PATATRA. Il est
revenu sur le problème de la vie privée alors qu'il me semble que
le véritable problème est celui de la légitimité d'un format mbox
(2ème ventricule du problème).

Tant que nous n'aurons pas dé-montré la nécessité, l'utilité et
la cohérence avec le projet Debian, de l'accès à un format libre
d'échange, d'étude et de travail sur les mailing-lists et ceci tout en
préservant la vie privée des contributeurs alors la discussion sera
vaine (amha).

Je ne sais pas si vous me suivez. 

-- 
Alexandre Delanoë


Reply to: