[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: rinumerazione valore in un colonna relazionata con altra colonna



grazie a tutti per l' aiuto.

per il momento ho usato grep/sort/uniq e cut per fare il lavoro usando
files temporanei, ma non è molto elegante.
Nei prossimi giorni implementeró la faccenda.... ho appena scoperto
che l'ID_post (seconda colonna) non è affidabile, in quanto
forumfree.it, non cambia l' ID, nei messaggi che vengono spostati di
sezione (e sono parecchi) per cui ho pensato di ordinare per il campo
soggetto e poi per data con sort -k5 -k7
mi piace la soluzione con awk, soprattutto l' ultima :)

grazie anche per il suggerimento con python

quando sará finita l'importazione pubblicheró gli script usati e vi
avviseró in ML.
Potrebbe essere utile per altri fprum basati su IPB 1.3 e posteriori
in cui il DB non è accessibile.

saluti,
MaX

Il 26/06/13, Lorenzo Sutton<lorenzofsutton@gmail.com> ha scritto:
> On 25/06/13 16:44, MaX wrote:
>> ciao a tutti,
>>
>> nella mia avventura con il crawler di estrazione dbho risolto parecchi
>> problemi e modificando a mano il db stesso riesco ad importarlo in
>> phpbb3 sen za errori.
>>
>> ora peró vorrei automatizzare la procedura e eliminare la possibilità di
>> errori.
>>
>>
>> il db in formato csv, ha una struttura del genere:
>>
>>
>> "forum_id","topic_id","message_id","user_name","topic","message","time"
>>
>> e quindi i dati si presentano cosí:
>>
>> "12","2999","19123",""nome 1","Soggetto discussione 1","Testo
>> discussione","12:00 00:01"
>> "12","2999","19124",""nome 3","Soggetto discussione 1","Testo
>> discussione","12:00 00:02"
>> "12","2999","19127",""nome 8","Soggetto discussione 1","Testo
>> discussione","12:00 00:03"
>> "12","2999","19131",""nome 1","Soggetto discussione 1","Testo
>> discussione","12:00 00:04"
>> "12","2999","19132",""nome 4","Soggetto discussione 1","Testo
>> discussione","12:00 00:05"
>> "11","2750","19125",""nome 5","Soggetto discussione 2","Testo
>> discussione","12:00 00:01"
>> "11","2750","19126",""nome 7","Soggetto discussione 2","Testo
>> discussione","12:00 00:04"
>> "11","2750","19128",""nome 3","Soggetto discussione 2","Testo
>> discussione","12:00 00:05"
>> "11","2750","19129",""nome 6","Soggetto discussione 2","Testo
>> discussione","12:00 00:06"
>> "11","2750","19130",""nome 9","Soggetto discussione 2","Testo
>> discussione","12:00 00:07"
>>
>>
>> avrei bisogno di rinumerare la tera colonna relazionata con la seconda
>> in modo che risulti cosí:
>>
>> "12","2999","0",""nome 1","Soggetto discussione 1","Testo
>> discussione","12:00 00:01"
>> "12","2999","1",""nome 3","Soggetto discussione 1","Testo
>> discussione","12:00 00:02"
>> "12","2999","2",""nome 8","Soggetto discussione 1","Testo
>> discussione","12:00 00:03"
>> "12","2999","3",""nome 1","Soggetto discussione 1","Testo
>> discussione","12:00 00:04"
>> "12","2999","4",""nome 4","Soggetto discussione 1","Testo
>> discussione","12:00 00:05"
>> "11","2750","0",""nome 5","Soggetto discussione 2","Testo
>> discussione","12:00 00:01"
>> "11","2750","1",""nome 7","Soggetto discussione 2","Testo
>> discussione","12:00 00:04"
>> "11","2750","2",""nome 3","Soggetto discussione 2","Testo
>> discussione","12:00 00:05"
>> "11","2750","3",""nome 6","Soggetto discussione 2","Testo
>> discussione","12:00 00:06"
>> "11","2750","4",""nome 9","Soggetto discussione 2","Testo
>> discussione","12:00 00:07"
>>
>> praticamente una numerazione crescenta a partire sempre da 0 ma solo
>> per le linee contenenti lo stesso gruppo di numero nella colonna 2.
>> Ovviamente il numeri di linee varia continuamente.
>>
>> qualche idea?
>>
>
> Io userei python (e il modulo csv...
> Lorenzo
>
>
> --
> Per REVOCARE l'iscrizione alla lista, inviare un email a
> debian-italian-REQUEST@lists.debian.org con oggetto "unsubscribe". Per
> problemi inviare un email in INGLESE a listmaster@lists.debian.org
>
> To UNSUBSCRIBE, email to debian-italian-REQUEST@lists.debian.org
> with a subject of "unsubscribe". Trouble? Contact
> listmaster@lists.debian.org
> Archive: [🔎] 51CB511E.8080400@gmail.com">http://lists.debian.org/[🔎] 51CB511E.8080400@gmail.com
>
>


-- 
ciao,
MaX


Reply to: