[OT] Script conversione mht to html
Salve a tutti , sto cercando di fare uno script per convertire il formato
delle pagine web microsoft mht in html , ma sto trovando dei problemi:
Per ora non ho creato nessuno script ma stavo studiando il tipo di
conversione che viene usata , in pratica crea un file di testo in cui viene
inserito il codice html , i vari file immagine (codificati in base64), css
ecc .
I vari file vengono suddivisi da delle righe in cui sono contenute le
informazioni dei file, tipo la posizione e altre che non ho capito.
Per esempio:
------=_NextPart_000_0071_01C128F7.666961A0
Content-Type: text/html;
charset="Windows-1252"
Content-Transfer-Encoding: quoted-printable
Content-Location:
http://www.cacciapesca.provinciarieti.it/ittioguida/specie/trota.htm
NexPart è uguale per ogni file (l'informazione che non ho capito).
I problemi che ho riscontrato sono i seguenti:
1. I file html e css vengono riportati quasi identici agli originali tranne
per alcune cose
- Dopo gli uguali c'è quasi sempre la scritta "3D"
-dove ci sono degli "a capo" (o come si chiamano) nel file mht che
nell'originale non c'erano c'è o "=" o "=20"
- al posto di "è" c'è "=E0"
-altri simili
Per quanto mi sembra di capire si tratta di una conversione errata del
testo visto che mi è successa una cosa simile con delle e-mail ricevute e
di recente con alcuni siti con mozilla (se risolvo questo problema prendo
due piccioni con una fava :-) ).
2. se riscrivo il testo html in modo corretto a mano le "è" e altre lettere
accentate me le visualizza con lettere strane ma questo credo sia un
problema di configurazione errata dei font.
E questo è tutto.
Grazie in anticipo
Andrea
--
http://digilander.libero.it/varogami/
Andrea Beciani (varogami) <a_beciani@yahoo.it>
Key fingerprint = 9D 2A C0 A6 C7 F4 F3 86 B2 E7 80 2E F7 A5 16 E5 40 8D 5F
2D
Reply to: