[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

[OT] Script conversione mht to html



Salve a tutti , sto cercando di fare uno script per convertire il formato
delle pagine web microsoft mht in html , ma sto trovando dei problemi:
Per ora non ho creato nessuno script ma stavo studiando il tipo di
conversione che viene usata , in pratica crea un file di testo in cui viene
inserito il codice html , i vari file immagine (codificati in base64), css
ecc .
I vari file vengono suddivisi da delle righe in cui sono contenute le
informazioni dei file, tipo la posizione e altre che non ho capito.
Per esempio:

------=_NextPart_000_0071_01C128F7.666961A0
Content-Type: text/html;
	charset="Windows-1252"
Content-Transfer-Encoding: quoted-printable
Content-Location:
http://www.cacciapesca.provinciarieti.it/ittioguida/specie/trota.htm

NexPart è uguale per ogni file (l'informazione che non ho capito).

I problemi che ho riscontrato sono i seguenti:
1. I file html e css vengono riportati quasi identici agli originali tranne
   per alcune cose
	- Dopo gli uguali c'è quasi sempre la scritta "3D"
	-dove ci sono degli "a capo" (o come si chiamano) nel file mht che
	  nell'originale non c'erano c'è o "=" o "=20"
	- al posto di "è" c'è "=E0"
	-altri simili
   Per quanto mi sembra di capire si tratta di una conversione errata del
   testo visto che mi è successa una cosa simile con delle e-mail ricevute e
   di recente con alcuni siti con mozilla (se risolvo questo problema prendo
    due piccioni con una fava :-)    ).
2. se riscrivo il testo html in modo corretto a mano le "è" e altre lettere
   accentate me le visualizza con lettere strane ma questo credo sia un
   problema di configurazione errata dei font.
E questo è tutto.
Grazie in anticipo
Andrea



--
http://digilander.libero.it/varogami/
Andrea Beciani (varogami) <a_beciani@yahoo.it>
Key fingerprint =  9D 2A C0 A6 C7 F4 F3 86  B2 E7 80 2E F7 A5 16 E5  40 8D 5F
2D



Reply to: