Parsing contenuto siti web con strumenti bash??

To: debian-italian@lists.debian.org
Subject: Parsing contenuto siti web con strumenti bash??
From: gandu <radio@frequenze.it>
Date: Thu, 06 May 2004 12:39:43 +0200
Message-id: <[🔎] opr7kqkhn44e4y6u@mail.tin.it>
Reply-to: debian-italian@lists.debian.org

In questo periodo mi interessa monitorare alcuni siti e capire quandoescono nuovi articoli su certi argomenti. Diciamo che solitamente possoutilizzare delle parole chiave e che gli articoli sono in home. Visto chei siti sono decine non posso visitarli tutti ogni giorno, quindi vorreicostruire uno strumento che visiti per me il sito web e mi dica se ci sononovita'.


Faccio cosi':

Creo un file con tutte le url
Creo un file con tutte le keywords

Con wget scarico le url.

faccio un cat <pagina> | grep -i <keywords>

Se il risultato e' positivo scrivo un file di logs. Che con txt2tagsdiventa un file HTML, da leggere a video.


Non e' preciso, soprattutto perche' se combino le keywords

cat <pagina> | grep -i <keywords1> | grep -i <keywords2>

spesso non ottengo risultati... qualche idea??



--

 ,           ,
 /             \
((__-^^-,-^^-__))      http://www.frequenze.it
 `-_---' `---_-'
  `--|o` 'o|--'              Debian Sarge kernel 2.4.22
     \  `  /                    Notebook Asus A2520 CPU 2.4Ghz RAM 512MB
      ): :(
      :o_o:

"-"

Reply to:

Prev by Date: D-Link DwL 650+
Next by Date: locales 2.3.2
Previous by thread: D-Link DwL 650+
Next by thread: Re: Parsing contenuto siti web con strumenti bash??
Index(es):
- Date
- Thread