[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [OT] Opciones de selección de texto



2012/4/30 Angel Claudio Alvarez <angel@angel-alvarez.com.ar>:
> El lun, 30-04-2012 a las 22:35 +0200, kaptan escribió:
>> Buenas comunidad,
>> no sé si alguién sabrá de alguna herramienta que permita seleccionar
>> texto que esté entre unas determinadas palabras (me explico: por ej en
>> un html, que seleccione todo los textos que estén entre las etiquetas
>> <body></body>), o una herramienta de selección en general que tenga
>> varias opciones. Ahora mismo no me viene nada a la mente.
>> Gracias de antemano.
>> Un saludo.
>>
>>
> perl, python, ruby,
> tenes para elegir
>

Con python:

from lxml import html

def innerText(el):
    text = ""
    if el.text: text += el.text
    for child in el.getchildren():
        s = innerText(child)
        if s: text += s
    if el.tail: text += el.tail
    return text

doc = html.document_fromstring("<html><body>Hola <strong>que</strong>
tal <p>foo bar</body></html>")

print innerText(doc.body)

Retorna:
'Hola que tal foo bar'

Saludos
-- 
Linux Registered User # 386081
A menudo unas pocas horas de "Prueba y error" podrán ahorrarte minutos
de leer manuales.


Reply to: