Posted By: madhouse (Free party is not a crime) on 'CZprogram'
Title: Re: Parsovani HTML (XML)
Date: Tue Nov 29 10:36:33 2011
> Ahoj.
>
> Kdyz mate XML, XSLT je prvni volba. Pokud potrebujes delat spis neco
> slozitejsiho, tak XPath se blbe ladi - ja pouzivam Java:dom4j+jaxen a
> naprogramuji si to. Treba takove prochazeni elementu iteratorem a delani
> case
> je v kodu o hodne rychlejsi udelat a o dost lip se to udrzuje. Navic
> konstrukce v programovacim jazyku (substring, startsWIth, matches,
> porovnavani
> cisel,...) jsou bohatsi nez v XPath/XSLT... navic se pri zpracovani muzes
> treba juknout do databaze a vysledek modifikovat podle toho;)
Ja ale nemam jeden typ dokumentu, je jich _hafo_ a porad pribyvaji.
Proto chci pro kazdy dalsi dokument jenom napsat predpis, ne parsovaci kod.
Muze to byt XPath, jQuery nebo jakykoli jiny predpis - klidne parametry
funkci/triggeru/callbacku pro prochazeni DOMem. Rad se necham pri hledani
reseni cimkoli inspirovat.
XML parsery, vnoreni HTML do XML, osetreni nevalidniho HTML mam vyreseny.
> Jovo.
--
AUTHOR
Written by FIXME unknown.