Posted By: madhouse (Free party is not a crime) on 'CZprogram'
Title:     Re: Parsovani HTML (XML)
Date:      Tue Nov 29 10:36:33 2011

> Ahoj.
> 
>   Kdyz mate XML, XSLT je prvni volba. Pokud potrebujes delat spis neco 
> slozitejsiho, tak XPath se blbe ladi - ja pouzivam Java:dom4j+jaxen a 
> naprogramuji si to. Treba takove prochazeni elementu iteratorem a delani
> case 
> je v kodu o hodne rychlejsi udelat a o dost lip se to udrzuje. Navic 
> konstrukce v programovacim jazyku (substring, startsWIth, matches,
> porovnavani 
> cisel,...) jsou bohatsi nez v XPath/XSLT... navic se pri zpracovani muzes 
> treba juknout do databaze a vysledek modifikovat podle toho;)

  Ja ale nemam jeden typ dokumentu, je jich _hafo_ a porad pribyvaji.
Proto chci pro kazdy dalsi dokument jenom napsat predpis, ne parsovaci kod.
Muze to byt XPath, jQuery nebo jakykoli jiny predpis - klidne parametry 
funkci/triggeru/callbacku pro prochazeni DOMem. Rad se necham pri hledani
reseni cimkoli inspirovat.

  XML parsery, vnoreni HTML do XML, osetreni nevalidniho HTML mam vyreseny.

> Jovo.
--
AUTHOR
       Written by FIXME unknown.

Search the boards