Posted By: Jovo () on 'CZinternet'
Title:     Stazeni interpretovaneho HTML
Date:      Fri Oct 31 23:54:14 2014

Ahoj.

  Po leta jsem pouzival jeden ze serveru statni spravy pro stahovani 
informaci. Naplacal jsem si linky do souboru a pro kazdy link provedl 
download. Stazenou stranku jsem prohnal pres HTML parser 
(http://htmlparser.sourceforge.net/) a tim ziskal pozadovane informace.

  Muj problem: ti zmetci si neceho podobneho vsimnuli a tak v HTML kodu je 
               misto dat JS (ajax & spol.), ktery data stahne a zobrazi  :-)
               Mam dojem, ze primo manipuluji DOM.

  Uzivael v prohlizeci nic nepozna - vidi uplne to same, co pred tim.

  Je nejaky zpusob, jak z jakehokoliv nastroje/knihovny/downloaderu dostat uz 
interpretovany HTML kod? Nejspise by musel mit jadro FF, Chrome,...
  Kolega zminil Selenium.

Diky,
Jovo.

Search the boards