Posted By: vejpuste (Libor Vejpustek) on 'CZunix'
Title: Soubor neznameho kodovani
Date: Wed Dec 5 12:43:33 2007
Mam soubor neznameho kodovani a potreboval bych ho dostat do citelne podoby.
Uz jsem chtel napsat dotaz, ale nakonec jsem zkusil neco udelat sam.
Mozna to pomuze i nekomu dalsimu. Nakonec to nebylo tak hrozne, jak jsem se
obaval.
Zaklad je programek iconv. iconv -l jsem si vypsal vsechny jemu zname stranky
do souboru a rozhodil co znakova stranka to radek.
Pak jsem nechal soubor prevest postupne jednou strankou za druhou na CP1250 :
#!/bin/bash
KODOVANI=`cat list.txt`
for n in $KODOVANI
do
echo $n
iconv -f $n -t CP1250 <1392_13.htm > 1/$n.htm
done
V adresari 1/ se vytvorila spousta souboru, pricemz vetsina skoncila s
prevodem chybou, takze mela mensi velikost nez puvodni soubor.
Nejvetsi soubory byly nejspravnejsi.
Diky autorovi iconv (Ulrich Drepper), ze mi usetril spoustu prace.
Libor Vejpustek
Ceska zemedelska univerzita Praha
http://web.czu.cz/~vejpuste/ E-mail : vejpuste@uvt.czu.cz