Das ganze funktioniert auch unter Windows mithilfe von Cygwin.
Unter dem Namen “hades” hat der Verlag Harri Deutsch seine Aktivitäten digitaler Werke gebündelt. Prominentester Vertreter des Verlages dürfte der “Bronstein”, das “Taschenbuch der Mathematik” sein. Dieser ist in einer Version mit CD-ROM erhältlich, auf der der gesamte Inhalt im HTML-Format verfügbar ist. Da Laptops zumehmend Verbreitung finden ist es natürlich eine interessante Möglichkeit, den “Bronstein” so ohne zusätzlichen Ballast dabei haben zu können. Leider ergibt sich dabei ein kleines Problem: Die HTML-Seiten lassen sich problemlos auf den lokalen Rechner kopieren (unter Linux: CD mit “-o nojoliet” mounten, das Joliet hat eine kaputte Groß- / Kleinschreibung!). Allerdings lassen sich die Seiten mit einem aktuellen Browser nicht öffnen – Firefox zeigt nur die Fußzeile und ein paar versprengte HTML-Kommentare an. In der Quelltextansicht wird schnell klar dass da einiges im argen liegt. Wie nun lösen? Zum Glück gibt es Tools wie Tidy, die HTML-Code automatisch aufräumen können. Dies brauchte auch den gewünschten Erfolg.
$ mount /media/cdrom -o nojoliet $ mkdir Bronstein $ cp -r /media/cdrom/* Bronstein $ chmod -R u+w Bronstein
$ cd Bronstein
$ for i in `find . -type d`; do mkdir -p fixed/$i; done
$ for i in `find . -name '*.htm'`; do tidy -q --show-warnings 0 --wrap 0 $i > fixed/$i; done
fixed. Da alle Grafiken im gif-Format vorliegen können wir die nun auch noch kopieren:$ for i in `find . -name '*.gif'`; do cp $i fixed/$i; done