Jan Kristensen :o\) wrote in dk.edb.internet.webdesign.html:
> problemet [er] ikke så meget hovedadressen,
> men det dybere liggende links.
Ahhh.... så handler det jo bare lige om at kode sig et snedigt lille script
som parser siden for "<a" og deraf udleder URL'en på siden der linkes til.
Herefter skal den automatisk tilføje "
http://www.domæne.dk/" til alle
relative links og "
http://www.domæne.dk" til alle absolutte links (dem der
starter med "/"). Når det er gjort skal der tilføjes en cool feature som gør
scriptet i stand til at arbejde i flere niveauer (altså følge links på en
side og parse de sider der linkes til, men samtidig vende tilbage og
fortsætte med at parse den side der linkes fra). Ok, pust, pust - så mangler
vi blot at lave en lille chekker, som sikrer at scriptet ikke indekserer hele
Internettet men kun det pågældende domæne.... Og hvad hvis den møder et
framesæt? eller et javascript med links? En Iframe eller....
Ved nærmere eftertanke kunne det godt være at du bare skal finde dig en
færdig robot
Mvh
Jonas
--
KONKURRENCE PÅ HTML.dk:
fortæl hvordan din drømmeeditor ser ud
og vind luksus webhoteller fra Wannafind
KLIK HER! =>
http://www.html.dk/editor