/ Forside / Teknologi / Udvikling / HTML / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
HTML
#NavnPoint
molokyle 11184
Klaudi 5506
bentjuul 3377
severino 2040
smorch 1950
strarup 1525
natmaden 1396
scootergr.. 1320
e.c 1150
10  miritdk 1110
Skjult side for web-robotter
Fra : Lars Thomsen Nielsen


Dato : 22-06-05 13:57

Jeg har en webside som jeg ikke ønsker bliver tilgængelig for
alle og enhver. Jeg har derfor ikke noget link direkte fra min
hovedside, men skal selv skrive det dybe link, hvilket er det jeg
ønsker. Dog er jeg bekymret for om web-robotterne fra fx Google,
skal finde min "hemmelige" side og dermed "offentliggøre" den med
et direkte link. Kan man sikre sig mod dette på en eller anden
måde?

PS. Spørgsmålet hører muligvis ikke hjemme her i html-gruppen,
men jeg har svært ved at finde den rette NG. Og så plejer folk
herinde at have ret gode svar, så nu prøver jeg her.

Lars



 
 
Kristian Bødker (22-06-2005)
Kommentar
Fra : Kristian Bødker


Dato : 22-06-05 14:07

Lars Thomsen Nielsen wrote:

> Jeg har en webside som jeg ikke ønsker bliver tilgængelig for
> alle og enhver. Jeg har derfor ikke noget link direkte fra min
> hovedside, men skal selv skrive det dybe link, hvilket er det jeg
> ønsker. Dog er jeg bekymret for om web-robotterne fra fx Google,
> skal finde min "hemmelige" side og dermed "offentliggøre" den med
> et direkte link. Kan man sikre sig mod dette på en eller anden
> måde?
>

Hej Lars

Du kan skjule en fil eller mappe for søgerobotter med en robots.txt fil
i roden af dit domæne, eller via meta-tags.

se: http://www.robotstxt.org/wc/exclusion.html

Men dette forhindre ikke robotter der ikke overholder standarterne i at
crawle din side.

Du skal også passe på med at linke til andre sider da din "hemmelige"
side derved kommer til at stå som "referer" i request-headeren på den
side der linkes til, og at din sides url derfor kan ses i div logs og
statestikker på siden du linker til.

Den eneste måde at holde noget hemmeligt er ikke at lægge det på nettet,
og den næstbedste løsning er at beskytte det med en fungerende password
meksanisme.

--
Kristian Bødker, Softwareingeniør studerende - Aalborg Universitet
http://www.bødker.dk/

Jens Gyldenkærne Cla~ (22-06-2005)
Kommentar
Fra : Jens Gyldenkærne Cla~


Dato : 22-06-05 14:28

Lars Thomsen Nielsen skrev:

> Jeg har en webside som jeg ikke ønsker bliver tilgængelig for
> alle og enhver.

Hvor hemmelig skal den være?

Hvis det ikke er nogen katastrofe at siden kan blive opdaget, er det
rigeligt at lave en side uden indgående links (hvis andre end dig selv
benytter den, skal du så også lige sørge for at de ikke linker til den).

Bruger du så også en robots.txt-fil (jf. Kristians indlæg), vil langt de
fleste søgemaskiner gå uden om din side, også selv om der skulle være
links til den fra andre sider. Du kan evt. supplere med en meta-kode:
<meta name="Robots" content="NONE">

Du kan også benytte sikring med login - lavet fornuftigt er det næsten
umuligt at bryde.

> PS. Spørgsmålet hører muligvis ikke hjemme her i html-gruppen,

Det havde måske været mere on-topic i modergruppen -
dk.edb.internet.webdesign - men det er også o.k. her.

--
Jens Gyldenkærne Clausen
Svar venligst under det du citerer, og citer kun det der er
nødvendigt for at forstå dit svar i sammenhængen. Se hvorfor og
hvordan på http://usenet.dk/netikette/citatteknik.html

Lars Thomsen Nielsen (22-06-2005)
Kommentar
Fra : Lars Thomsen Nielsen


Dato : 22-06-05 14:57

> Hvor hemmelig skal den være?

Ikke NASA-hemmelig


> Bruger du så også en robots.txt-fil (jf. Kristians indlæg)

Tjaah, det var absolut også en mulighed.


> Du kan også benytte sikring med login - lavet fornuftigt er det
næsten
> umuligt at bryde.

Ja, det kunne jeg selvfølgelig. Jeg har faktisk en ASP-stump som
jeg kunne integrere og det tror jeg at jeg vil gøre.


> Det havde måske været mere on-topic i modergruppen -
> dk.edb.internet.webdesign - men det er også o.k. her.

Uanset hvad, så fik jeg i hvert fald bekræftet min kommentar om
at man tit får gode svar på denne side

Lars




Allan Vebel (22-06-2005)
Kommentar
Fra : Allan Vebel


Dato : 22-06-05 14:36

Lars Thomsen Nielsen <lars@EraseThisflexcom.dk> skrev:

> om web-robotterne fra fx Google, skal finde min "hemmelige"
> side og dermed "offentliggøre" den med et direkte link.

Så længe du ikke har et link til din hemmelige side er der ingen
der finder den.

Jeg har i mange år haft ting liggende i underkataloger på mine
domæner, og der er endnu ingen der har fundet det.

--
Allan Vebel
http://html-faq.dk



Lars Thomsen Nielsen (22-06-2005)
Kommentar
Fra : Lars Thomsen Nielsen


Dato : 22-06-05 14:57

> Jeg har i mange år haft ting liggende i underkataloger på mine
> domæner, og der er endnu ingen der har fundet det.

Det lyder ikke som om jeg skal være så bekymret

Lars



Mikkel Møldrup-Lakje~ (22-06-2005)
Kommentar
Fra : Mikkel Møldrup-Lakje~


Dato : 22-06-05 15:51

"Lars Thomsen Nielsen" <lars@EraseThisflexcom.dk> skrev i en meddelelse
news:42b96e41$0$18636$14726298@news.sunsite.dk...
>> Jeg har i mange år haft ting liggende i underkataloger på mine
>> domæner, og der er endnu ingen der har fundet det.
>
> Det lyder ikke som om jeg skal være så bekymret

Det kommer helt an på karakteren af dit domæne og dine filer.

Jeg vil ikke anbefale at bruge robots.txt - så fortæller du jo netop folk,
at her er noget hemmeligt. Enhver kan gå ind på dit domæne og se din
robottekst og se, hvilke filer du ønsker at skjule. Og så finde filerne
bagefter.

I stedet for at henvise til de skjulte filer og mapper i robotteksten er det
langt bedre _slet_ ikke at henvise til dem.

Så kan de hverken findes af surfere eller robotter.

Mikkel




Mikkel Z. Herold (22-06-2005)
Kommentar
Fra : Mikkel Z. Herold


Dato : 22-06-05 19:06

On 22-06-2005 16:51 Mikkel Møldrup-Lakjer wrote:
> Jeg vil ikke anbefale at bruge robots.txt - så fortæller du jo netop folk,
> at her er noget hemmeligt. Enhver kan gå ind på dit domæne og se din
> robottekst og se, hvilke filer du ønsker at skjule. Og så finde filerne
> bagefter.

Det er nu en sandhed med modifikationer, for metoden understøtter også
wildcards. Man kan f.eks. lave en robots.txt med indholdet

User-agent: *
Disallow: /_*

og så kalde sin hemmelige mappe for "_frikadelle" - så er det jo ikke
lige til at gætte.

Men som også nævnt, så virker metoden kun, hvis man respekterer
kommandoerne i filen.

En anden Mikkel

--
"At first just a rustle of canvas
And the gentlest breath on my face
But a galloping line of white horses
Said that soon we were in for a race"
Sting - The Wild Wild Sea

http://www.mzh.dk

Bertel Lund Hansen (22-06-2005)
Kommentar
Fra : Bertel Lund Hansen


Dato : 22-06-05 19:18

Mikkel Møldrup-Lakjer skrev:

>> Det lyder ikke som om jeg skal være så bekymret

> Det kommer helt an på karakteren af dit domæne og dine filer.

Jeg har haft en fil liggende på min hjemmeside nu i 4-5 år. Der
er kun én der har fundet den - og det var en snydepels der
arbejdede ved min daværende udbyder og benyttede sin rootadgang
bare for at drille.

--
Bertel
http://bertel.lundhansen.dk/   Fiduso: http://fiduso.dk/

Lars Thomsen Nielsen (22-06-2005)
Kommentar
Fra : Lars Thomsen Nielsen


Dato : 22-06-05 21:50

> Jeg har haft en fil liggende på min hjemmeside nu i 4-5 år. Der
> er kun én der har fundet den - og det var en snydepels der
> arbejdede ved min daværende udbyder og benyttede sin rootadgang
> bare for at drille.

Hvordan kan du se at der ikke er flere der har hentet din fil? Findes der
statestik for sådan noget?

Lars



Andreas Kleist Svend~ (23-06-2005)
Kommentar
Fra : Andreas Kleist Svend~


Dato : 23-06-05 00:04

Lars Thomsen Nielsen wrote:
> Hvordan kan du se at der ikke er flere der har hentet din fil? Findes der
> statestik for sådan noget?

Ja, webservere har logfiler der "husker" alt. På apache er det
access.log du skal kigge i. Den ligger typisk i /var/log/httpd/ på
*nix-maskiner.

En linie i denne kunne se således ud:
127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] "GET /apache_pb.gif
HTTP/1.0" 200 2326

Af den kan man (bl.a.) se at ip-adressen 127.0.0.1 (localhost) anmodede
om filen /apache_pb.gif pågældende dato.

En sådan linie er der for alt der bliver hentet fra webserveren.

/Andreas

Bertel Lund Hansen (23-06-2005)
Kommentar
Fra : Bertel Lund Hansen


Dato : 23-06-05 02:44

Lars Thomsen Nielsen skrev:

> Hvordan kan du se at der ikke er flere der har hentet din fil? Findes der
> statestik for sådan noget?

Som Andreas forklarer, er der logfiler. Dem har jeg dog ikke
kikket i. Teksten i filen er af en sådan art at jeg med ret stor
sandsynlighed ville modtage en mail hvis der var nogen der fandt
den (som kan læse dansk). I starten opfordrede jeg flittigt de
folk til at finde den som påstod at den gemmemetode er usikker.
Dem hørte jeg ikke mere fra i den anledning.

--
Bertel
http://bertel.lundhansen.dk/   Fiduso: http://fiduso.dk/

Allan Vebel (23-06-2005)
Kommentar
Fra : Allan Vebel


Dato : 23-06-05 14:41

Bertel Lund Hansen <nospamfilius@lundhansen.dk> skrev:

> I starten opfordrede jeg flittigt de folk til at finde den som
> påstod at den gemmemetode er usikker.

Det er samme erfaring jeg har gjort mig. Jeg har også en
speciel tekst som hverken folk eller søgetjenester har kunnet
finde, og den har ligget der siden januar 2000.

--
Allan Vebel
http://html-faq.dk



Bertel Lund Hansen (23-06-2005)
Kommentar
Fra : Bertel Lund Hansen


Dato : 23-06-05 16:54

Allan Vebel skrev:

> finde, og den har ligget der siden januar 2000.

Jeg kikkede lige efter. Jeg skrev faktisk datoen i den
oprindelige fil: d.25/1-1999

--
Bertel
http://bertel.lundhansen.dk/   Fiduso: http://fiduso.dk/

Søg
Reklame
Statistik
Spørgsmål : 177501
Tips : 31968
Nyheder : 719565
Indlæg : 6408527
Brugere : 218887

Månedens bedste
Årets bedste
Sidste års bedste