Martin Kiefer skrev:
> Et eksempel:
http://80.163.89.164/index.html
>
> denne side skulle indeholde
> æøå ÆØÅ
> æææææææ
> øøøøøøø
> ååååååå
> ÆÆÆÆÆÆÆ
> ØØØØØØØ
> ÅÅÅÅÅÅÅ
>
> Men indeholder:
>
> æøå ÃÃÃ
>
> æææææææ
> øøøøøøø
> ååååååå
> ÃÃÃÃÃÃÃ
> ÃÃÃÃÃÃÃ
> Ã
Udefra ser siden således ud:
#v+
$ w3m -dump_both
http://80.163.89.164/index.html
HTTP/1.0 200 OK
Date: Tue, 03 Feb 2004 07:52:28 GMT
Server: Apache/2.0.48 (Fedora)
Last-Modified: Tue, 03 Feb 2004 07:19:50 GMT
ETag: "4ec05-38-87199180"
Accept-Ranges: bytes
Content-Type: text/html; charset=UTF-8
Connection: close
Proxy-Connection: close
æøå ÆØÅ
æææææææ
øøøøøøø
ååååååå
ÆÆÆÆÆÆÆ
ØØØØØØØ
ÅÅÅÅÅÅÅ
$
#v-
Din webserver fortæller altså omverdenen at siden er skrevet i utf-8,
men de data der kommer tilbage er tydeligvis skrevet i iso-8859-1 eller
et beslægtet tegnsæt. Hvis du bringer overensstemmelse mellem de to
tegnsæt, vil siden se ud som forventet.
Desuden er det vel lidt af en tilsnigelse at kalde sideformatet for
HTML. Siden indeholder ikke et eneste af de elementer der kendetegner
HTML. At sige "text/plain" ville være mere rammende.
--
Klaus Alexander Seistrup, Copenhagen, Denmark.
http://www.seistrup.dk/ ·
http://www.pnx.dk/