Morten P. Andersen skrev:
> <meta http-equiv="Content-Type" content="text/html;
> charset=ISO-8859-1">
=> Sæt tegnsættet til iso-8859-1 (Latin 1, vesteuropæisk).
> <meta http-equiv="content-type" content=
> "text/html; charset=utf-8" />
=> Sæt tegnsættet til utf-8 (unicode, internationalt).
> gør de to sætninger det samme,
Ja og nej. Ja, fordi begge sætninger definerer det tegnsæt der skal
anvendes på siden. Nej, fordi det ikke er samme tegnsæt.
> altså sætter et dansk tegnsæt
Hverken Latin 1 eller utf-8 er "danske" tegnsæt, men begge tegnsæt
kan bruges til danske tekster (da de bl.a. indeholder æøå).
Latin 1 (iso-8859-1) er den mest almindelige på dansksprogede
websider, så hvis du ikke ved hvilket tegnsæt du arbejder i, er det
formentlig det du skal vælge.
UTF/unicode indeholder langt flere tegn end Latin 1 - her kan man
med samme tegnsæt angive både danske, græske, russiske, arabiske og
japanske bogstaver og tegn (listen er ikke komplet).
Det er vigtigt at man angiver et tegnsæt der svarer til det man
(bevidst eller ubevidst) benytter i filen. Alle tegnsæt er enige om
placeringen af de første 128 tegn (ascii-tegnsættet), men tegnene
herefter (fx æ, ø og å) har forskellige placeringer i forskellige
tegnsæt. Hvis man har skrevet æ i en fil gemt som utf-8, men
fortæller browseren at den skal læse filen som latin 1, kommer der
noget andet end et æ ud til brugeren.
En lille note: Tegnsæt kan også angives i en skjult http-header fra
serveren. Hvis en sådan header sendes med når browseren modtager
siden, vil det være tegnsætværdien herfra der anvendes, uanset hvad
man måtte skrive i meta-koden i html-dokumentet.
--
Jens Gyldenkærne Clausen
Svar venligst under det du citerer, og citer kun det der er
nødvendigt for at forstå dit svar i sammenhængen. Se hvorfor og
hvordan på
http://usenet.dk/netikette/citatteknik.html