|
| Hvilket tegnsæt? Fra : Jacob Tranholm |
Dato : 22-03-05 01:21 |
|
Igennem mange år har jeg anvendt ISO-8859-1 som standard tegnsæt på mine
computere, men i forbindelse med en konvertering af nogle filer fra UTF-8
til ISO-8859-1 kom jeg til at læse lidt mere om unicode. - Og en hel del af
argumenterne for anvendelse af unicode lyder faktisk meget fornuftige...
I denne nyhedsgruppe antager jeg, at en del af deltagerne faktisk har en
baggrund som systemadministratorer; og spørgsmålet er derfor:
Hvilket tegnsæt er det mest hensigsmæssigt at anvende i Danmark?
Spørgsmålet gælder for både servere og arbejdsstationer.
| |
Klaus Ellegaard (22-03-2005)
| Kommentar Fra : Klaus Ellegaard |
Dato : 22-03-05 06:49 |
|
Jacob Tranholm <jacob_tranholm@hotmail.com> writes:
>I denne nyhedsgruppe antager jeg, at en del af deltagerne faktisk har en
>baggrund som systemadministratorer; og spørgsmålet er derfor:
>
>Hvilket tegnsæt er det mest hensigsmæssigt at anvende i Danmark?
ISO-8859-1.
Der er alt for meget derude, der ikke kan overskue UTF-8, så
medmindre man er sikker på, at alverdens kunder og emner har
support for andet, er ISO-8859-1 stadig vejen frem.
Godt nok mangler -1 et euro-tegn, og det kan være et udmærket
argument for at skifte til -15. Fordelen er, at praktisk talt
alle tegn er ens mellem de to, så selvom en klient ikke kan
-15, vil indholdet stadig kunne læses. Med undtagelse af
Euro-tegnet. Det vil typisk blive erstattet med et ? eller .
Risikoen ved -15 er gamle klienter, der ikke forstår -15. De
vil i nogle tilfælde råbe op om, at denne mail (eller hvad det
nu er) er skrevet i et mærkeligt tegnsæt og måske ikke kan
læses. Om man vil prøve alligevel og håbe det bedste?
Jeg ser flere og flere websites, hvor indholdet er UTF-8, men
hvor Content stadig specificerer ISO-8859-1. Det giver det
kendte dobbelt-snask i stedet for æøå, og det ser skrækkeligt
ud. Det ville være kedeligt at sende den slags til kunder -
uanset at ens materiale overholder alle standarder i den
sammenhæng.
ISO-8859-1 er nok den mest udbredte extension ovenpå ASCII,
og ASCII har haft 37 år til at blive totalt indgroet overalt.
UTF-8 har heldigvis set lyset og er ASCII-kompatibel, men når
man har brug for danske bogstaver, så snakker vi sikkert om
op mod 10 år endnu, før UTF-8 har nået en rimelig udbredelse.
Mvh.
Klaus.
| |
Anders Jensen (22-03-2005)
| Kommentar Fra : Anders Jensen |
Dato : 22-03-05 15:00 |
|
Jeg har lige et spørgsmål i samme katagori.
Emnet om tegnsæt, fik mig lige til at indsætte følgende:
/etc/login.conf:
:charset=UTF-8:\
:lang=da_DK.UTF-8:\
Når jeg tager en SSH til min FreeBSD, så kan jeg godt skrive "æøå" i
prompten, men hvis jeg tager en directory listning over nogle filer,
skrevet fra en Windows maskine (over et Samba share), så skriver den
bare "?" ved de danske tegn. Hvis jeg ser filerne fra min Windows, ser
de fine ud.
Er det min Samba den er gal med (den har jeg ikke pillet ved endnu)? Jeg
kan jo ikke helt se, hvad den har med filerne at gøre eftersom det er
lokale filer på disken, men måske er filerne blevet gemt "forkert"?
-bash-3.00$ echo æøå
æøå
-bash-3.00$ ls -l
-rwxrw-r-- 1 me wheel 20778 15 Maj 2001 S?rens ?leruse.txt
| |
|
|