/ Forside / Teknologi / Operativsystemer / Linux / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Linux
#NavnPoint
o.v.n. 11177
peque 7911
dk 4814
e.c 2359
Uranus 1334
emesen 1334
stone47 1307
linuxrules 1214
Octon 1100
10  BjarneD 875
Encoding
Fra : Thomas Lindgaard


Dato : 20-06-04 17:24

Hejsa

Jeg er snart ved at være træt af encoding... (har kæmpet en hel del med
det siden jeg skiftede til Linux for 6 mdr. siden).

Jeg har downloadet noget adresse-værk fra Kort- og Matrikelstyrelsens
hjemmeside i form af nogle CSV-filer. Hvis jeg f.eks. åbner amt.txt, så
ser det ud som følger:

"AmtNr";"AmtNavn"
"15";"Kbenhavns Amtskommune"
"20";"Frederiksborg Amtskommune"
"25";"Roskilde Amtskommune"
"30";"Vestsj?lands Amtskommune"
"35";"Storstrms Amtskommune"
"40";"Bornholms Amtskommune"
"42";"Fyns Amtskommune"
"50";"Snderjyllands Amtskommune"
"55";"Ribe Amtskommune"
"60";"Vejle Amtskommune"
"65";"Ringkbing Amtskommune"
"70";"?hus Amtskommune"
"76";"Viborg Amtskommune"
"80";"Nordjyllands Amtskommune"

Som det (forhåbentlig) fremgår, så forsvinder ø'er, æ'er bliver til
et hvidt spørgsmålstegn på sort baggrund og æder desuden det
næste bogstav, og å bliver ligeledes til et spørgsmålstegn.

Hvis jeg åbner filen i Emacs er der ingen problemer - undtagen hvis jeg
skulle finde på at rette i filen og gemme den igen, for i så fald vil de
spørgsmålstegnene blive til to underscores...

Hvordan får jeg konverteret mine tekstfiler til noget, hvor danske tegn
ikke går i kokasse? Jeg formoder at det har noget at gøre med UTF-8
vs. ISO-8859-1 at gøre...

(Jeg har en 5 dage gammel installation af FC2 kørende.)

--
Mvh.
/Thomas


 
 
Jesper Harder (20-06-2004)
Kommentar
Fra : Jesper Harder


Dato : 20-06-04 19:05

Thomas Lindgaard <thomas@it-snedkeren.BLACK_HOLE.dk> writes:

> Hvis jeg f.eks. åbner amt.txt, så ser det ud som følger:
>
> "AmtNr";"AmtNavn"
> "15";"Kbenhavns Amtskommune"
>
> Som det (forhåbentlig) fremgår, så forsvinder ø'er, æ'er bliver til
> et hvidt spørgsmålstegn på sort baggrund og æder desuden det
> næste bogstav, og å bliver ligeledes til et spørgsmålstegn.
>
> Hvis jeg åbner filen i Emacs er der ingen problemer -

Nu er jeg forvirret -- i hvilket program opstår de ovennævnte
problemer så?

> undtagen hvis jeg skulle finde på at rette i filen og gemme den
> igen, for i så fald vil de spørgsmålstegnene blive til to
> underscores...

I Emacs selv eller i et uspecificeret andet program?

> Hvordan får jeg konverteret mine tekstfiler til noget, hvor danske
> tegn ikke går i kokasse?

For det første: Find ud af hvilket tegnsæt filen bruger -- tast `C-h C
RET' i Emacs, så fremgår det af "Coding system for saving this
buffer". Hvis du vil konvertere til et andet tegnsæt, kan du taste
`C-x RET f'.

--
Jesper Harder <http://purl.org/harder/>

Søg
Reklame
Statistik
Spørgsmål : 177551
Tips : 31968
Nyheder : 719565
Indlæg : 6408834
Brugere : 218887

Månedens bedste
Årets bedste
Sidste års bedste