/ Forside / Teknologi / Operativsystemer / Linux / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Linux
#NavnPoint
o.v.n. 11177
peque 7911
dk 4814
e.c 2359
Uranus 1334
emesen 1334
stone47 1307
linuxrules 1214
Octon 1100
10  BjarneD 875
Bestemme en fils encoding (unicode, ascii ~
Fra : Morten


Dato : 03-02-03 11:21

Hej. Hvordan kan jeg se en fils encoding? Jeg har en fil, som jeg mener
er en unicode fil, men jeg vil gerne være helt sikker. Den ligner en rodebutik
i "emacs", mens "more" og "vi" viser indholdet korrekt. Brug af "file" giver
at det er en MP3, hvilket ikke er tilfældet.

Hvordan får jeg at se om det er en unicode eller utf8 fil? Findes der en
command line converter unicode -> ascii fex. (så vidt det nu er muligt..)

Mvh Morten

 
 
Morten (04-02-2003)
Kommentar
Fra : Morten


Dato : 04-02-03 10:03

> Hej. Hvordan kan jeg se en fils encoding? Jeg har en fil, som jeg mener
> er en unicode fil, men jeg vil gerne være helt sikker.

[dellbert]~/cip>file -i IT_AFW15_STAGE.sql
file: Using regular magic file `/usr/share/magic.mime'
IT_AFW15_STAGE.sql: text/plain; charset=utf-16

> Findes der en command line converter unicode -> ascii fex.

[dellbert]~/cip>iconv -f utf-16 -t ascii IT_CWS31_STAGE.sql > out.txt
iconv: illegal input sequence at position 593298

Nogen der kender en måde man kan tvinge ivconv til at ignorere fejl?
Har prøvet den udokumenterede -c switch, men den fanger kun den første..

[dellbert]~/cip>iconv -c -f utf-16 -t ascii IT_CWS31_STAGE.sql > out.txt
iconv: illegal input sequence at position 606146

Morten

Claus Rasmussen (04-02-2003)
Kommentar
Fra : Claus Rasmussen


Dato : 04-02-03 11:18

Morten wrote:

> Hvordan får jeg at se om det er en unicode eller utf8 fil?

Kig på de første to bytes. Hvis de er lig med 0xFEFF er det utf-16.
Vender de to bytes om, har du fået fat i en little-endian udgave af
utf-16.

-Claus


Søg
Reklame
Statistik
Spørgsmål : 177560
Tips : 31968
Nyheder : 719565
Indlæg : 6408943
Brugere : 218888

Månedens bedste
Årets bedste
Sidste års bedste