|
| DR's webting under Linux ( Var: Re: Fra : Jesper Krogh |
Dato : 30-03-04 10:10 |
|
I dk.edb.system.unix, skrev Christian Joergensen:
> Nordeas netbank virker under Linux.
>
> Realplayer virker under Linux.
> Det gjorde det ihvertfald sidst jeg prøvede (for et par uger siden).
Nu er jeg ikke skidemeget inde i det men denne her:
http://www.dr.dk/nyheder/penge/article.jhtml?articleID=157830
Er vist kun i MS-asfdasfdfaf -format, hvilket jeg skal installere codecs
som ikke må distribueres frit for at se?
Eller har jeg misset en måde?
--
../Jesper Krogh, jesper@krogh.cc, Jabber ID: jesper@jabbernet.dk
Jabber - Det eneste instant messaging system der sikrer DIT privatliv.
| |
Kent Friis (30-03-2004)
| Kommentar Fra : Kent Friis |
Dato : 30-03-04 10:41 |
|
Den Tue, 30 Mar 2004 11:09:43 +0200 skrev Jesper Krogh:
>I dk.edb.system.unix, skrev Christian Joergensen:
>> Nordeas netbank virker under Linux.
>>
>> Realplayer virker under Linux.
>> Det gjorde det ihvertfald sidst jeg prøvede (for et par uger siden).
>
>Nu er jeg ikke skidemeget inde i det men denne her:
> http://www.dr.dk/nyheder/penge/article.jhtml?articleID=157830
mplayer mms://wms.dr.dk/storage/auto/Escenic/tva3012.810533594601.wmv
>Er vist kun i MS-asfdasfdfaf -format, hvilket jeg skal installere codecs
>som ikke må distribueres frit for at se?
Jeg er ikke inde i hvilke codecs der må distribueres og hvilke der ikke
må, det skal man jo nærmest være advokat for at kunne finde rundt i.
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Krogh (30-03-2004)
| Kommentar Fra : Jesper Krogh |
Dato : 30-03-04 10:46 |
|
I dk.edb.system.unix, skrev Kent Friis:
> Den Tue, 30 Mar 2004 11:09:43 +0200 skrev Jesper Krogh:
> >I dk.edb.system.unix, skrev Christian Joergensen:
> >> Nordeas netbank virker under Linux.
> >>
> >> Realplayer virker under Linux.
> >> Det gjorde det ihvertfald sidst jeg prøvede (for et par uger siden).
> >
> >Nu er jeg ikke skidemeget inde i det men denne her:
> > http://www.dr.dk/nyheder/penge/article.jhtml?articleID=157830
>
> mplayer mms://wms.dr.dk/storage/auto/Escenic/tva3012.810533594601.wmv
Hvordan pokker kom du frem til den url?
--
../Jesper Krogh, jesper@krogh.cc, Jabber ID: jesper@jabbernet.dk
Jabber - Det eneste instant messaging system der sikrer DIT privatliv.
| |
Kent Friis (30-03-2004)
| Kommentar Fra : Kent Friis |
Dato : 30-03-04 12:09 |
|
Den Tue, 30 Mar 2004 11:45:40 +0200 skrev Jesper Krogh:
>I dk.edb.system.unix, skrev Kent Friis:
>> Den Tue, 30 Mar 2004 11:09:43 +0200 skrev Jesper Krogh:
>> >I dk.edb.system.unix, skrev Christian Joergensen:
>> >> Nordeas netbank virker under Linux.
>> >>
>> >> Realplayer virker under Linux.
>> >> Det gjorde det ihvertfald sidst jeg prøvede (for et par uger siden).
>> >
>> >Nu er jeg ikke skidemeget inde i det men denne her:
>> > http://www.dr.dk/nyheder/penge/article.jhtml?articleID=157830
>>
>> mplayer mms://wms.dr.dk/storage/auto/Escenic/tva3012.810533594601.wmv
>
>Hvordan pokker kom du frem til den url?
højreclickede på en af URL'erne til højre for billedet, og valgte
"copy link location". wget'ede den, og åbnede filen i less - deri
står URL'en.
Normalt klarer mplayerplug-in det automatisk, men jeg har fået ødelagt
min, så jeg må gøre det manuelt indtil jeg får taget mig sammen til
at gøre noget ved problemet.
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jens Gyldenkærne Cla~ (01-04-2004)
| Kommentar Fra : Jens Gyldenkærne Cla~ |
Dato : 01-04-04 21:07 |
|
Carl Drud skrev:
> Der er nogen Xnews brugere i news.software.readers der sværger
> til Mime-proxy. Den skulle vist kunne klare utf-8.
Mere end morvers håndtering af utf-8?
--
Jens Gyldenkærne Clausen
»Diplomatiet består netop i, at de gamle kommatister kan få lov til
at tro, at de har vundet. Men i virkeligheden har de tabt.«
Ole Togeby i Information
| |
Jens Andersen (03-04-2004)
| Kommentar Fra : Jens Andersen |
Dato : 03-04-04 11:46 |
|
Jesper Harder <harder@myrealbox.com> writes:
> Thomas Bjorn Andersen <tbaNOSPAM200402@gen-v.net> writes:
>
>> Kunne du ikke lige poste en kogebogsopskrift paa, hvordan du opnaar
>> det resultat? Terminalprogram, emacsversion gnus-version, variable
>> etc.
>
> 1. Start en xterm, der bruger utf-8 samt en Unicode skrift:
>
> xterm -u8 -fn
> "-b&h-lucidatypewriter-medium-r-normal-*-*-120-*-*-m-*-iso10646-1"
>
> 2. Sæt dit locale til utf-8:
>
> export LANG=en_US.UTF-8
>
> 3. Start Emacs
>
> emacs -nw
>
> I stedet for at angive skriften på kommandolinjen, kan du gøre det i
> .Xdefaults, og i stedet for at ændre locale kan du bruge
>
> (set-language-environment "utf-8")
>
> i din .emacs fil.
>
> Xtermen er fra XFree86 4.2.0(165), og det virker med Emacs 21.3.
Jeg har prøvet ovenstående, og jeg kan godt _se_ æøå i Gnus og
emacs, men jeg kan ikke selv skrive dem! Jeg kan godt skrive æøå i en
almindelig xterm, og jeg kan godt skrive dem hvis jeg starter emacs i et
X window, men når jeg starter emacs med 'emacs -nw' virker det ikke i
min xterm! :-/
Nogen bud på hvad der er galt?
--
Mvh. Jens Andersen,
Registered Linux user #293986, http://counter.li.org
| |
Thomas Bjorn Anderse~ (07-04-2004)
| Kommentar Fra : Thomas Bjorn Anderse~ |
Dato : 07-04-04 14:45 |
|
Jesper Harder <harder@myrealbox.com> writes:
> Thomas Bjorn Andersen <tbaNOSPAM200402@gen-v.net> writes:
>
>> Jesper Harder <harder@myrealbox.com> writes:
>>
>>> Sludder. Selvfølgelig kan man få en terminalemulator til at vise
>>> begge tegn korrekt. Her er et skærmbillede af Gnus i en xterm, der
>>> viser begge tegn: < http://www.ifa.au.dk/~harder/xterm.png>.
>>
>> Kunne du ikke lige poste en kogebogsopskrift paa, hvordan du opnaar
>> det resultat? Terminalprogram, emacsversion gnus-version, variable
>> etc.
[snip snip]
Tju hej, det virker jo! Jeg skulle dog lige have slettet LC_ALL fra
mit environment. Jeg ved ikke hvorfor, men det var sat til "C".
Hvis jeg nu gerne vil have engelske fejlbeskeder (amerikanske?) og
amerikansk tastatur, men muligheden for at se og arbejde med danske
tegn, hvad skal jeg så sætte mine locale settings til?
Thomas
--
Thomas Bjorn Andersen
+++ATH
| |
Jens Gyldenkærne Cla~ (01-04-2004)
| Kommentar Fra : Jens Gyldenkærne Cla~ |
Dato : 01-04-04 09:35 |
|
Ivar Madsen skrev:
> Nogen der har overblik over hvor mange newsklienter der ikke
> kan håndtere UTF-8?
Xnews kan generelt ikke håndtere tegnsæt (den benytter bare
Windows' standardtegnsæt der heldigvis ligger tæt på Latin 1).
Jeg kan ikke huske hvilke andre programmer der har den type
problemer.
Det gratis program morver (< http://www.morver.de>) kan i øvrigt
rette op på mange tegnsætproblemer. Det oversætter ind- og udgående
newsindlæg så windows-programmet ser det i windows' standard
tegnsæt mens newsserveren modtager det i en passende kodning. Dog
får man ikke glæde af alle specialtegnene i UTF - det er kun de
tegn der findes i windowstegnsættet (1252) der kan vises.
--
Jens Gyldenkærne Clausen
Svar venligst under det du citerer, og citer kun det der er
nødvendigt for at forstå dit svar i sammenhængen. Se hvorfor og
hvordan på http://usenet.dk/netikette/citatteknik.html
| |
Carl Drud (01-04-2004)
| Kommentar Fra : Carl Drud |
Dato : 01-04-04 17:51 |
|
On Thu, 01 Apr 2004 10:34:31 +0200, Jens Gyldenkærne Clausen wrote:
> Jeg kan ikke huske hvilke andre programmer der har den type
> problemer.
Gravity kan vist heller ikke.
> Det gratis program morver (< http://www.morver.de>)
Der er nogen Xnews brugere i news.software.readers der sværger til
Mime-proxy. Den skulle vist kunne klare utf-8.
http://plamaiziere.free.fr/mp_pagen.html
--
Med venlig hilsen
Carl
| |
Jesper Harder (01-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 01-04-04 23:55 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Den Thu, 01 Apr 2004 00:04:40 +0200 skrev Jesper Harder:
>
>>Selvfølgelig kan man få en terminalemulator til at vise begge tegn
>>korrekt. Her er et skærmbillede af Gnus i en xterm, der viser begge
>>tegn: < http://www.ifa.au.dk/~harder/xterm.png>.
>
> Uden at xterm'en begynder at vise iso8859-15 forkert?
Ja.
>>Problemet er bare, at din klient erstattede det forkerte tegn (det
>>tegn som faktisk er indeholdt i latin-9) med et spørgsmålstegn i
>>stedet for det andet.
>
> Muligvis den stadig tror den kører latin1?
Noget i den retning. Jeg vil tro, at udviklerne har valgt at springe
over, hvor gærdet er lavest, og lade som om latin-1 og latin-9 er
nøjagtig det samme. Det virker utvivlsomt godt nok 95% af tiden, så
pyt med de gange det ikke virker. Kort og godt: sløset programmering.
>>Tegnsættet skal da bare vælges på baggrund af de tegn, som faktisk
>>optræder i teksten. Hvor svært kan det være?
>
> AI er ikke implementeret endnu.
Det er en simpel algoritme. Hvorfor tror du det skulle være svært?
> "set mime_charset vælg ud fra teksten" er ikke en option ret mange
> newsreadere forstår.
Gnus gør. Det er et SHOULD i RFC 2046 afsnit 4.1.2, så enhver klient,
der ikke kan gøre det i et eller andet omfang, hører ikke hjemme på
Internettet.
--
Jesper Harder < http://purl.org/harder/>
| |
Klaus Ellegaard (02-04-2004)
| Kommentar Fra : Klaus Ellegaard |
Dato : 02-04-04 00:14 |
|
Jesper Harder <harder@myrealbox.com> writes:
>Gnus gør. Det er et SHOULD i RFC 2046 afsnit 4.1.2, så enhver klient,
>der ikke kan gøre det i et eller andet omfang, hører ikke hjemme på
>Internettet.
På tilsvarende måde hører Gnus heller ikke selv hjemme på Internet:
den overtræder på skammeligste vis RFC1036 afsnit 2.1.2. Hvilket
samtlige andre news-readere i øvrigt også gør sig skyldige i.
Kan man snakke om "civil ulydighed" som et gode? Og hvorfor er det
så vigtigt at overholde en SHOULD i RFC2046, når det er okay at
overtræde et MUST i RFC1036?
Mvh.
Klaus.
| |
Kent Friis (02-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 02-04-04 22:24 |
|
Den Fri, 02 Apr 2004 00:55:11 +0200 skrev Jesper Harder:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Den Thu, 01 Apr 2004 00:04:40 +0200 skrev Jesper Harder:
>>
>>>Selvfølgelig kan man få en terminalemulator til at vise begge tegn
>>>korrekt. Her er et skærmbillede af Gnus i en xterm, der viser begge
>>>tegn: < http://www.ifa.au.dk/~harder/xterm.png>.
>>
>> Uden at xterm'en begynder at vise iso8859-15 forkert?
>
>Ja.
Interessant, hvordan gør man det? UTF-8 kan ikke gøre det, for den
bruger 128-255 (som er hele forskellen på ASCII og iso8859-15) til
multybyte-tegn.
>>>Tegnsættet skal da bare vælges på baggrund af de tegn, som faktisk
>>>optræder i teksten. Hvor svært kan det være?
>>
>> AI er ikke implementeret endnu.
>
>Det er en simpel algoritme. Hvorfor tror du det skulle være svært?
Det kommer jo an på OSS'en for den valgte gruppe. i dk.* hierakiet
ville det fx være "brug iso8859-1, hvis teksten indeholder 1/2, og
iso8859-15 hvis vi snakker om euro (tilsvarende de andre forskelle).
Hvis begge dele bruges, eller der bruges tegn der ligger uden for
de to tegnsæt (fx hvis man besvarer et indlæg der bruger UTF-8 i
strid med OSS'en), så konverter til default tegnsæt".
>> "set mime_charset vælg ud fra teksten" er ikke en option ret mange
>> newsreadere forstår.
>
>Gnus gør.
Jeg troede Microsoft var de eneste der kunne finde på at oversætte
keywords
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Harder (05-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 05-04-04 16:44 |
|
Kent Friis <leeloo@phreaker.net> writes:
> Den Mon, 05 Apr 2004 16:03:34 +0200 skrev Jesper Harder:
>
>> Det ville forekomme ret dilletantisk at være nødt til at sige "Uha,
>> den funktion kan jeg sandelig ikke ændre", bare fordi filen bruger
>> et andet tegnsæt end mit eget locale.
>
> Hvem sagde "være nødt til"?
Det gjorde du, da du på forhånd afviste at arbejde med andet end ASCII
og latin-x.
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (05-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 05-04-04 19:03 |
|
Den Mon, 05 Apr 2004 17:44:18 +0200 skrev Jesper Harder:
> Kent Friis <leeloo@phreaker.net> writes:
>
>> Den Mon, 05 Apr 2004 16:03:34 +0200 skrev Jesper Harder:
>>
>>> Det ville forekomme ret dilletantisk at være nødt til at sige "Uha,
>>> den funktion kan jeg sandelig ikke ændre", bare fordi filen bruger
>>> et andet tegnsæt end mit eget locale.
>>
>> Hvem sagde "være nødt til"?
>
> Det gjorde du, da du på forhånd afviste at arbejde med andet end ASCII
> og latin-x.
Nej.
Jeg vil ikke være nødt til at sige "Uha, den funktion kan jeg sandelig
ikke ændre", for jeg vil aldrig få brug for at lave dit arbejde.
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Harder (02-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 02-04-04 17:20 |
|
Thomas Bjorn Andersen <tbaNOSPAM200402@gen-v.net> writes:
> Jesper Harder <harder@myrealbox.com> writes:
>
>> Sludder. Selvfølgelig kan man få en terminalemulator til at vise
>> begge tegn korrekt. Her er et skærmbillede af Gnus i en xterm, der
>> viser begge tegn: < http://www.ifa.au.dk/~harder/xterm.png>.
>
> Kunne du ikke lige poste en kogebogsopskrift paa, hvordan du opnaar
> det resultat? Terminalprogram, emacsversion gnus-version, variable
> etc.
1. Start en xterm, der bruger utf-8 samt en Unicode skrift:
xterm -u8 -fn "-b&h-lucidatypewriter-medium-r-normal-*-*-120-*-*-m-*-iso10646-1"
2. Sæt dit locale til utf-8:
export LANG=en_US.UTF-8
3. Start Emacs
emacs -nw
I stedet for at angive skriften på kommandolinjen, kan du gøre det i
..Xdefaults, og i stedet for at ændre locale kan du bruge
(set-language-environment "utf-8")
i din .emacs fil.
Xtermen er fra XFree86 4.2.0(165), og det virker med Emacs 21.3.
--
Jesper Harder < http://purl.org/harder/>
| |
Jesper Harder (30-03-2004)
| Kommentar Fra : Jesper Harder |
Dato : 30-03-04 12:33 |
|
leeloo@phreaker.net (Kent Friis) writes:
Din nyhedslæser er defekt. Det indlæg du svarer på havde
overskriften:
Re: DR's webting under Linux ( Var: Re: "linux.dk"?½)
men din overskrift er:
Re: DR's webting under Linux ( Var: Re: "linux.dk"?Å“)
Det er lidt irriterende at få en grim trådoversigt i alle tråde, som
du deltager i.
--
Jesper Harder < http://purl.org/harder/>
| |
Peter Jensen (30-03-2004)
| Kommentar Fra : Peter Jensen |
Dato : 30-03-04 13:05 |
|
Jesper Harder wrote:
> Din nyhedslæser er defekt. Det indlæg du svarer på havde
> overskriften:
>
> Re: DR's webting under Linux ( Var: Re: "linux.dk"?½)
>
> men din overskrift er:
>
> Re: DR's webting under Linux ( Var: Re: "linux.dk"??)
>
> Det er lidt irriterende at få en grim trådoversigt i alle tråde, som
> du deltager i.
Det ser faktisk ud som om det er din newsreader der opfører sig sært.
Det er i hvert fald dit indlæg som har en anderledes Subject linje end
de andre. Det har måske noget at gøre med at du bruger UTF-8, mens alle
andre i tråden bruger en variant af ISO-8859.
--
PeKaJe
"Send lawyers, guns and money..."
-- Lyrics from a Warren Zevon song
| |
Jens Andersen (04-04-2004)
| Kommentar Fra : Jens Andersen |
Dato : 04-04-04 15:18 |
|
Jesper Harder <harder@myrealbox.com> writes:
> Jens Andersen <FJERNMIG.jens@abk.auc.dk> writes:
>
>> Jeg har prøvet ovenstående, og jeg kan godt _se_ æøå i Gnus og
>> emacs, men jeg kan ikke selv skrive dem!
>>
>> Nogen bud på hvad der er galt?
>
> Ja, du har brug for:
>
> (set-keyboard-coding-system 'utf-8)
Faktisk havde jeg også brug for:
(set-terminal-coding-system 'utf-8)
Nu mangler jeg bare at få det til at virke i min Eterm også, så jeg kan
køre Gnus med gennemsigtig baggrund :)
--
Mvh. Jens Andersen,
Registered Linux user #293986, http://counter.li.org
| |
Carl Drud (01-04-2004)
| Kommentar Fra : Carl Drud |
Dato : 01-04-04 21:36 |
|
On Thu, 01 Apr 2004 22:07:15 +0200, Jens Gyldenkærne Clausen wrote:
> Mere end morvers håndtering af utf-8?
Det skal jeg ikke kunne sige. Jeg har blot ofte set den nævnt i omtalte
gruppe og jeg så for nylig Henrik teste den.
news:28.03.2004.10.52.21_dk.test_@hkh.dyndns.dk
--
Med venlig hilsen
Carl
| |
Jesper Harder (02-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 02-04-04 00:42 |
|
Klaus Ellegaard <klausellegaard@msn.com> writes:
> På tilsvarende måde hører Gnus heller ikke selv hjemme på Internet:
> den overtræder på skammeligste vis RFC1036 afsnit 2.1.2. Hvilket
> samtlige andre news-readere i øvrigt også gør sig skyldige i.
Fordømt. Usenet skulle have været nedlagt for fire år siden ... I kan
godt gå hjem nu allesammen.
Men der er heldigvis en redning i afsnit 2., der siger at hvis RFC
1036 er i modstrid med mailstandarden, så skal man ignorere RFC 1036.
> Kan man snakke om "civil ulydighed" som et gode? Og hvorfor er det
> så vigtigt at overholde en SHOULD i RFC2046, når det er okay at
> overtræde et MUST i RFC1036?
Bortset fra ovennævnte "formelle" redning, så kender du jo godt
svaret. Tocifrede årstal er forældede (lige som visse andre ting i
RFC 1036), hvorimod det afsnit i RFC 2046 stadig er lige så relevant
som da den blev udgivet.
--
Jesper Harder < http://purl.org/harder/>
| |
Klaus Ellegaard (02-04-2004)
| Kommentar Fra : Klaus Ellegaard |
Dato : 02-04-04 09:52 |
|
Jesper Harder <harder@myrealbox.com> writes:
>Bortset fra ovennævnte "formelle" redning, så kender du jo godt
>svaret. Tocifrede årstal er forældede (lige som visse andre ting i
>RFC 1036), hvorimod det afsnit i RFC 2046 stadig er lige så relevant
>som da den blev udgivet.
Personligt vil jeg bruge samme rationale over for 2046: der er
slet ikke et problem i praksis, så 2046 er dybt irrelevant de
fleste praktiske situationer: som udgangspunkt kører vi alle
ISO-8859-1(5), så hvad skal vi med MIME?
Der er ingen MIME-headers i denne artikel, og der er endnu ikke
nogen, der har klaget over inkompatibiliteter.
Mvh.
Klaus.
| |
Adam Sjøgren (02-04-2004)
| Kommentar Fra : Adam Sjøgren |
Dato : 02-04-04 00:55 |
|
On Thu, 1 Apr 2004 23:14:06 +0000 (UTC), Klaus wrote:
> På tilsvarende måde hører Gnus heller ikke selv hjemme på Internet:
> den overtræder på skammeligste vis RFC1036 afsnit 2.1.2. Hvilket
> samtlige andre news-readere i øvrigt også gør sig skyldige i.
Hvordan gør de det? Er det årstallet du mener?
1036 siger at man skal rette sig efter 822. 822 er afløst af 2822.
2822 siger:
date = day month year
year = 4*DIGIT / obs-year
[...]
> Og hvorfor er det så vigtigt at overholde en SHOULD i RFC2046, når
> det er okay at overtræde et MUST i RFC1036?
Hvis 822 ikke var afløst af 2822 forlængst, så ville jeg svare fordi
årstal med to cifre er åbenlyst tåbeligt.
Mvh.
--
"Mr. Cotton's... parrot. Same question." Adam Sjøgren
asjo@koldfront.dk
| |
Jesper Harder (03-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 03-04-04 01:20 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Interessant, hvordan gør man det?
Spørger du om, hvordan man viser en latin-9 tekst på en terminal, der
bruger utf-8? Der er en entydig afbildning mellem latin-9 og utf-8,
den bruger man bare, når teksten skal vises.
Det svarer til at bruge recode(1) fra kommandolinjen:
recode latin-9..utf-8 < latin9.txt
>>Det er en simpel algoritme. Hvorfor tror du det skulle være svært?
>
> Det kommer jo an på OSS'en for den valgte gruppe.
Ja. Gnus har en liste over, hvilke tegnsæt der er anbefalet i
forskellige hierarkier og i nogle få tilfælde enkeltgrupper.
> i dk.* hierakiet ville det fx være "brug iso8859-1, hvis teksten
> indeholder 1/2,
Netop.
> og iso8859-15 hvis vi snakker om euro (tilsvarende de andre
> forskelle).
Det er hvad *du* mener OSS'en burde sige, ikke hvad den faktisk siger.
> Hvis begge dele bruges, eller der bruges tegn der ligger uden for de
> to tegnsæt (fx hvis man besvarer et indlæg der bruger UTF-8 i strid
> med OSS'en), så konverter til default tegnsæt".
Nej, det taber information. Det rigtige er at bruge det mest
almindelige tegnsæt, som er i stand til repræsentere alle tegn.
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (03-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 03-04-04 09:34 |
|
Den Sat, 03 Apr 2004 02:20:28 +0200 skrev Jesper Harder:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Interessant, hvordan gør man det?
>
>Spørger du om, hvordan man viser en latin-9 tekst på en terminal, der
>bruger utf-8? Der er en entydig afbildning mellem latin-9 og utf-8,
>den bruger man bare, når teksten skal vises.
Nej, jeg spørger om hvordan man får den til at vise tegn fra flere
tegnsæt, UDEN at den begynder at vise iso8859-15 forkert.
Altså uden at man skal til at recode alt andet om til utf-8.
>>>Det er en simpel algoritme. Hvorfor tror du det skulle være svært?
>>
>> Det kommer jo an på OSS'en for den valgte gruppe.
>
>Ja. Gnus har en liste over, hvilke tegnsæt der er anbefalet i
>forskellige hierarkier og i nogle få tilfælde enkeltgrupper.
>
>> i dk.* hierakiet ville det fx være "brug iso8859-1, hvis teksten
>> indeholder 1/2,
>
>Netop.
>
>> og iso8859-15 hvis vi snakker om euro (tilsvarende de andre
>> forskelle).
>
>Det er hvad *du* mener OSS'en burde sige, ikke hvad den faktisk siger.
Hvis der slet ikke skal være noget at vælge imellem, er det slet ikke
nødvendigt med en algoritme, så skal der jo altid bruges iso8859-1 -
og hvis man så lige antager at vi skriver 2004, så bruger man iso8859-15
i stedet for, da den netop er en erstatning for iso8859-1.
>> Hvis begge dele bruges, eller der bruges tegn der ligger uden for de
>> to tegnsæt (fx hvis man besvarer et indlæg der bruger UTF-8 i strid
>> med OSS'en), så konverter til default tegnsæt".
>
>Nej, det taber information. Det rigtige er at bruge det mest
>almindelige tegnsæt, som er i stand til repræsentere alle tegn.
Og hvilket skulle det være? ibm865?
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Harder (03-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 03-04-04 14:45 |
|
Jens Andersen <FJERNMIG.jens@abk.auc.dk> writes:
> Jeg har prøvet ovenstående, og jeg kan godt _se_ æøå i Gnus og
> emacs, men jeg kan ikke selv skrive dem!
>
> Nogen bud på hvad der er galt?
Ja, du har brug for:
(set-keyboard-coding-system 'utf-8)
--
Jesper Harder < http://purl.org/harder/>
| |
Jesper Harder (07-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 07-04-04 19:02 |
|
Thomas Bjorn Andersen <tbaNOSPAM200402@gen-v.net> writes:
> Hvis jeg nu gerne vil have engelske fejlbeskeder (amerikanske?) og
> amerikansk tastatur, men muligheden for at se og arbejde med danske
> tegn, hvad skal jeg så sætte mine locale settings til?
Fik du ikke engelske beskeder med en_US.UTF-8?
Tastaturlayoutet bestemmes vist ikke af localet, men i en X
konfigurationsfil.
--
Jesper Harder < http://purl.org/harder/>
| |
Jacob Bunk Nielsen (30-03-2004)
| Kommentar Fra : Jacob Bunk Nielsen |
Dato : 30-03-04 13:18 |
|
Peter Jensen <usenet@pekajemaps.homeip.net> writes:
> Jesper Harder wrote:
>
>> Din nyhedslæser er defekt. Det indlæg du svarer på havde
>> overskriften:
>>
>> Re: DR's webting under Linux ( Var: Re: "linux.dk"?½)
>>
>> men din overskrift er:
>>
>> Re: DR's webting under Linux ( Var: Re: "linux.dk"??)
>>
>> Det er lidt irriterende at få en grim trådoversigt i alle tråde, som
>> du deltager i.
>
> Det ser faktisk ud som om det er din newsreader der opfører sig sært.
> Det er i hvert fald dit indlæg som har en anderledes Subject linje end
> de andre. Det har måske noget at gøre med at du bruger UTF-8, mens alle
> andre i tråden bruger en variant af ISO-8859.
Jesper er nødt til at bruge utf-8 når han skal citere både det
oprindelige subject og Kents subject. Problemet er Kents newsreader,
som bruger et andet tegnsæt end det subject han citerer. Det håndterer
newsreaderen ikke korrekt, men ændrer bare subject. Det har Jesper
helt ret i er noget snavs. At bruge utf-8 er ikke en uting, det er
bare ikke voldsomt godt understøttet i mange newsreadere, men det er
højst dem der er mangelfulde.
--
Jacob - www.bunk.cc
Where are the calculations that go with a calculated risk?
| |
Jesper Harder (30-03-2004)
| Kommentar Fra : Jesper Harder |
Dato : 30-03-04 13:23 |
|
Peter Jensen <usenet@pekajemaps.homeip.net> writes:
> Det ser faktisk ud som om det er din newsreader der opfører sig
> sært. Det er i hvert fald dit indlæg som har en anderledes Subject
> linje end de andre. Det har måske noget at gøre med at du bruger
> UTF-8,
Standardtegnsættet i dk-hierarkiet er iso-8859-1. Hvis et tegn, som
'œ', ikke er indeholdt i det, må man nødvendigvis bruge et andet --
her forekommer utf-8 at være et mindst lige så godt valg som
blindtarmen iso-8859-15.
> mens alle andre i tråden bruger en variant af ISO-8859.
De bruger det forkert.
Der _er_ jo en grund til at det ene tegnsæt hedder iso-8859-1 og det
andet hedder iso-8859-15: nemlig at de _ikke_ er ens. Det nytter
altså ikke noget bare blindt at erstatte det ene tegnsæt med det
andet, som Kents nyhedslæser tilsyneladende gør.
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (30-03-2004)
| Kommentar Fra : Kent Friis |
Dato : 30-03-04 15:27 |
|
Den Tue, 30 Mar 2004 14:22:43 +0200 skrev Jesper Harder:
>Peter Jensen <usenet@pekajemaps.homeip.net> writes:
>
>> Det ser faktisk ud som om det er din newsreader der opfører sig
>> sært. Det er i hvert fald dit indlæg som har en anderledes Subject
>> linje end de andre. Det har måske noget at gøre med at du bruger
>> UTF-8,
>
>Standardtegnsættet i dk-hierarkiet er iso-8859-1. Hvis et tegn, som
>'?', ikke er indeholdt i det, må man nødvendigvis bruge et andet --
>her forekommer utf-8 at være et mindst lige så godt valg som
>blindtarmen iso-8859-15.
>
>> mens alle andre i tråden bruger en variant af ISO-8859.
>
>De bruger det forkert.
>
>Der _er_ jo en grund til at det ene tegnsæt hedder iso-8859-1 og det
>andet hedder iso-8859-15: nemlig at de _ikke_ er ens.
iso8859-15 kunne lige så godt have heddet iso8859-1 servicepack 1. De
er ganske rigtigt ikke ens, der er en fire-fem tegn der er skiftet ud,
da iso8859-1 ikke længere er tidssvarende.
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Harder (02-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 02-04-04 13:47 |
|
Klaus Ellegaard <klausellegaard@msn.com> writes:
> Personligt vil jeg bruge samme rationale over for 2046: der er slet
> ikke et problem i praksis, så 2046 er dybt irrelevant de fleste
> praktiske situationer:
Det er ret ironisk, at du siger det. Afsnit 4.1.2 er der
hovedsageligt for at tage hensyn til folk som dig ... (der bruger en
klient, som stort set ikke er blevet udviklet siden Kim ikke gad
længere engang i begyndelsen af 90erne).
Næsten alle andre kan sagtens bruge utf-8 -- og det er sådan set
nemmere at håndtere end at fedte rundt med alle mulige legacy tegnsæt.
Det ville være dig det kom til at gå ud over, hvis man valgte den
nemmeste (og reneste) løsning. Ønsker du det?
--
Jesper Harder < http://purl.org/harder/>
| |
Klaus Ellegaard (02-04-2004)
| Kommentar Fra : Klaus Ellegaard |
Dato : 02-04-04 13:53 |
|
Jesper Harder <harder@myrealbox.com> writes:
>Det er ret ironisk, at du siger det. Afsnit 4.1.2 er der
>hovedsageligt for at tage hensyn til folk som dig ... (der bruger en
>klient, som stort set ikke er blevet udviklet siden Kim ikke gad
>længere engang i begyndelsen af 90erne).
nn udvikles stadig af Michael Pins. Den baserer sig på reglerne for
USENET og fungerer udmærket i praksis. Der er en forholdsvis stor
brugerbase af den. Den har også MIME-support, men jeg har valgt ikke
at bruge det.
>Næsten alle andre kan sagtens bruge utf-8 -- og det er sådan set
>nemmere at håndtere end at fedte rundt med alle mulige legacy tegnsæt.
>Det ville være dig det kom til at gå ud over, hvis man valgte den
>nemmeste (og reneste) løsning. Ønsker du det?
Gerne for mig. Når man ellers bliver klar til UTF-8 mere globalt,
er nn-7 kommet. Den vil have native UTF-8-support.
Mvh.
Klaus.
| |
Arne Jørgensen (03-04-2004)
| Kommentar Fra : Arne Jørgensen |
Dato : 03-04-04 10:21 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Hvis der slet ikke skal være noget at vælge imellem, er det slet ikke
> nødvendigt med en algoritme, så skal der jo altid bruges iso8859-1 -
> og hvis man så lige antager at vi skriver 2004, så bruger man iso8859-15
> i stedet for, da den netop er en erstatning for iso8859-1.
Hov! hvor får du den sidste præmis fra?
Jeg kan meget vel tage fejl, men jeg mener nu aldrig at have hørt at
ISO-8859-15 er en _erstatning_ for ISO-8859-1.
Indholdsmæssigt svarer ISO-8859-15 til ISO-8859-1 pånær otte tegn. At
rationalet bag indførelsen af ISO-8859-15 var at udvikle en variant af
ISO-8859-1 med euro-tegn m.m. gør den ikke til en erstatning for
ISO-8859-1.
mvh
/arne
--
Arne Jørgensen
Valby Langgade 272, 1. tv., 2500 Valby
tlf: 36 44 18 03, mobil: 21 65 01 13
e-post: arne@arnested.dk, < http://arnested.dk/>
| |
Kent Friis (03-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 03-04-04 11:43 |
|
Den Sat, 03 Apr 2004 11:21:18 +0200 skrev Arne Jørgensen:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Hvis der slet ikke skal være noget at vælge imellem, er det slet ikke
>> nødvendigt med en algoritme, så skal der jo altid bruges iso8859-1 -
>> og hvis man så lige antager at vi skriver 2004, så bruger man iso8859-15
>> i stedet for, da den netop er en erstatning for iso8859-1.
>
>Hov! hvor får du den sidste præmis fra?
Samme sted som jeg fik iso8859-15 fra, tror jeg (long ago).
>Jeg kan meget vel tage fejl, men jeg mener nu aldrig at have hørt at
>ISO-8859-15 er en _erstatning_ for ISO-8859-1.
>
>Indholdsmæssigt svarer ISO-8859-15 til ISO-8859-1 pånær otte tegn. At
>rationalet bag indførelsen af ISO-8859-15 var at udvikle en variant af
>ISO-8859-1 med euro-tegn m.m. gør den ikke til en erstatning for
>ISO-8859-1.
Som jeg har forstået det, var det netop det der var formålet. IMHO
skulle de bare have ladet være med at ændre nummeret, og så gøre
folk opmærksomme på at der kunne være problemer med euro-tegnet
og et par andre i en overgangsperiode.
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Harder (03-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 03-04-04 14:05 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Nej, jeg spørger om hvordan man får den til at vise tegn fra flere
> tegnsæt, UDEN at den begynder at vise iso8859-15 forkert.
Det har jeg svaret på. Man skal selvfølgelig sende tegn til
terminalen kodet i det tegnsæt som terminalen faktisk bruger. Sådan
har det altid været -- jeg forstår ikke, hvorfor du spørger om det.
>>Nej, det taber information. Det rigtige er at bruge det mest
>>almindelige tegnsæt, som er i stand til repræsentere alle tegn.
>
> Og hvilket skulle det være?
Det kommer jo an på, hvilke tegn der er tale om.
> ibm865?
Det siger sig selv, at det skal være et standardiseret tegnsæt.
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (03-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 03-04-04 17:04 |
|
Den Sat, 03 Apr 2004 15:05:18 +0200 skrev Jesper Harder:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Nej, jeg spørger om hvordan man får den til at vise tegn fra flere
>> tegnsæt, UDEN at den begynder at vise iso8859-15 forkert.
>
>Det har jeg svaret på. Man skal selvfølgelig sende tegn til
>terminalen kodet i det tegnsæt som terminalen faktisk bruger. Sådan
>har det altid været -- jeg forstår ikke, hvorfor du spørger om det.
I news:m37jwzfgvk.fsf@defun.localdomain svarede du ellers at det kan
man godt.
Jeg mente ikke det var muligt, og da resten af systemet kører
iso8859-15, skal xterm også gøre det, for at vise tegnene
korrekt. Så hvis den også skal vise andre tegnsæt, kræver det at den
kan gøre det UDEN at ødelægge de andre tegnsæt.
>>>Nej, det taber information. Det rigtige er at bruge det mest
>>>almindelige tegnsæt, som er i stand til repræsentere alle tegn.
>>
>> Og hvilket skulle det være?
>
>Det kommer jo an på, hvilke tegn der er tale om.
Fx de to vi hele tiden har diskuteret.
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Harder (30-03-2004)
| Kommentar Fra : Jesper Harder |
Dato : 30-03-04 16:48 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Jesper Harder:
>
>>Der _er_ jo en grund til at det ene tegnsæt hedder iso-8859-1 og det
>>andet hedder iso-8859-15: nemlig at de _ikke_ er ens.
>
> iso8859-15 kunne lige så godt have heddet iso8859-1 servicepack 1.
Ja, det ville Microsoft sikkert have kaldt det -- de har jo en lang og
stolt tradition for at bryde kompatibilitet.
> De er ganske rigtigt ikke ens, der er en fire-fem tegn der er
> skiftet ud,
Netop. Og som dine defekte emnelinjer viser, kan man ikke ignorere
den forskel.
> da iso8859-1 ikke længere er tidssvarende.
LOL. Og det mener du latin-9 er? Hvis latin-1 er utidssvarende, så
er latin-9 en kæmpe anakronisme, som hørte hjemme på et museum
allerede før den blev udgivet.
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (30-03-2004)
| Kommentar Fra : Kent Friis |
Dato : 30-03-04 18:55 |
|
Den Tue, 30 Mar 2004 17:47:40 +0200 skrev Jesper Harder:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Jesper Harder:
>>
>>>Der _er_ jo en grund til at det ene tegnsæt hedder iso-8859-1 og det
>>>andet hedder iso-8859-15: nemlig at de _ikke_ er ens.
>>
>> iso8859-15 kunne lige så godt have heddet iso8859-1 servicepack 1.
>
>Ja, det ville Microsoft sikkert have kaldt det -- de har jo en lang og
>stolt tradition for at bryde kompatibilitet.
Den er jo netop kompatibel for alle relevante tegn.
Hvordan vil du bære dig ad med at fjerne tegn på en bagud-kompatibel
måde?
>> De er ganske rigtigt ikke ens, der er en fire-fem tegn der er
>> skiftet ud,
>
>Netop. Og som dine defekte emnelinjer viser, kan man ikke ignorere
>den forskel.
Emnelinien har intet med forskellen at gøre, det problem skyldes at en
eller andens newsreader IKKE ved at der er tale om en nyere udgave af
samme tegnsæt.
>> da iso8859-1 ikke længere er tidssvarende.
>
>LOL. Og det mener du latin-9 er? Hvis latin-1 er utidssvarende, så
>er latin-9 en kæmpe anakronisme, som hørte hjemme på et museum
>allerede før den blev udgivet.
Hvilke vesteuropæiske tegn mangler du i latin-9?
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Harder (03-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 03-04-04 14:07 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Arne Jørgensen writes:
>>leeloo@phreaker.net (Kent Friis) writes:
>>
>>> og hvis man så lige antager at vi skriver 2004, så bruger man
>>> iso8859-15 i stedet for, da den netop er en erstatning for
>>> iso8859-1.
>>
>>Hov! hvor får du den sidste præmis fra?
>
> Samme sted som jeg fik iso8859-15 fra, tror jeg (long ago).
Det er ikke hvad ISO/IEC 15897 registeret siger
< http://std.dkuug.dk/cultreg/>.
Det er heller ikke hvad standard POSIX localet for Danmark siger.
Din påstand er altså i strid med Dansk Standard samt POSIX.
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (03-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 03-04-04 17:09 |
|
Den Sat, 03 Apr 2004 15:06:42 +0200 skrev Jesper Harder:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Arne Jørgensen writes:
>>>leeloo@phreaker.net (Kent Friis) writes:
>>>
>>>> og hvis man så lige antager at vi skriver 2004, så bruger man
>>>> iso8859-15 i stedet for, da den netop er en erstatning for
>>>> iso8859-1.
>>>
>>>Hov! hvor får du den sidste præmis fra?
>>
>> Samme sted som jeg fik iso8859-15 fra, tror jeg (long ago).
>
>Det er ikke hvad ISO/IEC 15897 registeret siger
>< http://std.dkuug.dk/cultreg/>.
Hvor siger den side noget om iso8859-15?
>Det er heller ikke hvad standard POSIX localet for Danmark siger.
Hvor?
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Keld Jørn Simonsen (03-04-2004)
| Kommentar Fra : Keld Jørn Simonsen |
Dato : 03-04-04 17:56 |
|
Den Sat, 03 Apr 2004 15:06:42 +0200. skrev Jesper Harder:
> leeloo@phreaker.net (Kent Friis) writes:
>
>> Arne Jørgensen writes:
>>>leeloo@phreaker.net (Kent Friis) writes:
>>>
>>>> og hvis man så lige antager at vi skriver 2004, så bruger man
>>>> iso8859-15 i stedet for, da den netop er en erstatning for
>>>> iso8859-1.
>>>
>>>Hov! hvor får du den sidste præmis fra?
>>
>> Samme sted som jeg fik iso8859-15 fra, tror jeg (long ago).
ISO-8859-15 var tænkt som en efterfølger for iso-8859-1 - en
opgradering, hvor vi fik rettet problemet med det franske oe, og så kunne
sælge det på at der også var et euro-tegn med.
> Det er ikke hvad ISO/IEC 15897 registeret siger
> < http://std.dkuug.dk/cultreg/>.
>
> Det er heller ikke hvad standard POSIX localet for Danmark siger.
>
> Din påstand er altså i strid med Dansk Standard samt POSIX.
Ja, vi diskuterede i Dansk Standard om vi skulle anbefale iso-8859-15 i
stedet for iso-8859-1, men besluttede at fortsætte med iso-8859-1 som det
anbefalede.
Venlig hilsen
keld
| |
Kent Friis (03-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 03-04-04 22:06 |
|
Den Sat, 03 Apr 2004 16:56:29 +0000 skrev Keld Jørn Simonsen:
>Den Sat, 03 Apr 2004 15:06:42 +0200. skrev Jesper Harder:
>
>> leeloo@phreaker.net (Kent Friis) writes:
>>
>>> Arne Jørgensen writes:
>>>>leeloo@phreaker.net (Kent Friis) writes:
>>>>
>>>>> og hvis man så lige antager at vi skriver 2004, så bruger man
>>>>> iso8859-15 i stedet for, da den netop er en erstatning for
>>>>> iso8859-1.
>>>>
>>>>Hov! hvor får du den sidste præmis fra?
>>>
>>> Samme sted som jeg fik iso8859-15 fra, tror jeg (long ago).
>
>ISO-8859-15 var tænkt som en efterfølger for iso-8859-1 - en
>opgradering, hvor vi fik rettet problemet med det franske oe, og så kunne
>sælge det på at der også var et euro-tegn med.
Efterfølger, erstatning - different word, same thing.
>> Det er ikke hvad ISO/IEC 15897 registeret siger
>> < http://std.dkuug.dk/cultreg/>.
>>
>> Det er heller ikke hvad standard POSIX localet for Danmark siger.
>>
>> Din påstand er altså i strid med Dansk Standard samt POSIX.
>
>Ja, vi diskuterede i Dansk Standard om vi skulle anbefale iso-8859-15 i
>stedet for iso-8859-1, men besluttede at fortsætte med iso-8859-1 som det
>anbefalede.
Ah, så det blev "nej til euroen" siden der vandt... Så Danmark har
officielt et andet tegnsæt end resten af EU (hvor et eller andet
direktiv (så vidt jeg ved) kræver at euro-tegnet skal indgå.
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Keld Jørn Simonsen (04-04-2004)
| Kommentar Fra : Keld Jørn Simonsen |
Dato : 04-04-04 21:54 |
|
Den Sat, 03 Apr 2004 21:05:41 +0000. skrev Kent Friis:
>>Ja, vi diskuterede i Dansk Standard om vi skulle anbefale iso-8859-15 i
>>stedet for iso-8859-1, men besluttede at fortsætte med iso-8859-1 som det
>>anbefalede.
>
> Ah, så det blev "nej til euroen" siden der vandt... Så Danmark har
> officielt et andet tegnsæt end resten af EU (hvor et eller andet
> direktiv (så vidt jeg ved) kræver at euro-tegnet skal indgå.
Vi mente i DS at man skulle skrive EUR i stedet for euro-tegnet.
Og så mente vi at det næste trin skulle være ISO 10646.
Men det er jo en noget bedaget specifikation, det kunne være den skulle
opdateres.
Hilsen
Keld
| |
Kent Friis (04-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 04-04-04 23:16 |
|
Den Sun, 04 Apr 2004 20:54:15 +0000 skrev Keld Jørn Simonsen:
>Den Sat, 03 Apr 2004 21:05:41 +0000. skrev Kent Friis:
>
>>>Ja, vi diskuterede i Dansk Standard om vi skulle anbefale iso-8859-15 i
>>>stedet for iso-8859-1, men besluttede at fortsætte med iso-8859-1 som det
>>>anbefalede.
>>
>> Ah, så det blev "nej til euroen" siden der vandt... Så Danmark har
>> officielt et andet tegnsæt end resten af EU (hvor et eller andet
>> direktiv (så vidt jeg ved) kræver at euro-tegnet skal indgå.
>
>
>Vi mente i DS at man skulle skrive EUR i stedet for euro-tegnet.
Og fordi DK står uden for "euro-land", kan I mene som I har lyst,
men som sagt mener jeg der blev vedtaget et direktiv der krævede at
euro-tegnet skulle være en del af tegnsættet. Samtidig med at man
krævede at tastaturet skulle have euro-tegnet.
>Og så mente vi at det næste trin skulle være ISO 10646.
16-bit unicode?
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Keld Jørn Simonsen (05-04-2004)
| Kommentar Fra : Keld Jørn Simonsen |
Dato : 05-04-04 10:16 |
|
Den Sun, 04 Apr 2004 22:15:45 +0000. skrev Kent Friis:
> Den Sun, 04 Apr 2004 20:54:15 +0000 skrev Keld Jørn Simonsen:
>>Den Sat, 03 Apr 2004 21:05:41 +0000. skrev Kent Friis:
>>
>>>>Ja, vi diskuterede i Dansk Standard om vi skulle anbefale iso-8859-15 i
>>>>stedet for iso-8859-1, men besluttede at fortsætte med iso-8859-1 som det
>>>>anbefalede.
>>>
>>> Ah, så det blev "nej til euroen" siden der vandt... Så Danmark har
>>> officielt et andet tegnsæt end resten af EU (hvor et eller andet
>>> direktiv (så vidt jeg ved) kræver at euro-tegnet skal indgå.
>>
>>
>>Vi mente i DS at man skulle skrive EUR i stedet for euro-tegnet.
>
> Og fordi DK står uden for "euro-land", kan I mene som I har lyst,
> men som sagt mener jeg der blev vedtaget et direktiv der krævede at
> euro-tegnet skulle være en del af tegnsættet. Samtidig med at man
> krævede at tastaturet skulle have euro-tegnet.
Jeg vil da gerne have en reference til dette. Anyway, jeg tror at vi
lavede anbefalingen i DS før der kom et sådant direktiv. Jeg var
involveret i standardiseringen af euro-tegnet i det europæsike
standardiseringsorgan CEN, og der har jeg aldrig hørt om et EU direktiv.
>>Og så mente vi at det næste trin skulle være ISO 10646.
>
> 16-bit unicode?
Næh, nej. ISO 10646 har altid været 32 (31) bit. Unicode var kun 16 bit
til at begynde med, men det måtte se lyset senere. Java er vist stadig
kun 16 bit. Det er noget værre rod. Men ellers er ISO 10646 og Unicode ca
det samme (versionsforskelle) mht tegnkoder.
Hilsen
Keld
> Mvh
> Kent
| |
Kent Friis (05-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 05-04-04 11:02 |
|
Den Mon, 05 Apr 2004 09:16:15 +0000 skrev Keld Jørn Simonsen:
> Den Sun, 04 Apr 2004 22:15:45 +0000. skrev Kent Friis:
>
>> Den Sun, 04 Apr 2004 20:54:15 +0000 skrev Keld Jørn Simonsen:
>>>Den Sat, 03 Apr 2004 21:05:41 +0000. skrev Kent Friis:
>>>
>>>>>Ja, vi diskuterede i Dansk Standard om vi skulle anbefale iso-8859-15 i
>>>>>stedet for iso-8859-1, men besluttede at fortsætte med iso-8859-1 som det
>>>>>anbefalede.
>>>>
>>>> Ah, så det blev "nej til euroen" siden der vandt... Så Danmark har
>>>> officielt et andet tegnsæt end resten af EU (hvor et eller andet
>>>> direktiv (så vidt jeg ved) kræver at euro-tegnet skal indgå.
>>>
>>>
>>>Vi mente i DS at man skulle skrive EUR i stedet for euro-tegnet.
>>
>> Og fordi DK står uden for "euro-land", kan I mene som I har lyst,
>> men som sagt mener jeg der blev vedtaget et direktiv der krævede at
>> euro-tegnet skulle være en del af tegnsættet. Samtidig med at man
>> krævede at tastaturet skulle have euro-tegnet.
>
> Jeg vil da gerne have en reference til dette.
Desværre, jeg gemmer ikke links til alt hvad jeg læser. Det er lang
tid siden, så det kan da være jeg tager fejl - men jeg mindes at jeg
tænkte "nu blander de sig sg* lige rigeligt", da jeg nåede til det
afsnit der fortalte hvor på tastaturet tegnet skulle placeres. AltGR+e
var tilladt som overgangsløsning, men målet var en separat tast til
euro-tegnet.
> Anyway, jeg tror at vi
> lavede anbefalingen i DS før der kom et sådant direktiv. Jeg var
> involveret i standardiseringen af euro-tegnet i det europæsike
> standardiseringsorgan CEN, og der har jeg aldrig hørt om et EU direktiv.
>
>>>Og så mente vi at det næste trin skulle være ISO 10646.
>>
>> 16-bit unicode?
>
> Næh, nej. ISO 10646 har altid været 32 (31) bit. Unicode var kun 16 bit
> til at begynde med, men det måtte se lyset senere.
Jeg tror ikke på at (16 eller) 32-bit unicode bliver til noget
foreløbig, det kræver for store ændringer i fx C libraries (strcpy
m.fl.)
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Keld Jørn Simonsen (05-04-2004)
| Kommentar Fra : Keld Jørn Simonsen |
Dato : 05-04-04 18:03 |
|
Den Mon, 05 Apr 2004 10:01:38 +0000. skrev Kent Friis:
> Den Mon, 05 Apr 2004 09:16:15 +0000 skrev Keld Jørn Simonsen:
>> Den Sun, 04 Apr 2004 22:15:45 +0000. skrev Kent Friis:
>>
>>> Den Sun, 04 Apr 2004 20:54:15 +0000 skrev Keld Jørn Simonsen:
>>>>Og så mente vi at det næste trin skulle være ISO 10646.
>>>
>>> 16-bit unicode?
>>
>> Næh, nej. ISO 10646 har altid været 32 (31) bit. Unicode var kun 16 bit
>> til at begynde med, men det måtte se lyset senere.
>
> Jeg tror ikke på at (16 eller) 32-bit unicode bliver til noget
> foreløbig, det kræver for store ændringer i fx C libraries (strcpy
> m.fl.)
Anbefalingen fra DS var ISO 10646 generelt, det kunne være fx på formen
UTF-8 eller UTF-16. UTF-8 er jo meget udbredt i Linux og også på nettet.
UTF-16 er ganske udbredt på Windows. Man har netop vedtaget en teknisk
rapport i ISO om hvorledes man skal lave support for 16-bit ISO 10646,
så der kommer nok noget i libc.
hilsen
keld
| |
Jacob Sparre Anderse~ (24-04-2004)
| Kommentar Fra : Jacob Sparre Anderse~ |
Dato : 24-04-04 17:08 |
|
Keld Jørn Simonsen skrev:
> Næh, nej. ISO 10646 har altid været 32 (31) bit. Unicode var kun 16
> bit til at begynde med, men det måtte se lyset senere. Java er vist
> stadig kun 16 bit.
Det samme gælder Ada. Der har man kun Latin-1 (8-bit) og »Basic
Multilingual Plane« (16-bit) med i standarden.
Jacob
--
»Mon ikke der også bor et par engle i Gudhjem?«
| |
Jesper Harder (03-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 03-04-04 17:45 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Den Sat, 03 Apr 2004 15:05:18 +0200 skrev Jesper Harder:
>>leeloo@phreaker.net (Kent Friis) writes:
>
>>Det har jeg svaret på. Man skal selvfølgelig sende tegn til
>>terminalen kodet i det tegnsæt som terminalen faktisk bruger. Sådan
>>har det altid været -- jeg forstår ikke, hvorfor du spørger om det.
>
> I news:m37jwzfgvk.fsf@defun.localdomain svarede du ellers at det kan
> man godt.
Ja, og det kan man. Hvorfor tror du det ovenstående modsiger det?
> Jeg mente ikke det var muligt,
Og du tog fejl. Jeg har givet en simpel opskrift på, hvordan du kan
efterprøve det. Hvilket skridt i instruktionen forstod du ikke?
> og da resten af systemet kører iso8859-15, skal xterm også gøre det,
> for at vise tegnene korrekt. Så hvis den også skal vise andre
> tegnsæt, kræver det at den kan gøre det UDEN at ødelægge de andre
> tegnsæt.
Nej. Hvorfor bliver du hårdnakket bliver ved med at påstå noget, som
enhver der gider kan konstatere er forkert?
>>>>Nej, det taber information. Det rigtige er at bruge det mest
>>>>almindelige tegnsæt, som er i stand til repræsentere alle tegn.
>>>
>>> Og hvilket skulle det være?
>>
>>Det kommer jo an på, hvilke tegn der er tale om.
>
> Fx de to vi hele tiden har diskuteret.
Det mest almindelige tegnsæt, som indeholder både 1/2 og oe-ligatur er
Unicode. De andre tegnsæt som kan er ikke-standardiserede eller så
eksotiske, at de er dårlige valg.
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (03-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 03-04-04 21:57 |
|
Den Sat, 03 Apr 2004 18:45:29 +0200 skrev Jesper Harder:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Den Sat, 03 Apr 2004 15:05:18 +0200 skrev Jesper Harder:
>>>leeloo@phreaker.net (Kent Friis) writes:
>>
>>>Det har jeg svaret på. Man skal selvfølgelig sende tegn til
>>>terminalen kodet i det tegnsæt som terminalen faktisk bruger. Sådan
>>>har det altid været -- jeg forstår ikke, hvorfor du spørger om det.
>>
>> I news:m37jwzfgvk.fsf@defun.localdomain svarede du ellers at det kan
>> man godt.
>
>Ja, og det kan man. Hvorfor tror du det ovenstående modsiger det?
>
>> Jeg mente ikke det var muligt,
>
>Og du tog fejl. Jeg har givet en simpel opskrift på, hvordan du kan
>efterprøve det. Hvilket skridt i instruktionen forstod du ikke?
Hvordan du får den til ikke at misforstå iso8859-15 tegn som værende
utf-8 multibyte?
Og nej, ikke med recode, for den laver det netop om til utf-8, og så
er det ikke længer iso8859-15.
>Det mest almindelige tegnsæt, som indeholder både 1/2 og oe-ligatur er
>Unicode. De andre tegnsæt som kan er ikke-standardiserede eller så
>eksotiske, at de er dårlige valg.
Vi snakkede om at poste i danske grupper, og OSS'en tillader ikke
unicode.
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Harder (30-03-2004)
| Kommentar Fra : Jesper Harder |
Dato : 30-03-04 22:27 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Jesper Harder writes:
>
>>leeloo@phreaker.net (Kent Friis) writes:
>>
>>> iso8859-15 kunne lige så godt have heddet iso8859-1 servicepack 1.
>>
>>Ja, det ville Microsoft sikkert have kaldt det -- de har jo en lang
>>og stolt tradition for at bryde kompatibilitet.
>
> Den er jo netop kompatibel for alle relevante tegn.
Du modsiger dig selv. Du kan ikke samtidigt hævde at:
a. Latin-9 er et fremskridt, og
b. Alle relevante tegn er kompatible.
For heraf ville følge, at forskellene er irrelevante. Hvis de er
irrelevante, hvad i alverden skal vi så bruge latin-9 til?
> Hvordan vil du bære dig ad med at fjerne tegn på en bagud-kompatibel
> måde?
Det vil jeg ikke -- hvorfor skulle jeg fjerne tegn?
>>Netop. Og som dine defekte emnelinjer viser, kan man ikke ignorere
>>den forskel.
>
> Emnelinien har intet med forskellen at gøre,
Den har alt med forskellen at gøre, nemlig at tegnene ½ (1/2) og œ
(oe-ligatur) har samme kodepunkt i henholdvis latin-1 og latin-9.
> det problem skyldes at en eller andens newsreader IKKE ved at der er
> tale om en nyere udgave af samme tegnsæt.
Skulle vi ikke lige præcisere det til: _Din_ klient kan ikke kende
forskel på latin-1 og latin-9, som den burde kunne, og forvansker
derfor teksten. Bemærk at omtalte tekst eksplicit var deklareret som
latin-1:
=?iso-8859-1?Q?"linux.dk"=3F=BD?=
så der er ikke tale om "en nyere udgave af samme tegnsæt".
>>> da iso8859-1 ikke længere er tidssvarende.
>>
>>LOL. Og det mener du latin-9 er? Hvis latin-1 er utidssvarende, så
>>er latin-9 en kæmpe anakronisme, som hørte hjemme på et museum
>>allerede før den blev udgivet.
>
> Hvilke vesteuropæiske tegn mangler du i latin-9?
Jeg mangler hundredevis af matematiske og tekniske symboler,
lydskrift, typografiske tegn.
Latin-9 er en midlertidig ikke-løsning på et ikke-eksisterende
problem. Alle de milliarder, som er smidt ud af vinduet på Latin-9
bare for at man kan skrive € i stedet for EUR, ville være langt bedre
anvendt på at forberede software til Unicode.
Latin-9 er en anakronisme, fordi alle ved (og vidste) at Unicode er
fremtiden. Det gavner ingen at spilde tid på at opfinde og
understøtte endnu en ligegyldig variation over iso-8859-* temaet.
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (31-03-2004)
| Kommentar Fra : Kent Friis |
Dato : 31-03-04 12:37 |
|
Den Tue, 30 Mar 2004 23:27:01 +0200 skrev Jesper Harder:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Jesper Harder writes:
>>
>>>leeloo@phreaker.net (Kent Friis) writes:
>>>
>>>> iso8859-15 kunne lige så godt have heddet iso8859-1 servicepack 1.
>>>
>>>Ja, det ville Microsoft sikkert have kaldt det -- de har jo en lang
>>>og stolt tradition for at bryde kompatibilitet.
>>
>> Den er jo netop kompatibel for alle relevante tegn.
>
>Du modsiger dig selv. Du kan ikke samtidigt hævde at:
>
> a. Latin-9 er et fremskridt, og
> b. Alle relevante tegn er kompatible.
>
>For heraf ville følge, at forskellene er irrelevante. Hvis de er
>irrelevante, hvad i alverden skal vi så bruge latin-9 til?
Alle relevante tegn i Latin1 sg* da. Der er nogen ubrugelige tegn (så
som "solen") der er fjernet, og i stedet er der tilføjet nogen mere
relevante (heriblandt euro).
>Den har alt med forskellen at gøre, nemlig at tegnene ½ (1/2) og ?
>(oe-ligatur) har samme kodepunkt i henholdvis latin-1 og latin-9.
Jeg ser ingen af de to tegn i subject, og heller ikke et sted hvor
de ville have givet mening.
>> det problem skyldes at en eller andens newsreader IKKE ved at der er
>> tale om en nyere udgave af samme tegnsæt.
>
>Skulle vi ikke lige præcisere det til: _Din_ klient kan ikke kende
>forskel på latin-1 og latin-9, som den burde kunne, og forvansker
>derfor teksten. Bemærk at omtalte tekst eksplicit var deklareret som
>latin-1:
>
> =?iso-8859-1?Q?"linux.dk"=3F=BD?=
>
>så der er ikke tale om "en nyere udgave af samme tegnsæt".
Jo der er, uanset hvad der står i headeren, er Latin9 stadig en nyere
udgave af Latin1, og tiltænkt som erstatning for denne.
>>>> da iso8859-1 ikke længere er tidssvarende.
>>>
>>>LOL. Og det mener du latin-9 er? Hvis latin-1 er utidssvarende, så
>>>er latin-9 en kæmpe anakronisme, som hørte hjemme på et museum
>>>allerede før den blev udgivet.
>>
>> Hvilke vesteuropæiske tegn mangler du i latin-9?
>
>Jeg mangler hundredevis af matematiske og tekniske symboler,
>lydskrift, typografiske tegn.
For at skrive hvilket sprog?
>Latin-9 er en midlertidig ikke-løsning på et ikke-eksisterende
>problem. Alle de milliarder, som er smidt ud af vinduet på Latin-9
>bare for at man kan skrive ? i stedet for EUR, ville være langt bedre
>anvendt på at forberede software til Unicode.
>
>Latin-9 er en anakronisme, fordi alle ved (og vidste) at Unicode er
>fremtiden. Det gavner ingen at spilde tid på at opfinde og
>understøtte endnu en ligegyldig variation over iso-8859-* temaet.
Åh nej, ikke en unicode-fanatiker mere
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Arne Jørgensen (03-04-2004)
| Kommentar Fra : Arne Jørgensen |
Dato : 03-04-04 22:15 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Den Sat, 03 Apr 2004 16:56:29 +0000 skrev Keld Jørn Simonsen:
>
>>ISO-8859-15 var tænkt som en efterfølger for iso-8859-1 - en
>>opgradering, hvor vi fik rettet problemet med det franske oe, og så kunne
>>sælge det på at der også var et euro-tegn med.
>
> Efterfølger, erstatning - different word, same thing.
Og du mener at man bare kan bruge ISO-8859-15 alle de steder hvor der
refereres til ISO-8859-1 og at eventuelle problemer der følger der af
(fx informationstab) er noget man må leve med?
Det tror jeg ikke du finder belæg for i nogen standard eller noget
andet sted!
mvh
/arne
--
Arne Jørgensen
Valby Langgade 272, 1. tv., 2500 Valby
tlf: 36 44 18 03, mobil: 21 65 01 13
e-post: arne@arnested.dk, < http://arnested.dk/>
| |
Kent Friis (04-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 04-04-04 09:41 |
|
Den Sat, 03 Apr 2004 23:14:38 +0200 skrev Arne Jørgensen:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Den Sat, 03 Apr 2004 16:56:29 +0000 skrev Keld Jørn Simonsen:
>>
>>>ISO-8859-15 var tænkt som en efterfølger for iso-8859-1 - en
>>>opgradering, hvor vi fik rettet problemet med det franske oe, og så kunne
>>>sælge det på at der også var et euro-tegn med.
>>
>> Efterfølger, erstatning - different word, same thing.
>
>Og du mener at man bare kan bruge ISO-8859-15 alle de steder hvor der
>refereres til ISO-8859-1 og at eventuelle problemer der følger der af
>(fx informationstab) er noget man må leve med?
Medmindre der ligefrem er brug for nogen af de ubrugelige[1] tegn de har
fjernet, så ja.
>Det tror jeg ikke du finder belæg for i nogen standard eller noget
>andet sted!
Det er et spørgsmål om tolkning, så.
Mvh
Kent
[1] Jeg fatter ikke lige hvorfor 1/2 måtte vige pladsen, den bliver jo
brugt. Men måske fordi man heller ikke havde plads til 3/4 og 5/7.
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Harder (03-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 03-04-04 17:55 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Den Sat, 03 Apr 2004 15:06:42 +0200 skrev Jesper Harder:
>>leeloo@phreaker.net (Kent Friis) writes:
>
>>> Samme sted som jeg fik iso8859-15 fra, tror jeg (long ago).
>>
>>Det er ikke hvad ISO/IEC 15897 registeret siger
>
> Hvor siger den side noget om iso8859-15?
< http://std.dkuug.dk/cultreg/registrations/narrative/da_DK,_4.3.html>
The recommended character set is DS/ISO 8859-1; for a bigger
repertoire DS/ISO/IEC 10646-1 is recommended.
Altså, hvis du har brug for større repertoire end latin-1, så brug
unicode.
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (03-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 03-04-04 22:02 |
|
Den Sat, 03 Apr 2004 18:55:09 +0200 skrev Jesper Harder:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Den Sat, 03 Apr 2004 15:06:42 +0200 skrev Jesper Harder:
>>>leeloo@phreaker.net (Kent Friis) writes:
>>
>>>> Samme sted som jeg fik iso8859-15 fra, tror jeg (long ago).
>>>
>>>Det er ikke hvad ISO/IEC 15897 registeret siger
>>
>> Hvor siger den side noget om iso8859-15?
>
>< http://std.dkuug.dk/cultreg/registrations/narrative/da_DK,_4.3.html>
>
> The recommended character set is DS/ISO 8859-1; for a bigger
> repertoire DS/ISO/IEC 10646-1 is recommended.
Ok, jeg spørger igen: Hvor siger den side noget om iso8859-15?
Indtil videre har du ikke vist noget der modsiger at iso8859-15 skulle
være en erstatning for iso8859-1.
Mvh
Kent
[1] Selv i 2004 er der folk der aldrig har hørt om iso8859-15.
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Keld Jørn Simonsen (04-04-2004)
| Kommentar Fra : Keld Jørn Simonsen |
Dato : 04-04-04 22:01 |
|
Den Sat, 03 Apr 2004 21:02:09 +0000. skrev Kent Friis:
> Den Sat, 03 Apr 2004 18:55:09 +0200 skrev Jesper Harder:
>>leeloo@phreaker.net (Kent Friis) writes:
>>
>>> Den Sat, 03 Apr 2004 15:06:42 +0200 skrev Jesper Harder:
>>>>leeloo@phreaker.net (Kent Friis) writes:
>>>
>>>>> Samme sted som jeg fik iso8859-15 fra, tror jeg (long ago).
>>>>
>>>>Det er ikke hvad ISO/IEC 15897 registeret siger
>>>
>>> Hvor siger den side noget om iso8859-15?
>>
>>< http://std.dkuug.dk/cultreg/registrations/narrative/da_DK,_4.3.html>
>>
>> The recommended character set is DS/ISO 8859-1; for a bigger
>> repertoire DS/ISO/IEC 10646-1 is recommended.
>
> Ok, jeg spørger igen: Hvor siger den side noget om iso8859-15?
>
> Indtil videre har du ikke vist noget der modsiger at iso8859-15 skulle
> være en erstatning for iso8859-1.
iso-8859-15 var designet til at være iso-8859-1's afløser. Jeg var selv
dybt involveret i designet af iso-8859-15, da jeg var den første der
foreslog dette nye tegnsæt (i CEN/TC304) men jeg skulle have
franskmændene til at gå ind for det, idet jeg mente at de selv skulle
bede om at få det franske oe med. Det blev en fransk-canadier (Alain
LaBonté, en af mine gode venner) som var editor af standarden.
Men man kan ikke bare sige at man kan erstatte iso-8859-1 med iso-8859-15,
i princippet. I praksis fungerer det dog helt udmærket...
Hilsen
keld
| |
Jesper Harder (04-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 04-04-04 00:16 |
|
Keld Jørn Simonsen <keld@dkuug.dk> writes:
> Ja, vi diskuterede i Dansk Standard om vi skulle anbefale
> iso-8859-15 i stedet for iso-8859-1, men besluttede at fortsætte med
> iso-8859-1 som det anbefalede.
Tak for opklaringen. Hvad mener du for resten om
Danish Internet Email exchange recommends MIME format and ISO
8859-1 encoding, if necessary in RFC1345 mnemonic format.
Med al respekt, så har jeg aldrig set nogen bruge RFC1345-koder i
email. Har det været almindeligt på et tidspunkt?
(Jeg bruger selv koderne som en "input method" til at skrive de
tilsvarende tegn, hvilket de egner sig fortrinligt til).
--
Jesper Harder < http://purl.org/harder/>
| |
Keld Jørn Simonsen (04-04-2004)
| Kommentar Fra : Keld Jørn Simonsen |
Dato : 04-04-04 21:52 |
|
Den Sun, 04 Apr 2004 01:15:53 +0200. skrev Jesper Harder:
> Keld Jørn Simonsen <keld@dkuug.dk> writes:
>
>> Ja, vi diskuterede i Dansk Standard om vi skulle anbefale
>> iso-8859-15 i stedet for iso-8859-1, men besluttede at fortsætte med
>> iso-8859-1 som det anbefalede.
>
> Tak for opklaringen. Hvad mener du for resten om
>
> Danish Internet Email exchange recommends MIME format and ISO
> 8859-1 encoding, if necessary in RFC1345 mnemonic format.
>
> Med al respekt, så har jeg aldrig set nogen bruge RFC1345-koder i
> email. Har det været almindeligt på et tidspunkt?
>
> (Jeg bruger selv koderne som en "input method" til at skrive de
> tilsvarende tegn, hvilket de egner sig fortrinligt til).
Ja, det var almindeligt omkring 1990-1993, dvs før MIME.
Det var indbygget i vanilla sendmail 5.65 og noget tid frem,
men man så det nok ikke, idet den indbyggede tegnsætskonvertering
jo lykkedes for næsten alle tegn, vanligvis.
Der er noget rfc1345 lignenede mnemonics i mutt's html-fremvisning.
I hvert fald som det kører på min mandrake 9.2 installation.
Passusen omkring rfc1345 er nok noget gammel, og stammer fra noget
anbefaling de lavede i midt-halvfemserne. Det kan godt være at de ikke
selv syntes det var særligt vigtigt, men vi (og især jeg, som skrev
rfc1345) i Dansk Standard syntes det var vigtigt.
Hilsen
keld
| |
Jesper Harder (04-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 04-04-04 00:59 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Hvordan du får den til ikke at misforstå iso8859-15 tegn som værende
> utf-8 multibyte?
En terminal skal overhovedet ikke beskæftige sig med at forstå, om et
tegn tilhører det ene eller andet tegnsæt. Den viser tegn i henhold
til den afbildning den er opsat til. Dit spørgsmål giver ingen
mening.
> Og nej, ikke med recode, for den laver det netop om til utf-8, og så
> er det ikke længer iso8859-15.
Visning af en tekst laver ikke noget som helst tegnsæt om. Tror du at
bittene i en fil pludselig ændrer sig, fordi man viser filen på den
ene eller anden måde?
Prøv at tænke over, hvad det vil sige at vise en tekst på en skærm.
Det er en afbildning fra tal til glyffer, til pixels. En række pixels
har ikke noget tegnsæt. Hvis du udskriver en tekst på en printer, har
klatterne på papiret ligeledes ikke noget tegnsæt.
> Vi snakkede om at poste i danske grupper, og OSS'en tillader ikke
> unicode.
Jo, den gør. Den fortæller dig bare, at standardtegnsættet er
iso-8859-1. Standardtegnsættet er det tegnsæt du skal foretrække
blandt flere valgmuligheder.
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (04-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 04-04-04 09:47 |
|
Den Sun, 04 Apr 2004 01:58:32 +0200 skrev Jesper Harder:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Hvordan du får den til ikke at misforstå iso8859-15 tegn som værende
>> utf-8 multibyte?
>
>En terminal skal overhovedet ikke beskæftige sig med at forstå, om et
>tegn tilhører det ene eller andet tegnsæt. Den viser tegn i henhold
>til den afbildning den er opsat til. Dit spørgsmål giver ingen
>mening.
>
>> Og nej, ikke med recode, for den laver det netop om til utf-8, og så
>> er det ikke længer iso8859-15.
>
>Visning af en tekst laver ikke noget som helst tegnsæt om.
Nej, men det gør recode.
>Tror du at
>bittene i en fil pludselig ændrer sig, fordi man viser filen på den
>ene eller anden måde?
Ordkløver.
Terminalen SKAL vise iso8859-15 korrekt. Kan man sætte den op på en måde
så den også kan vise tegn fra andre tegnsæt? Det var det der var det
oprindelige spørgsmål, som du hidtil har besvaret med ja, nej og ja.
Teoretisk er der intet i vejen for det, fx ved at definere end ESC-kode
der fortæller at nu kommer der et tegn i utf-8, men jeg kender ikke
noget terminal-program der har implementeret det.
>> Vi snakkede om at poste i danske grupper, og OSS'en tillader ikke
>> unicode.
>
>Jo, den gør.
Hvor?
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Harder (31-03-2004)
| Kommentar Fra : Jesper Harder |
Dato : 31-03-04 13:14 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Den Tue, 30 Mar 2004 23:27:01 +0200 skrev Jesper Harder:
>
>>Den har alt med forskellen at gøre, nemlig at tegnene œ (1/2) og ?
^^^ ^^^
fejl fejl
>>(oe-ligatur) har samme kodepunkt i henholdvis latin-1 og latin-9.
>
> Jeg ser ingen af de to tegn i subject,
Ha, ha. Det er jo fordi din klient for et par indlæg siden erstattede
dem med to spørgsmåltegn. Lige som ovenstående citat er forvansket --
så der er åbenbart ikke kun problemer med standardoverholdelse
mht. emnelinjen.
>>> Hvilke vesteuropæiske tegn mangler du i latin-9?
>>
>>Jeg mangler hundredevis af matematiske og tekniske symboler,
>>lydskrift, typografiske tegn.
>
> For at skrive hvilket sprog?
Dansk. Læs et par sider i Salmonsen, og du vil hurtigt støde på
adskillige tegn, som ikke findes i Latin-x.
> Ã…h nej, ikke en unicode-fanatiker mere
Næppe.
$ echo $LANG
en_GB.iso88591
--
Jesper Harder < http://purl.org/harder/>
| |
Klaus Ellegaard (31-03-2004)
| Kommentar Fra : Klaus Ellegaard |
Dato : 31-03-04 13:18 |
|
Jesper Harder <harder@myrealbox.com> writes:
>> Ã…h nej, ikke en unicode-fanatiker mere
>Næppe.
>$ echo $LANG
>en_GB.iso88591
Mmmm.... du kører godtnok UTF-8
Mvh.
Klaus, som skal ha' taget sig sammen og skrevet en
konverteringstabel til go'e, gamle nn.
| |
Kent Friis (31-03-2004)
| Kommentar Fra : Kent Friis |
Dato : 31-03-04 15:16 |
|
Den Wed, 31 Mar 2004 14:14:11 +0200 skrev Jesper Harder:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Den Tue, 30 Mar 2004 23:27:01 +0200 skrev Jesper Harder:
>>
>>>Den har alt med forskellen at gøre, nemlig at tegnene ? (1/2) og ?
> ^^^ ^^^
> fejl fejl
>>>(oe-ligatur) har samme kodepunkt i henholdvis latin-1 og latin-9.
>>
>> Jeg ser ingen af de to tegn i subject,
>
>Ha, ha. Det er jo fordi din klient for et par indlæg siden erstattede
>dem med to spørgsmåltegn. Lige som ovenstående citat er forvansket --
>så der er åbenbart ikke kun problemer med standardoverholdelse
>mht. emnelinjen.
Det første af tegnene blev faktisk vist uden problemer her (som det
der æ-lignende tegn), hvorimod det andet var blevet til et
spørgsmålstegn. Hvilket er meget forståeligt, for når det er samme
tegn (samme talværdi) er det ikke muligt at skrive dem begge i et
indlæg.
>>>> Hvilke vesteuropæiske tegn mangler du i latin-9?
>>>
>>>Jeg mangler hundredevis af matematiske og tekniske symboler,
>>>lydskrift, typografiske tegn.
>>
>> For at skrive hvilket sprog?
>
>Dansk. Læs et par sider i Salmonsen, og du vil hurtigt støde på
>adskillige tegn, som ikke findes i Latin-x.
Hed han ikke Salomon? Og nej, jeg har ikke min bibel i nærheden.
>> Åh nej, ikke en unicode-fanatiker mere
>
>Næppe.
Det lød ellers sådan.
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Kristian Thy (31-03-2004)
| Kommentar Fra : Kristian Thy |
Dato : 31-03-04 15:17 |
|
Kent Friis uttered:
>>Dansk. Læs et par sider i Salmonsen, og du vil hurtigt støde på
>>adskillige tegn, som ikke findes i Latin-x.
>
> Hed han ikke Salomon? Og nej, jeg har ikke min bibel i nærheden.
Nix. "Salmonsens Lille Konversationsleksikon".
\\kristian
--
Linux like tee-pee: No windows, no gates, Apache inside
| |
Jesper Harder (04-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 04-04-04 22:22 |
|
Keld Jørn Simonsen <keld@dkuug.dk> writes:
> iso-8859-15 var designet til at være iso-8859-1's afløser. Jeg var selv
> dybt involveret i designet af iso-8859-15, da jeg var den første der
> foreslog dette nye tegnsæt (i CEN/TC304)
Overvejede I aldrig at placere de ekstra tegn i C1-blokken i stedet?
(som Microsoft gør i Windows-1252).
Der er vel meget få vesteuropæere, som nogensinde bruger C1-koderne
til noget i prakis (er det ikke mest en CJK-ting?).
--
Jesper Harder < http://purl.org/harder/>
| |
Keld Jørn Simonsen (04-04-2004)
| Kommentar Fra : Keld Jørn Simonsen |
Dato : 04-04-04 23:02 |
|
Den Sun, 04 Apr 2004 23:22:08 +0200. skrev Jesper Harder:
> Keld Jørn Simonsen <keld@dkuug.dk> writes:
>
>> iso-8859-15 var designet til at være iso-8859-1's afløser. Jeg var selv
>> dybt involveret i designet af iso-8859-15, da jeg var den første der
>> foreslog dette nye tegnsæt (i CEN/TC304)
>
> Overvejede I aldrig at placere de ekstra tegn i C1-blokken i stedet?
> (som Microsoft gør i Windows-1252).
Joh, men det stred imod arkitekturen i ISO 2022. dvs vi skulle først
udvide arkitekturen - det tager tid. og imellemtiden kom jo iso 10646, som
vel i princippet er den bedste løsning. Det er desværre meget styret af
unicode, så meget at unicode nu har overtaget definitionen af utf-8 på
internettet. Dvs at vi med utf-8 i princippet arbejder med en de facto
standard, lavet af et industrikonsortium.
> Der er vel meget få vesteuropæere, som nogensinde bruger C1-koderne
> til noget i prakis (er det ikke mest en CJK-ting?).
Nej, det bruges ikke i ISO 2022 orienterede østasiasiske tegnsæt.
utf-8 undgår dem også.
de kan give problemer i programmer som xterm, som prøver at fortolke iso
2022-kommandoer, som altså kan bruge c1. ISO 6429 tror jeg den
standard hed, som definerede C1-sekvenserne.
hilsen
keld
| |
Kent Friis (04-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 04-04-04 23:17 |
|
Den Sun, 04 Apr 2004 23:22:08 +0200 skrev Jesper Harder:
>Keld Jørn Simonsen <keld@dkuug.dk> writes:
>
>> iso-8859-15 var designet til at være iso-8859-1's afløser. Jeg var selv
>> dybt involveret i designet af iso-8859-15, da jeg var den første der
>> foreslog dette nye tegnsæt (i CEN/TC304)
>
>Overvejede I aldrig at placere de ekstra tegn i C1-blokken i stedet?
>(som Microsoft gør i Windows-1252).
>
>Der er vel meget få vesteuropæere, som nogensinde bruger C1-koderne
>til noget i prakis (er det ikke mest en CJK-ting?).
Er det ikke den blok der bruges til line-graphics under Linux?
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Ivar Madsen (31-03-2004)
| Kommentar Fra : Ivar Madsen |
Dato : 31-03-04 19:35 |
|
Jesper Harder skrev i -dk.edb.system.unix:
>> Jeg ser ingen af de to tegn i subject,
> Ha, ha. Det er jo fordi din klient for et par indlæg siden erstattede
> dem med to spørgsmåltegn. Lige som ovenstående citat er forvansket --
> så der er åbenbart ikke kun problemer med standardoverholdelse
> mht. emnelinjen.
Føreste indlæg i denne tråd har
|Subject: DR's webting under Linux ( Var: Re:=?iso-8859-1?Q?"linux.dk"=3F=BD)?=
set i min INN's spool med mc's view'er. Min KNode oversætter det så til
|DR's webting under Linux ( Var: Re: "linux.dk"?½)
altså slutter det med "linux.dk" efterfuldt af et ? og halv tegnet.
--
Med venlig hilsen
Ivar Madsen
| |
Ivar Madsen (31-03-2004)
| Kommentar Fra : Ivar Madsen |
Dato : 31-03-04 19:52 |
|
Ivar Madsen skrev i -dk.edb.system.unix:
> set i min INN's spool med mc's view'er. Min KNode oversætter det så til
> |DR's webting under Linux ( Var: Re: "linux.dk"?½)
> altså slutter det med "linux.dk" efterfuldt af et ? og halv tegnet.
Glemte at nævne at sidste tegn er )
Jeg må altså vænne mig fra at se TV og skrive news på samme tid
--
Med venlig hilsen
Ivar Madsen
| |
Jesper Harder (04-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 04-04-04 14:29 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Terminalen SKAL vise iso8859-15 korrekt. Kan man sætte den op på en måde
> så den også kan vise tegn fra andre tegnsæt? Det var det der var det
> oprindelige spørgsmål, som du hidtil har besvaret med ja, nej og ja.
Jeg har sagt: ja, ja, ja. Jeg sidder lige og kigger på dit (latin-9)
indlæg, som bliver vist korrekt i Gnus i en utf-8 terminal. Og
tegnsættet i indlægget har ikke på mystisk vis ændret sig bag min ryg,
som du tilsyneladende tror.
Det faktum ændrer sig ikke en tøddel uanset hvor mange gange du
stamper i jorden og påstår at det ikke kan lade sig gøre.
Denne tråd er efterhånden lige så absurd, som hvis Armstrong skulle
diskutere med en af de tåbelige konspirationsteoretikere, der nægter
at tro på at der har været mennesker på månen.
Den er faktisk mere absurd, for vi har ikke råd til at sende tåben på
en raket afsted til månen, hvorimod enhver ganske gratis kan følge
anvisningerne i <news:m3d66qgxme.fsf@defun.localdomain>.
> Teoretisk er der intet i vejen for det, fx ved at definere end
> ESC-kode der fortæller at nu kommer der et tegn i utf-8, men jeg
> kender ikke noget terminal-program der har implementeret det.
Xterm har escape-koder til at skifte mellem tegnsæt. Dem har jeg
valgt at ignorere -- det er ikke dem som bliver brugt, de er
forældede, og dokumentationen fraråder dem.
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (04-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 04-04-04 20:49 |
|
Den Sun, 04 Apr 2004 15:29:05 +0200 skrev Jesper Harder:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Terminalen SKAL vise iso8859-15 korrekt. Kan man sætte den op på en måde
>> så den også kan vise tegn fra andre tegnsæt? Det var det der var det
>> oprindelige spørgsmål, som du hidtil har besvaret med ja, nej og ja.
>
>Jeg har sagt: ja, ja, ja. Jeg sidder lige og kigger på dit (latin-9)
>indlæg, som bliver vist korrekt i Gnus i en utf-8 terminal.
Ah, nu går det op for mig, hvad det er du ikke fatter... Du bruger
emacs som OS, og kender derfor intet til verdenen udenfor...
Når jeg skriver at terminalen skal vise iso8859-15 korrekt, så mener
jeg at når jeg skriver "ls" eller "cat latin9tekst", så skal det
vises korrekt, incl. æøå og andre tegn der har en anden encoding
i utf-8.
Hvis jeg bare sætter terminalen op til at køre utf-8, så bliver æøå
og andre tegn >127 lagt sammen med de(t) efterfølgende tegn.
>Det faktum ændrer sig ikke en tøddel uanset hvor mange gange du
>stamper i jorden og påstår at det ikke kan lade sig gøre.
Ok, så forklar hvordan. Uden at komme med fornærmelser undervejs.
>Denne tråd er efterhånden lige så absurd, som hvis Armstrong skulle
>diskutere med en af de tåbelige konspirationsteoretikere, der nægter
>at tro på at der har været mennesker på månen.
Du nærmer dig kraftigt en plonk.
>> Teoretisk er der intet i vejen for det, fx ved at definere end
>> ESC-kode der fortæller at nu kommer der et tegn i utf-8, men jeg
>> kender ikke noget terminal-program der har implementeret det.
>
>Xterm har escape-koder til at skifte mellem tegnsæt. Dem har jeg
>valgt at ignorere -- det er ikke dem som bliver brugt, de er
>forældede, og dokumentationen fraråder dem.
Interessant, gad vide om Rxvt også har dem... Men på den anden side,
jeg har ikke haft brug for dem endnu.
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Harder (31-03-2004)
| Kommentar Fra : Jesper Harder |
Dato : 31-03-04 13:43 |
|
Klaus Ellegaard <klausellegaard@msn.com> writes:
> Mmmm.... du kører godtnok UTF-8
Nope. _Indlægget_ brugte ganske rigtigt utf-8, men det er fordi det
indeholdt et tegn (oe-ligatur), som ikke findes i iso-8859-1.
Så er man jo nødt til at bruge et andet tegnsæt. Blandt de mulige
kandidater (utf-8, utf-16, iso-8859-15, iso-2022-7bit,
iso-2022-8bit-ss2 m.fl.), havde utf-8 højest prioritet.
--
Jesper Harder < http://purl.org/harder/>
| |
Jesper Harder (31-03-2004)
| Kommentar Fra : Jesper Harder |
Dato : 31-03-04 15:50 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Det første af tegnene blev faktisk vist uden problemer her (som det
> der æ-lignende tegn), hvorimod det andet var blevet til et
> spørgsmålstegn.
Så blev det vist forkert for dig. Det første tegn var brøken 1/2, det
andet tegn var oe-ligaturen.
> Hvilket er meget forståeligt, for når det er samme tegn (samme
> talværdi) er det ikke muligt at skrive dem begge i et indlæg.
Forkert. Det _er_ muligt at skrive dem i samme indlæg med utf-8. Det
var det jeg lige gjorde. Det er jo for pokker hele fordelen ved
Unicode, at man ikke er begrænset til de 100-200 tegn som tilfældigvis
er samlet i ét iso-8859 tegnsæt.
>>Dansk. Læs et par sider i Salmonsen, og du vil hurtigt støde på
>>adskillige tegn, som ikke findes i Latin-x.
>
> Hed han ikke Salomon? Og nej, jeg har ikke min bibel i nærheden.
Salmonsens Konversationsleksikon. (Langt mere nyttig end biblen .
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (31-03-2004)
| Kommentar Fra : Kent Friis |
Dato : 31-03-04 16:40 |
|
Den Wed, 31 Mar 2004 16:50:15 +0200 skrev Jesper Harder:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Det første af tegnene blev faktisk vist uden problemer her (som det
>> der æ-lignende tegn), hvorimod det andet var blevet til et
>> spørgsmålstegn.
>
>Så blev det vist forkert for dig. Det første tegn var brøken 1/2, det
>andet tegn var oe-ligaturen.
Ikke i iso8859, som bruges på den danske del af usenet.
>> Hvilket er meget forståeligt, for når det er samme tegn (samme
>> talværdi) er det ikke muligt at skrive dem begge i et indlæg.
>
>Forkert. Det _er_ muligt at skrive dem i samme indlæg med utf-8.
Utf-8 er en fejl i .dk-grupperne.
>>>Dansk. Læs et par sider i Salmonsen, og du vil hurtigt støde på
>>>adskillige tegn, som ikke findes i Latin-x.
>>
>> Hed han ikke Salomon? Og nej, jeg har ikke min bibel i nærheden.
>
>Salmonsens Konversationsleksikon. (Langt mere nyttig end biblen .
Men ikke særlig omtalt, åbenbart - jeg har ikke hørt om den, og du
kunne kun halvdelen af titlen.
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Ivar Madsen (31-03-2004)
| Kommentar Fra : Ivar Madsen |
Dato : 31-03-04 20:37 |
|
Kent Friis skrev i -dk.edb.system.unix:
> Utf-8 er en fejl i .dk-grupperne.
Hvorfor?
Ikke at jeg er overbevist om at utf-8 er fuldt modent, men mener at det er
vejen fram, så vi kan undgå problemmerne med at man lige undtagelsvis har brug
for at skrive et tegn der ikke er i ens nationale version(er) af ISO 8859
--
Med venlig hilsen
Ivar Madsen
| |
Kent Friis (31-03-2004)
| Kommentar Fra : Kent Friis |
Dato : 31-03-04 21:05 |
| | |
Ivar Madsen (31-03-2004)
| Kommentar Fra : Ivar Madsen |
Dato : 31-03-04 22:25 |
|
Kent Friis skrev i -dk.edb.system.unix:
>>> Utf-8 er en fejl i .dk-grupperne.
>>Hvorfor?
> http://www.usenet.dk/info/lynvejledning.html
Der står ikke regtigt hvorfor ikke gøre brug af fordelene i utf-8. Det nævnes
faktisk ikke engang. (heller ikke i den tekniske forklaring)
--
Med venlig hilsen
Ivar Madsen
| |
Klaus Ellegaard (31-03-2004)
| Kommentar Fra : Klaus Ellegaard |
Dato : 31-03-04 22:45 |
|
Ivar Madsen <spam.usenet.im@milli.dk> writes:
>Der står ikke regtigt hvorfor ikke gøre brug af fordelene i utf-8. Det nævnes
>faktisk ikke engang. (heller ikke i den tekniske forklaring)
UTF-8 har ikke rigtig vundet indpas endnu. Mange klienter kan ikke
overskue det, og så ender man med en masse citater, der citerer
UTF-8 i ISO8859-x. Det er ret grimt at se på.
Mvh.
Klaus.
| |
Ivar Madsen (01-04-2004)
| Kommentar Fra : Ivar Madsen |
Dato : 01-04-04 06:20 |
|
Klaus Ellegaard skrev i -dk.edb.system.unix:
>>Der står ikke regtigt hvorfor ikke gøre brug af fordelene i utf-8. Det nævnes
>>faktisk ikke engang. (heller ikke i den tekniske forklaring)
> UTF-8 har ikke rigtig vundet indpas endnu. Mange klienter kan ikke
> overskue det, og så ender man med en masse citater, der citerer
> UTF-8 i ISO8859-x. Det er ret grimt at se på.
Nogen der har overblik over hvor mange newsklienter der ikke kan håndtere
UTF-8?
Det har ikke længer så meget at gøre i unix gruppen, specielt ikke når jeg også
tænker på alle de andre brugte OS'ers newsklienter,
så XFUT fra dk.edb.system.unix til dk.edb.internet.software.mail+news
--
Med venlig hilsen
Ivar Madsen
| |
Jesper Harder (04-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 04-04-04 23:36 |
|
Keld Jørn Simonsen <keld@dkuug.dk> writes:
> Den Sun, 04 Apr 2004 23:22:08 +0200. skrev Jesper Harder:
>
>> Der er vel meget få vesteuropæere, som nogensinde bruger C1-koderne
>> til noget i prakis (er det ikke mest en CJK-ting?).
>
> Nej, det bruges ikke i ISO 2022 orienterede østasiasiske tegnsæt.
> utf-8 undgår dem også.
Jeg havde eller forstået det sådan, at de bl.a. bliver brugt i
iso-2022-jp-2. Er det en misforståelse?
--
Jesper Harder < http://purl.org/harder/>
| |
Jesper Harder (04-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 04-04-04 21:45 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Når jeg skriver at terminalen skal vise iso8859-15 korrekt, så mener
> jeg at når jeg skriver "ls" eller "cat latin9tekst", så skal det
> vises korrekt, incl. æøå og andre tegn der har en anden encoding
> i utf-8.
'cat' osv. er "dumme" programmer, der betragter alt som en
bag-of-bytes. I de tilfælde, hvor de virker, er det jo mest en
tilfældighed at tekstens tegnsæt svarer til terminalens.
Hvis man bruger den type lav-niveau programmer (dvs. programmer der
ikke ved noget om indholdet), er det brugerens eget ansvar at indsætte
et passende 'recode' i en pipe for at få det vist korrekt.
Det jeg har snakket om er terminalapplikationer på et højere niveau:
emailklient, browser, editor osv., der har adgang til meta-data om
teksten (i særdeleshed meta-data om tegnsæt), og som derfor kan sørge
for at tegnene bliver vist korrekt også selvom terminal bruger et
andet tegnsæt.
>>Xterm har escape-koder til at skifte mellem tegnsæt. Dem har jeg
>>valgt at ignorere -- det er ikke dem som bliver brugt, de er
>>forældede, og dokumentationen fraråder dem.
>
> Interessant, gad vide om Rxvt også har dem... Men på den anden side,
> jeg har ikke haft brug for dem endnu.
Du får næppe brug for dem med mindre du skal behandle ISO-2022
baserede tegnsæt.
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (04-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 04-04-04 23:13 |
|
Den Sun, 04 Apr 2004 22:45:17 +0200 skrev Jesper Harder:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Når jeg skriver at terminalen skal vise iso8859-15 korrekt, så mener
>> jeg at når jeg skriver "ls" eller "cat latin9tekst", så skal det
>> vises korrekt, incl. æøå og andre tegn der har en anden encoding
>> i utf-8.
>
>'cat' osv. er "dumme" programmer, der betragter alt som en
>bag-of-bytes. I de tilfælde, hvor de virker, er det jo mest en
>tilfældighed at tekstens tegnsæt svarer til terminalens.
Nej, det er ikke en tilfældighed, det er fordi det er sat op så alt
snakker samme tegnsæt.
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Harder (31-03-2004)
| Kommentar Fra : Jesper Harder |
Dato : 31-03-04 17:34 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Den Wed, 31 Mar 2004 16:50:15 +0200 skrev Jesper Harder:
>
>>Så blev det vist forkert for dig. Det første tegn var brøken 1/2,
>>det andet tegn var oe-ligaturen.
>
> Ikke i iso8859, som bruges på den danske del af usenet.
Godaw mand økseskaft. Indlægget var ikke sendt med iso-8859-1.
Har du overhovedet nogen erfaring med at programmere applikationer,
der skal håndtere forskellige tegnsæt eller i18n generelt? Det lyder
ikke som om du ved ret meget om det du udtaler dig om.
I øvrigt giver »iso8859« giver meget mening i denne sammenhæng: det
kan være alt fra græsk til arabisk eller hebraisk. De facto
tegnsættet i dk.* er iso-8859-1¹ -- hvorfor bruger du ikke det?
> Utf-8 er en fejl i .dk-grupperne.
Alle andre tegnsæt end iso-8859-1 (og ascii) er en fejl med mindre
teksten indeholder tegn, som kræver et andet tegnsæt.
>>Salmonsens Konversationsleksikon. (Langt mere nyttig end biblen .
>
> Men ikke særlig omtalt, åbenbart - jeg har ikke hørt om den,
Herre jemini. Det siger vist mest om din almene dannelse.
> og du kunne kun halvdelen af titlen.
»Salmonsens Konversationsleksikon« (26 bind) er skam den fulde titel.
»Salmonsens Lille Konversationsleksikon« er navnet på en forkortet
udgave (12 bind), der udkom nogle år senere.
¹ http://usenet.dk/ord/lokal.html#iso-8859-1
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (31-03-2004)
| Kommentar Fra : Kent Friis |
Dato : 31-03-04 17:45 |
|
Den Wed, 31 Mar 2004 18:33:43 +0200 skrev Jesper Harder:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Den Wed, 31 Mar 2004 16:50:15 +0200 skrev Jesper Harder:
>>
>>>Så blev det vist forkert for dig. Det første tegn var brøken 1/2,
>>>det andet tegn var oe-ligaturen.
>>
>> Ikke i iso8859, som bruges på den danske del af usenet.
>
>Godaw mand økseskaft. Indlægget var ikke sendt med iso-8859-1.
Det var heller ikke det indlæg du sendte der havde spørgsmålstegnet. Det
var det jeg sendte, og det fulgte naturligvis iso8859.
Hvordan skulle jeg nogensinde kunne sende et indlæg med begge tegn i,
og samtidig overholde enten iso8859-1 eller iso8859-15? Hvis det ikke er
muligt, så er det heller ikke en fejl i programmet, at det ene tegn blev
til et spørgsmålstegn.
>Har du overhovedet nogen erfaring med at programmere applikationer,
>der skal håndtere forskellige tegnsæt eller i18n generelt? Det lyder
>ikke som om du ved ret meget om det du udtaler dig om.
I lige måde.
>I øvrigt giver »iso8859« giver meget mening i denne sammenhæng: det
>kan være alt fra græsk til arabisk eller hebraisk. De facto
>tegnsættet i dk.* er iso-8859-1¹ -- hvorfor bruger du ikke det?
Fordi jeg forlængst har indset at selvom DK står udenfor euroen, så
hedder det altså ikke 1990 længere, og vi er nødt til at følge med. Så
når iso8859-1 nutildags hedder iso8859-15, så bruger jeg naturligvis
den.
>>>Salmonsens Konversationsleksikon. (Langt mere nyttig end biblen .
>>
>> Men ikke særlig omtalt, åbenbart - jeg har ikke hørt om den,
>
>Herre jemini. Det siger vist mest om din almene dannelse.
Var det en fornærmelse?
>> og du kunne kun halvdelen af titlen.
>
>»Salmonsens Konversationsleksikon« (26 bind) er skam den fulde titel.
Du skrev "Salmonsens".
Talt i ord, er det halvdelen af titlen. Talt i bogstaver er det lige
under en tredjedel af titlen.
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Harder (04-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 04-04-04 23:41 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Den Sun, 04 Apr 2004 22:45:17 +0200 skrev Jesper Harder:
>
>>'cat' osv. er "dumme" programmer, der betragter alt som en
>>bag-of-bytes. I de tilfælde, hvor de virker, er det jo mest en
>>tilfældighed at tekstens tegnsæt svarer til terminalens.
>
> Nej, det er ikke en tilfældighed, det er fordi det er sat op så alt
> snakker samme tegnsæt.
Det er ikke en tilfældighed, at de filer du selv har lavet bruger
samme tegnsæt. Men du skal også snakke med resten af verden, som ikke
nødvendigvis bruger samme tegnsæt som dit system.
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (05-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 05-04-04 08:48 |
|
Den Mon, 05 Apr 2004 00:41:21 +0200 skrev Jesper Harder:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Den Sun, 04 Apr 2004 22:45:17 +0200 skrev Jesper Harder:
>>
>>>'cat' osv. er "dumme" programmer, der betragter alt som en
>>>bag-of-bytes. I de tilfælde, hvor de virker, er det jo mest en
>>>tilfældighed at tekstens tegnsæt svarer til terminalens.
>>
>> Nej, det er ikke en tilfældighed, det er fordi det er sat op så alt
>> snakker samme tegnsæt.
>
>Det er ikke en tilfældighed, at de filer du selv har lavet bruger
>samme tegnsæt. Men du skal også snakke med resten af verden, som ikke
>nødvendigvis bruger samme tegnsæt som dit system.
Så forstår jeg dem alligevel ikke.
Skal jeg snakke med resten af europa, bliver der brugt iso8859-1 eller
iso8859-15. Derudover må folk holde sig til engelsk og dermed us-ascii,
som iso8859-serien er kompatibel med.
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Harder (05-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 05-04-04 01:03 |
|
Jesper Harder <harder@myrealbox.com> writes:
> Keld Jørn Simonsen <keld@dkuug.dk> writes:
Om C1
>> Nej, det bruges ikke i ISO 2022 orienterede østasiasiske tegnsæt.
>> utf-8 undgår dem også.
>
> Jeg havde eller forstået det sådan, at de bl.a. bliver brugt i
> iso-2022-jp-2. Er det en misforståelse?
Ja! Bare glem spørgsmålet.
--
Jesper Harder < http://purl.org/harder/>
| |
Jesper Harder (31-03-2004)
| Kommentar Fra : Jesper Harder |
Dato : 31-03-04 19:52 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Jesper Harder writes:
>
> Hvordan skulle jeg nogensinde kunne sende et indlæg med begge tegn i,
> og samtidig overholde enten iso8859-1 eller iso8859-15?
Vi snakkede ikke om at sende, men om hvordan det blev _fremvist_ for
dig.
> Hvis det ikke er muligt, så er det heller ikke en fejl i programmet,
> at det ene tegn blev til et spørgsmålstegn.
Det var det forkerte tegn, som blev lavet om til et spørgsmålstegn.
Det er en åbenlys fejl.
>>Har du overhovedet nogen erfaring med at programmere applikationer,
>>der skal håndtere forskellige tegnsæt eller i18n generelt? Det lyder
>>ikke som om du ved ret meget om det du udtaler dig om.
>
> I lige måde.
Du har altså ingen teknisk erfaring med implementering af i18n, eller
hvad?
> Fordi jeg forlængst har indset at selvom DK står udenfor euroen, så
> hedder det altså ikke 1990 længere,
Hvis din tekst ikke indeholder eurotegnet (eller en af de andre
forskelle), hvad er så den tekniske begrundelse for ikke at bruge
latin-1? (Det er da fint nok at bruge latin-9, hvis man faktisk har
brug for et af de anderledes tegn).
>>>>Salmonsens Konversationsleksikon.
>>>
>>> Men ikke særlig omtalt, åbenbart - jeg har ikke hørt om den,
>>
>>Herre jemini. Det siger vist mest om din almene dannelse.
>
> Var det en fornærmelse?
Det er en konstatering. Hvis du i stedet for at udstille din
manglende viden, havde slået op på Google, ville det første resultat
have vist dig, at Salmonsen er det klassiske danske opslagsværk, og at
det omtales som »Salmonsen«.
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (31-03-2004)
| Kommentar Fra : Kent Friis |
Dato : 31-03-04 21:03 |
|
Den Wed, 31 Mar 2004 20:52:11 +0200 skrev Jesper Harder:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Jesper Harder writes:
>>
>> Hvordan skulle jeg nogensinde kunne sende et indlæg med begge tegn i,
>> og samtidig overholde enten iso8859-1 eller iso8859-15?
>
>Vi snakkede ikke om at sende, men om hvordan det blev _fremvist_ for
>dig.
Det kan kun fremvises på en måde - med det tegnsæt som min xterm (eller
rettere, rxvt) kører. Det kan newsreaderen ikke lave om på, medmindre
den skulle til at åbne en ny rxvt hver gang der skal skiftes tegnsæt.
>> Hvis det ikke er muligt, så er det heller ikke en fejl i programmet,
>> at det ene tegn blev til et spørgsmålstegn.
>
>Det var det forkerte tegn, som blev lavet om til et spørgsmålstegn.
>Det er en åbenlys fejl.
Et ikke-eksisterende tegn skal enten laves om til noget der eksisterer,
eller forsvinde. Andre muligheder er der ikke.
>>>Har du overhovedet nogen erfaring med at programmere applikationer,
>>>der skal håndtere forskellige tegnsæt eller i18n generelt? Det lyder
>>>ikke som om du ved ret meget om det du udtaler dig om.
>>
>> I lige måde.
>
>Du har altså ingen teknisk erfaring med implementering af i18n, eller
>hvad?
Hvorfor skulle jeg overhovedet svare på det, når du ikke forstod mit
tidligere svar?
>> Fordi jeg forlængst har indset at selvom DK står udenfor euroen, så
>> hedder det altså ikke 1990 længere,
>
>Hvis din tekst ikke indeholder eurotegnet (eller en af de andre
>forskelle), hvad er så den tekniske begrundelse for ikke at bruge
>latin-1? (Det er da fint nok at bruge latin-9, hvis man faktisk har
>brug for et af de anderledes tegn).
Jeg gider sg* ikke have flere newsreadere med forskellig opsætning alt
efter hvilket indlæg jeg skal skrive. Og da slet ikke bare fordi en
eller anden knold ikke har opdaget at iso8859-1 er blevet skiftet ud
med iso8859-15.
>>>>>Salmonsens Konversationsleksikon.
>>>>
>>>> Men ikke særlig omtalt, åbenbart - jeg har ikke hørt om den,
>>>
>>>Herre jemini. Det siger vist mest om din almene dannelse.
>>
>> Var det en fornærmelse?
>
>Det er en konstatering. Hvis du i stedet for at udstille din
>manglende viden, havde slået op på Google, ville det første resultat
>have vist dig, at Salmonsen er det klassiske danske opslagsværk, og at
>det omtales som »Salmonsen«.
Det prøvede jeg så lige... Beklager, men:
"... Liksom sin svenska motsvarighet utkom "Salmonsen" med en första
utgåva under 1800-talet och en andra utgåva under första tredjedelen
av 1900-talet. ... "
er ikke lige hvad jeg normalt forstår under "klassiske danske
opslagsværk".
Til gengæld forklarer "1800-talet" ret klart hvorfor visse personer
har svært ved at acceptere at Latin1 er blevet skiftet ud med Latin9.
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Harder (05-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 05-04-04 11:27 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Den Mon, 05 Apr 2004 00:41:21 +0200 skrev Jesper Harder:
>
>>Det er ikke en tilfældighed, at de filer du selv har lavet bruger
>>samme tegnsæt. Men du skal også snakke med resten af verden, som ikke
>>nødvendigvis bruger samme tegnsæt som dit system.
>
> Så forstår jeg dem alligevel ikke.
>
> Skal jeg snakke med resten af europa, bliver der brugt iso8859-1
> eller iso8859-15.
Nå, har du meldt Grækenland, Baltikum, meget af centraleuropa, Balkan,
Malta, Wales og Lapland ud af Europa?
Latin-1 eller latin-9 er ikke engang tilstrækkeligt til kongeriget
(hint: inuit).
> Derudover må folk holde sig til engelsk og dermed us-ascii,
Meget professionelt.
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (05-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 05-04-04 13:05 |
|
Den Mon, 05 Apr 2004 12:27:17 +0200 skrev Jesper Harder:
> leeloo@phreaker.net (Kent Friis) writes:
>
>> Den Mon, 05 Apr 2004 00:41:21 +0200 skrev Jesper Harder:
>>
>>>Det er ikke en tilfældighed, at de filer du selv har lavet bruger
>>>samme tegnsæt. Men du skal også snakke med resten af verden, som ikke
>>>nødvendigvis bruger samme tegnsæt som dit system.
>>
>> Så forstår jeg dem alligevel ikke.
>>
>> Skal jeg snakke med resten af europa, bliver der brugt iso8859-1
>> eller iso8859-15.
>
> Nå, har du meldt Grækenland, Baltikum, meget af centraleuropa, Balkan,
> Malta, Wales og Lapland ud af Europa?
Vest-europa så da. Jeg forstår hverken græsk, rumænsk eller walisisk.
> Latin-1 eller latin-9 er ikke engang tilstrækkeligt til kongeriget
> (hint: inuit).
>
>> Derudover må folk holde sig til engelsk og dermed us-ascii,
>
> Meget professionelt.
Så professionelt det nu kan blive, når jeg hverken har en tolk oversat,
eller snakker lige så mange sprog som Indiana Jones.
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Harder (31-03-2004)
| Kommentar Fra : Jesper Harder |
Dato : 31-03-04 23:05 |
|
leeloo@phreaker.net (Kent Friis) writes:
> Jesper Harder writes:
>
>>Vi snakkede ikke om at sende, men om hvordan det blev _fremvist_ for
>>dig.
>
> Det kan kun fremvises på en måde - med det tegnsæt som min xterm (eller
> rettere, rxvt) kører. Det kan newsreaderen ikke lave om på, medmindre
> den skulle til at åbne en ny rxvt hver gang der skal skiftes tegnsæt.
Sludder. Selvfølgelig kan man få en terminalemulator til at vise
begge tegn korrekt. Her er et skærmbillede af Gnus i en xterm, der
viser begge tegn: < http://www.ifa.au.dk/~harder/xterm.png>.
>>Det var det forkerte tegn, som blev lavet om til et spørgsmålstegn.
>>Det er en åbenlys fejl.
>
> Et ikke-eksisterende tegn skal enten laves om til noget der eksisterer,
> eller forsvinde. Andre muligheder er der ikke.
Hvis en klient har en så ringe tegnsætsunderstøttelse, at den ikke kan
afsende med et tegnsæt, hvor begge tegn kan repræsenteres, er det
rimeligt nok at erstatte det ikke-repræsenterbare tegn med et
spørgsmåltegn.
Problemet er bare, at din klient erstattede det forkerte tegn (det
tegn som faktisk er indeholdt i latin-9) med et spørgsmålstegn i
stedet for det andet.
>>Hvis din tekst ikke indeholder eurotegnet (eller en af de andre
>>forskelle), hvad er så den tekniske begrundelse for ikke at bruge
>>latin-1? (Det er da fint nok at bruge latin-9, hvis man faktisk har
>>brug for et af de anderledes tegn).
>
> Jeg gider sg* ikke have flere newsreadere med forskellig opsætning
> alt efter hvilket indlæg jeg skal skrive.
Hvorfor skulle det være nødvendigt at bruge flere
nyhedslæsere/opsætninger af den grund? Tegnsættet skal da bare vælges
på baggrund af de tegn, som faktisk optræder i teksten. Hvor svært
kan det være?
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (01-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 01-04-04 21:33 |
|
Den Thu, 01 Apr 2004 00:04:40 +0200 skrev Jesper Harder:
>leeloo@phreaker.net (Kent Friis) writes:
>
>> Jesper Harder writes:
>>
>>>Vi snakkede ikke om at sende, men om hvordan det blev _fremvist_ for
>>>dig.
>>
>> Det kan kun fremvises på en måde - med det tegnsæt som min xterm (eller
>> rettere, rxvt) kører. Det kan newsreaderen ikke lave om på, medmindre
>> den skulle til at åbne en ny rxvt hver gang der skal skiftes tegnsæt.
>
>Sludder. Selvfølgelig kan man få en terminalemulator til at vise
>begge tegn korrekt. Her er et skærmbillede af Gnus i en xterm, der
>viser begge tegn: < http://www.ifa.au.dk/~harder/xterm.png>.
Uden at xterm'en begynder at vise iso8859-15 forkert?
>>>Det var det forkerte tegn, som blev lavet om til et spørgsmålstegn.
>>>Det er en åbenlys fejl.
>>
>> Et ikke-eksisterende tegn skal enten laves om til noget der eksisterer,
>> eller forsvinde. Andre muligheder er der ikke.
>
>Hvis en klient har en så ringe tegnsætsunderstøttelse, at den ikke kan
>afsende med et tegnsæt, hvor begge tegn kan repræsenteres, er det
>rimeligt nok at erstatte det ikke-repræsenterbare tegn med et
>spørgsmåltegn.
Min klient har så ringe tegnsætunderstøttelse at den ikke kan afsende
med iso8859-1/15, som krævet af OSS'en, med begge tegn repræsenteret.
(Jeg ved godt at OSS'en stadig kun nævner den gamle version af
tegnsættet, det bliver nok rettet hvis nogen fortæller forfatteren at
det ikke er alle der fatter at iso8859-15 blot er en opdateret udgave
af -1).
>Problemet er bare, at din klient erstattede det forkerte tegn (det
>tegn som faktisk er indeholdt i latin-9) med et spørgsmålstegn i
>stedet for det andet.
Muligvis den stadig tror den kører latin1?
>>>Hvis din tekst ikke indeholder eurotegnet (eller en af de andre
>>>forskelle), hvad er så den tekniske begrundelse for ikke at bruge
>>>latin-1? (Det er da fint nok at bruge latin-9, hvis man faktisk har
>>>brug for et af de anderledes tegn).
>>
>> Jeg gider sg* ikke have flere newsreadere med forskellig opsætning
>> alt efter hvilket indlæg jeg skal skrive.
>
>Hvorfor skulle det være nødvendigt at bruge flere
>nyhedslæsere/opsætninger af den grund? Tegnsættet skal da bare vælges
>på baggrund af de tegn, som faktisk optræder i teksten. Hvor svært
>kan det være?
AI er ikke implementeret endnu. "set mime_charset vælg ud fra teksten"
er ikke en option ret mange newsreadere forstår.
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Harder (05-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 05-04-04 15:04 |
|
Kent Friis <leeloo@phreaker.net> writes:
> Den Mon, 05 Apr 2004 12:27:17 +0200 skrev Jesper Harder:
>> leeloo@phreaker.net (Kent Friis) writes:
>
>>> Derudover må folk holde sig til engelsk og dermed us-ascii,
>>
>> Meget professionelt.
>
> Så professionelt det nu kan blive, når jeg hverken har en tolk
Jeg har brug for at redigere masser af kildekode og filer, der
indeholder iso-2022-7bit strenge.
Det ville forekomme ret dilletantisk at være nødt til at sige "Uha,
den funktion kan jeg sandelig ikke ændre", bare fordi filen bruger et
andet tegnsæt end mit eget locale.
--
Jesper Harder < http://purl.org/harder/>
| |
Kent Friis (05-04-2004)
| Kommentar Fra : Kent Friis |
Dato : 05-04-04 16:04 |
|
Den Mon, 05 Apr 2004 16:03:34 +0200 skrev Jesper Harder:
> Kent Friis <leeloo@phreaker.net> writes:
>
>> Den Mon, 05 Apr 2004 12:27:17 +0200 skrev Jesper Harder:
>>> leeloo@phreaker.net (Kent Friis) writes:
>>
>>>> Derudover må folk holde sig til engelsk og dermed us-ascii,
>>>
>>> Meget professionelt.
>>
>> Så professionelt det nu kan blive, når jeg hverken har en tolk
>
> Jeg har brug for at redigere masser af kildekode og filer, der
> indeholder iso-2022-7bit strenge.
Det er jo så dit problem - ikke mit.
> Det ville forekomme ret dilletantisk at være nødt til at sige "Uha,
> den funktion kan jeg sandelig ikke ændre", bare fordi filen bruger et
> andet tegnsæt end mit eget locale.
Hvem sagde "være nødt til"?
Jeg bruger iso8859-15, fordi den opfylder MIT behov.
Mvh
Kent
--
Help test this great MMORPG game - http://www.eternal-lands.com/
| |
Jesper Harder (01-04-2004)
| Kommentar Fra : Jesper Harder |
Dato : 01-04-04 00:49 |
|
Klaus Ellegaard <klausellegaard@msn.com> writes:
> UTF-8 har ikke rigtig vundet indpas endnu. Mange klienter kan ikke
> overskue det,
Jeg vil skyde på at mindst 95% af alle brugere kan håndtere det.[1]
Hvilke klienter understøtter det ikke? NN, tin (?), muligvis gamle
versioner af andre klienter -- er der andre?
> og så ender man med en masse citater, der citerer UTF-8 i
> ISO8859-x. Det er ret grimt at se på.
Man bør selvfølgelig afholde sig fra andet end latin-1 med mindre der
er en teknisk grund. Heldigvis tror jeg de fleste klienter er smarte
nok til selv at vælge det "mindst mulige" tegnsæt, som RFC <mumle>
forlanger.
Men hvis man fx vil spørge i dk.kultur.sprog om
Hvad betyder "et-eller-andet-japansk-krimskrams"?
så er der ingen grund til afholde sig fra det blot fordi indlægget vil
bruge utf-8. De folk, som ikke kan se det, ville alligevel ikke kunne
vise det uanset hvilket tegnsæt man brugte, så ingen går glip af
noget.
[1] OE har ingen problemer. Resten er desværre nærmest som en dråbe i
havet
--
Jesper Harder < http://purl.org/harder/>
| |
Thomas Bjorn Anderse~ (02-04-2004)
| Kommentar Fra : Thomas Bjorn Anderse~ |
Dato : 02-04-04 14:06 |
|
Jesper Harder <harder@myrealbox.com> writes:
> Sludder. Selvfølgelig kan man få en terminalemulator til at vise
> begge tegn korrekt. Her er et skærmbillede af Gnus i en xterm, der
> viser begge tegn: < http://www.ifa.au.dk/~harder/xterm.png>.
Kunne du ikke lige poste en kogebogsopskrift paa, hvordan du opnaar
det resultat? Terminalprogram, emacsversion gnus-version, variable
etc.
Jeg er meget interesseret, da jeg aldrig rigtigt er kommet over
fuldstaendig nybegynder-forvirringsstadiet omkring tegnsaet.
Paa forhaand tak,
Thomas
--
Thomas Bjorn Andersen
+++ATH
| |
|
|