/ Forside / Teknologi / Internet / Browser / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Browser
#NavnPoint
Klaudi 20366
molokyle 12124
o.v.n. 8114
miritdk 4839
stl_s 3840
refi 3598
dk 2598
arlet 2470
tedd 2383
10  webnoob 2075
??? istedet for æøå i FF 1.5
Fra : Argh


Dato : 02-03-06 22:17

Hejsa

Hvad er den tekniske forklaring på at på enkelte hjemmeside bliver der vist
et ? istedet for æ eller ø eller å? Det er som sagt kun på enkelte
hjemmesider, så det må jo være webudvikleren der ikke overhoolder nogle
standarder. Men hvad er forklaringen?

Tak
AA



 
 
Ivan V. Klattrup (02-03-2006)
Kommentar
Fra : Ivan V. Klattrup


Dato : 02-03-06 22:29

Argh skrev:

> Men hvad er forklaringen?

Efter hvad jeg har lagt mfrke til, er det ner der ikke er angivet et
tegnsft i koden (f.eks kan gratis-ting.dk godt drille med ?-tegn), og FF
se falder tilbage til "Unicode (UTF-8)"

Jeg ved ikke om det er muligt at fe FF til at falde tilbage pe "Vestligt
(ISO-8859-1)" altid, i stedet for.

--
Ivan V. Klattrup
http://www.klattrup.dk

Ivan V. Klattrup (02-03-2006)
Kommentar
Fra : Ivan V. Klattrup


Dato : 02-03-06 22:33

Ivan V. Klattrup skrev:

><SNIP>

Det blev sq lige så underligt, med de tre tegn.

Efter hvad jeg har lagt mærke til, er det når der ikke er angivet et
tegnsæt i koden (f.eks kan gratis-ting.dk godt drille med ?-tegn), og FF
så falder tilbage til "Unicode (UTF-8)"

Jeg ved ikke om det er muligt at få FF til at falde tilbage på "Vestligt
(ISO-8859-1)" altid, i stedet for.

--
Ivan V. Klattrup
http://www.klattrup.dk

Christian Bohr-Halli~ (02-03-2006)
Kommentar
Fra : Christian Bohr-Halli~


Dato : 02-03-06 23:35

"Ivan V. Klattrup" <ivan.klattrup@gmail.com> posting:

>Jeg ved ikke om det er muligt at få FF til at falde tilbage på "Vestligt
>(ISO-8859-1)" altid, i stedet for.

Indstillinger -> indhold -> avanceret -> "standard tegnsæt" ?

--
What is life, except excuse for death,
or death, but an escape from life. -Ukendt

http://my.opera.com/community/customize/widgets/?show=new

Ivan V. Klattrup (03-03-2006)
Kommentar
Fra : Ivan V. Klattrup


Dato : 03-03-06 00:05

Christian Bohr-Halling skrev:

>Indstillinger -> indhold -> avanceret -> "standard tegnsæt" ?

der har jeg sat den til "Vestligt (ISO-8859-1)", men det virker som vinden
blæser

--
Ivan V. Klattrup
http://www.klattrup.dk

Christian Bohr-Halli~ (03-03-2006)
Kommentar
Fra : Christian Bohr-Halli~


Dato : 03-03-06 01:00

"Ivan V. Klattrup" <ivan.klattrup@gmail.com> posting:

>>Indstillinger -> indhold -> avanceret -> "standard tegnsæt" ?
>der har jeg sat den til "Vestligt (ISO-8859-1)", men det virker som vinden
>blæser

Hm, det har du ret i. Jeg prøvede før at sætte den til noget andet
end 8859-1 og gå til www.gratis-ting.dk, hvorefter den også viste
"?" for æ, ø og å -- modsat tidligere. Så satte jeg den tilbage til
8859-1. Jeg blev dog nødt til rent fysisk af lukke fanen ned og
indlæse siden igen, før jeg fik de rigtige æøå igen (opdatering gik
ikke?!). Gik så ud fra, at det virkede ok, men der tog jeg åbenbart
fejl:
Nu, efter at have lukket FF ned og startet den igen, mener den, at
siden i stedet skal vises med UFT-8, selvom den står til 8859-1 per
standard i omtalte indstilling.

Nå, den logik opgiver jeg så at finde mere rundt i her i nat og
lusker hjem til Bcren-land igen

--
What is life, except excuse for death,
or death, but an escape from life. -Ukendt

http://my.opera.com/community/customize/widgets/?show=new

Carl Drud (03-03-2006)
Kommentar
Fra : Carl Drud


Dato : 03-03-06 19:54

Ivan V. Klattrup wrote:

> Efter hvad jeg har lagt mærke til, er det når der ikke er angivet et
> tegnsæt i koden (f.eks kan gratis-ting.dk godt drille med ?-tegn), og FF
> så falder tilbage til "Unicode (UTF-8)"

Kører du siden gennem validator på W3C vælger den også utf-8.

http://validator.w3.org/check?uri=http%3A%2F%2Fgratis-ting.dk%2Fny%2Findex.php

--
Med venlig hilsen
Carl

Ivan V. Klattrup (03-03-2006)
Kommentar
Fra : Ivan V. Klattrup


Dato : 03-03-06 20:05

Carl Drud skrev:

>Kører du siden gennem validator på W3C vælger den også utf-8.

Ja det kan jeg se, og prøver man så WDG's validator tror den på ISO-8859-1
, det er noget mærkeligt noget.

http://www.htmlhelp.com/cgi-bin/validate.cgi?url=http%3A%2F%2Fgratis-ting.dk%2Fny%2Findex.php&warnings=yes

--
Ivan V. Klattrup
http://www.klattrup.dk

Christian Bohr-Halli~ (03-03-2006)
Kommentar
Fra : Christian Bohr-Halli~


Dato : 03-03-06 21:13

Carl Drud <carl.drud@myrealbox.com> posting:

>> Efter hvad jeg har lagt mærke til, er det når der ikke er angivet et
>> tegnsæt i koden (f.eks kan gratis-ting.dk godt drille med ?-tegn), og FF
>> så falder tilbage til "Unicode (UTF-8)"
>Kører du siden gennem validator på W3C vælger den også utf-8.

Kan ikke se, UTF-8 el. andet står angivet noget sted i det, serveren
giver tilbage: http://www.itu.dk/~chr/temp/ukom.txt
Opera kan i øvrigt heller ikke finde noget i den stil:
http://www.itu.dk/~chr/temp/gts.png

Jeg mener ikke, det skal fortolkes som UTF-8, hvis intet er angivet,
men ASCII (kan huske forkert). Gad i så fald vide, hvor UFT-8-ideen
kommer fra?

--
What is life, except excuse for death,
or death, but an escape from life. -Ukendt

http://my.opera.com/community/customize/widgets/?show=new

Carl Drud (03-03-2006)
Kommentar
Fra : Carl Drud


Dato : 03-03-06 21:35

Christian Bohr-Halling wrote:

> Jeg mener ikke, det skal fortolkes som UTF-8, hvis intet er angivet,
> men ASCII (kan huske forkert).

Sådan er det vist med mail/news beskeder. Om det forholder sig ligeså
med web sider ved jeg ikke.

Her er resultatet med "Encoding: us-ascii" valgt.

http://validator.w3.org/check?uri=http%3A%2F%2Fgratis-ting.dk%2Fny%2Findex.php&charset=us-ascii&doctype=Inline

> Gad i så fald vide, hvor UFT-8-ideen kommer fra?

Da siden indeholder 8bit tegn har den har vel skønnet det var det bedst
egnede.

--
Med venlig hilsen
Carl

Christian Bohr-Halli~ (03-03-2006)
Kommentar
Fra : Christian Bohr-Halli~


Dato : 03-03-06 22:09

Carl Drud <carl.drud@myrealbox.com> posting:

>> Jeg mener ikke, det skal fortolkes som UTF-8, hvis intet er angivet,
>> men ASCII (kan huske forkert).
>Sådan er det vist med mail/news beskeder. Om det forholder sig ligeså
>med web sider ved jeg ikke.

Nå, så må jeg vel hellere se, om jeg kan finde ud af en mulig årsag
og få en opfrisket HTML/HTTP-læsning

En meget hurtigt HTTP-læsning giver, at det per standard skal ses
som ISO-8859-1 (muligt jeg har misset noget i farten):

|The "charset" parameter is used with some media types to define the
|character set (section 3.4) of the data. When no explicit charset
|parameter is provided by the sender, media subtypes of the "text"
|type are defined to have a default charset value of "ISO-8859-1"
|when received via HTTP.
-- http://www.w3.org/Protocols/rfc2616/rfc2616-sec3.html#sec3.7.1

|Some HTTP/1.0 software has interpreted a Content-Type header without
|charset parameter incorrectly to mean "recipient should guess."
|Senders wishing to defeat this behavior MAY include a charset
|parameter even when the charset is ISO-8859-1 and SHOULD do so when
|it is known that it will not confuse the recipient.
http://www.w3.org/Protocols/rfc2616/rfc2616-sec3.html#sec3.4.1


Det er jo så meget rart, at HTML 4 siger noget andet og overfrumfer
dette:

|The HTTP protocol ([RFC2616], section 3.7.1) mentions ISO-8859-1 as
|a default character encoding when the "charset" parameter is absent
|from the "Content-Type" header field. In practice, this
|recommendation has proved useless because some servers don't allow a
|"charset" parameter to be sent, and others may not be configured to
|send the parameter. Therefore, user agents must not assume any
|default value for the "charset" parameter.
-- http://www.w3.org/TR/html401/charset.html

.... og videre....
|To sum up, conforming user agents must observe the following
|priorities when determining a document's character encoding (from
|highest priority to lowest):
|1. An HTTP "charset" parameter in a "Content-Type" field.
|2. A META declaration with "http-equiv" set to "Content-Type" and a
|value set for "charset".
|3. The charset attribute set on an element that designates an external
|resource.

(omtalte gratis-ting-side har intet af dette angivet)

|In addition to this list of priorities, the user agent may use
|heuristics and user settings. For example, many user agents use a
|heuristic to distinguish the various encodings used for Japanese
|text. Also, user agents typically have a user-definable, local
|default character encoding which they apply in the absence of other
|indicators.

Altså kan vi vel slutte, at validatorens og til tider FFs heuristik
i omtalte tilfælde ikke rammer plet, og det er altså dér, UTF-8
kommer ind i billedet. Værre er det, at FF ikke helt kan blive enig
med sig selv om at anvende den angivede "local default character
encoding which they apply in the absence of other indicators",
news:2o1f021lkslpnraf8m0lcie2kami4vf5pv@dtext.news.tele.dk - en bug?

--
What is life, except excuse for death,
or death, but an escape from life. -Ukendt

http://my.opera.com/community/customize/widgets/?show=new

Christian Bohr-Halli~ (03-03-2006)
Kommentar
Fra : Christian Bohr-Halli~


Dato : 03-03-06 22:15

Carl Drud <carl.drud@myrealbox.com> posting:

>> Jeg mener ikke, det skal fortolkes som UTF-8, hvis intet er angivet,
>> men ASCII (kan huske forkert).
>Sådan er det vist med mail/news beskeder. Om det forholder sig ligeså
>med web sider ved jeg ikke.

Nå, så må jeg vel hellere se, om jeg kan finde ud af en mulig årsag
og få en opfrisket HTML/HTTP-læsning

En meget hurtigt HTTP-læsning giver, at det per standard skal ses
som ISO-8859-1 (muligt jeg har misset noget i farten):

|The "charset" parameter is used with some media types to define the
|character set (section 3.4) of the data. When no explicit charset
|parameter is provided by the sender, media subtypes of the "text"
|type are defined to have a default charset value of "ISO-8859-1"
|when received via HTTP.
-- http://www.w3.org/Protocols/rfc2616/rfc2616-sec3.html#sec3.7.1

|Some HTTP/1.0 software has interpreted a Content-Type header without
|charset parameter incorrectly to mean "recipient should guess."
|Senders wishing to defeat this behavior MAY include a charset
|parameter even when the charset is ISO-8859-1 and SHOULD do so when
|it is known that it will not confuse the recipient.
http://www.w3.org/Protocols/rfc2616/rfc2616-sec3.html#sec3.4.1


Det er jo så meget rart, at HTML 4 siger noget andet og overfrumfer
dette:

|The HTTP protocol ([RFC2616], section 3.7.1) mentions ISO-8859-1 as
|a default character encoding when the "charset" parameter is absent
|from the "Content-Type" header field. In practice, this
|recommendation has proved useless because some servers don't allow a
|"charset" parameter to be sent, and others may not be configured to
|send the parameter. Therefore, user agents must not assume any
|default value for the "charset" parameter.
-- http://www.w3.org/TR/html401/charset.html

.... og videre....
|To sum up, conforming user agents must observe the following
|priorities when determining a document's character encoding (from
|highest priority to lowest):
|1. An HTTP "charset" parameter in a "Content-Type" field.
|2. A META declaration with "http-equiv" set to "Content-Type" and a
|value set for "charset".
|3. The charset attribute set on an element that designates an external
|resource.

(omtalte gratis-ting-side har intet af dette angivet)

|In addition to this list of priorities, the user agent may use
|heuristics and user settings. For example, many user agents use a
|heuristic to distinguish the various encodings used for Japanese
|text. Also, user agents typically have a user-definable, local
|default character encoding which they apply in the absence of other
|indicators.

Altså kan vi vel slutte, at validatorens og til tider FFs heuristik
i omtalte tilfælde ikke rammer plet, og det er altså dér, UTF-8
kommer ind i billedet. Værre er det, at FF ikke helt kan blive enig
med sig selv om at anvende den angivede "local default character
encoding which they apply in the absence of other indicators",
news:2o1f021lkslpnraf8m0lcie2kami4vf5pv@dtext.news.tele.dk - en bug?

--
What is life, except excuse for death,
or death, but an escape from life. -Ukendt

http://my.opera.com/community/customize/widgets/?show=new

Carl Drud (04-03-2006)
Kommentar
Fra : Carl Drud


Dato : 04-03-06 16:40

Christian Bohr-Halling wrote:

> Nå, så må jeg vel hellere se, om jeg kan finde ud af en mulig årsag
> og få en opfrisket HTML/HTTP-læsning

Jeg orker ikke at læse det. Har lige været igennem en intern audit i
firmaet på tysk. "Liegt eine konsistenten datenverdichtung vor?".
Velbekomme.

> En meget hurtigt HTTP-læsning giver, at det per standard skal ses
> som ISO-8859-1 (muligt jeg har misset noget i farten):

Her bliver den også vist som iso-8859-1.

[klip div standarder]

> Altså kan vi vel slutte, at validatorens og til tider FFs heuristik
> i omtalte tilfælde ikke rammer plet, og det er altså dér, UTF-8
> kommer ind i billedet. Værre er det, at FF ikke helt kan blive enig
> med sig selv om at anvende den angivede "local default character
> encoding which they apply in the absence of other indicators",
> news:2o1f021lkslpnraf8m0lcie2kami4vf5pv@dtext.news.tele.dk - en bug?

Du skriver højere oppe at "per standard skal ses som ISO-8859-1". Dit
screenshot af din Opera tidligere i tråden viser den som "windows-1252"
- en bug?

--
Med venlig hilsen
Carl

Christian Bohr-Halli~ (04-03-2006)
Kommentar
Fra : Christian Bohr-Halli~


Dato : 04-03-06 17:26

Carl Drud <carl.drud@myrealbox.com> posting:

>> Altså kan vi vel slutte, at validatorens og til tider FFs heuristik
>> i omtalte tilfælde ikke rammer plet, og det er altså dér, UTF-8
>> kommer ind i billedet. Værre er det, at FF ikke helt kan blive enig
>> med sig selv om at anvende den angivede "local default character
>> encoding which they apply in the absence of other indicators",
>> news:2o1f021lkslpnraf8m0lcie2kami4vf5pv@dtext.news.tele.dk - en bug?
>
>Du skriver højere oppe at "per standard skal ses som ISO-8859-1". Dit

Og jeg skriver lige efter, at HTML 4 overtrumfer dette og siger, at
det ikke skal være sådan alligevel.

>screenshot af din Opera tidligere i tråden viser den som "windows-1252"
>- en bug?

Nej, en "local default character encoding which they apply in the
absence of other indicators"

--
What is life, except excuse for death,
or death, but an escape from life. -Ukendt

http://my.opera.com/community/customize/widgets/?show=new

Søg
Reklame
Statistik
Spørgsmål : 177557
Tips : 31968
Nyheder : 719565
Indlæg : 6408868
Brugere : 218888

Månedens bedste
Årets bedste
Sidste års bedste