/ Forside / Teknologi / Udvikling / HTML / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
HTML
#NavnPoint
molokyle 11184
Klaudi 5506
bentjuul 3377
severino 2040
smorch 1950
strarup 1525
natmaden 1396
scootergr.. 1320
e.c 1150
10  miritdk 1110
Mere om language tags/sprog på websider
Fra : Mikkel Møldrup-Lakje~


Dato : 23-08-05 15:04

Vi har tidligere talt om sprog og tags, inkl. søgemaskinernes forståelse af
tags, her på siden.

Jeg har en side på dansk, som jeg oversatte til engelsk og andre sprog. Jeg
indsatte derfor links til oversættelserne på den danske side. Øverst i
brødteksten på den danske side indsatte jeg derfor et link med engelsk
anchor text. Men det medførte, at Google uden videre omregistrerede siden
til den engelsksprogede kategori - Google troede mao. at hele siden var på
engelsk.

Jeg har så indsat <html lang="da"> og <meta http-equiv="content-language"
content="da"> på siden, og jeg troede en overgang at det var lykkedes at få
siden registreret som dansk igen, men den melding jeg kom med her i gruppen,
viste sig at være forkert.

1. Har jeg ret i at det er ligegyldigt om jeg skrier "da" eller "DA" (med
småt/stort)?

2. Det ser ikke ud til at Google tager hensyn til tags, når den bestemmer
sproget. Dens besvær med skelne mellem norsk og dansk er måske også udtryk
for, at bestemmelsen af sprog udelukkende tager hensyn til sidens egentlige
indhold?

3. http://www.submitcorner.com/Guide/Meta/language.shtml nævner at man kan
angive flere sprog for samme side. Hvordan er syntaksen for det? Er det mon
f.eks.: <meta http-equiv="content-language" content="da";en;de;"> ?
(Ellers kan jeg selvfølgelig bruge <p lang="da"> som Jens Gyldenkærne
foreslog i sin tid).

Jeg vil være glad for jeres kommentarer.

med venlig hilsen,
Mikkel



 
 
Mikkel Møldrup-Lakje~ (23-08-2005)
Kommentar
Fra : Mikkel Møldrup-Lakje~


Dato : 23-08-05 15:23

"Mikkel Møldrup-Lakjer" <mikkel@fabel.dk> skrev i en meddelelse
news:430b2cf1$0$18644$14726298@news.sunsite.dk...
> Vi har tidligere talt om sprog og tags, inkl. søgemaskinernes forståelse
> af tags, her på siden.

Lad mig lige komme korrektionerne i forkøbet: Jeg mente selvfølgelig: her i
gruppen.

> Jeg har en side på dansk, som jeg oversatte til engelsk og andre sprog.
> Jeg indsatte derfor links til oversættelserne på den danske side. Øverst i
> brødteksten på den danske side indsatte jeg derfor et link med engelsk
> anchor text. Men det medførte, at Google uden videre omregistrerede siden
> til den engelsksprogede kategori - Google troede mao. at hele siden var på
> engelsk.

Jeg kan tilføje at jeg har flyttet disse links med ikke-dansk anchor text
igen, men Google tror stadig hele siden er på engelsk, øv.

Mikkel



Johnny Winther Ronne~ (23-08-2005)
Kommentar
Fra : Johnny Winther Ronne~


Dato : 23-08-05 17:24

In news:<430b2cf1$0$18644$14726298@news.sunsite.dk>
Mikkel Møldrup-Lakjer typed:
> Vi har tidligere talt om sprog og tags, inkl. søgemaskinernes
> forståelse af tags, her på siden.
>
> Jeg har en side på dansk, som jeg oversatte til engelsk og andre
> sprog. Jeg indsatte derfor links til oversættelserne på den danske
> side. Øverst i brødteksten på den danske side indsatte jeg derfor et
> link med engelsk anchor text. Men det medførte, at Google uden videre
> omregistrerede siden til den engelsksprogede kategori - Google troede
> mao. at hele siden var på engelsk.
>
> Jeg har så indsat <html lang="da"> og <meta
> http-equiv="content-language" content="da"> på siden, og jeg troede
> en overgang at det var lykkedes at få siden registreret som dansk
> igen, men den melding jeg kom med her i gruppen, viste sig at være
> forkert.
>
> 1. Har jeg ret i at det er ligegyldigt om jeg skrier "da" eller "DA"
> (med småt/stort)?
>
> 2. Det ser ikke ud til at Google tager hensyn til tags, når den
> bestemmer sproget. Dens besvær med skelne mellem norsk og dansk er
> måske også udtryk for, at bestemmelsen af sprog udelukkende tager
> hensyn til sidens egentlige indhold?
>
> 3. http://www.submitcorner.com/Guide/Meta/language.shtml nævner at
> man kan angive flere sprog for samme side. Hvordan er syntaksen for
> det? Er det mon f.eks.: <meta http-equiv="content-language"
> content="da";en;de;"> ? (Ellers kan jeg selvfølgelig bruge <p
> lang="da"> som Jens Gyldenkærne foreslog i sin tid).
>
> Jeg vil være glad for jeres kommentarer.

I følge w3c skal sprog angives sådan her <html lang="da-DK"> eller sådan
her <html lang="dan">

Problemet opstår formentlig fordi du også bruger lang attibutten ned på
på siden men ikke ikke sætter sproget tilbage.

<p lang="da-DK">
<!-- her tales der dansk -->
</p>
<p lang="en-UK">
<!-- her tales der engelsk -->
</p>
<p lang="da-DK">
<-- her tales der dansk igen -->
</p>

Hvis du bruger "lang" i toppen af siden på en menu og ikke sætter
sproget tilbage opfattes resten af dokumentet som værende på det
pågældende sprog. Så Google gør det sikker rigtigt nok

Men du kunne helgardere dig med et script der aflæste browserns sprog og
som dirigere videre til siden med det rigtige sprog. Dermed bliver det
lidt ligegyldigt hvilket sprog siden indekseres under, for det rigtige
sprog bliver vist til brugeren.

Med venlig hilsen
Johnny Winther Ronnenberg

--
Internettet er for alle!
http://80.62.61.212/webuseability/index.asp



Mikkel Møldrup-Lakje~ (23-08-2005)
Kommentar
Fra : Mikkel Møldrup-Lakje~


Dato : 23-08-05 18:23

"Johnny Winther Ronnenberg" <johnny.winther@XYZ789tdcadsl.dk> skrev i en
meddelelse news:430b4d7e$0$161$edfadb0f@dread11.news.tele.dk...

> I følge w3c skal sprog angives sådan her <html lang="da-DK"> eller sådan
> her <html lang="dan">

Hm... det må jeg lige kigge på!

> Hvis du bruger "lang" i toppen af siden på en menu og ikke sætter
> sproget tilbage opfattes resten af dokumentet som værende på det
> pågældende sprog. Så Google gør det sikker rigtigt nok

Nøh, jeg har sat lang til dansk og det er den eneste angivelse jeg har på
den side, men dagen efter jeg indsatte et link med anchor text på engelsk
skiftede Google til engelsk, så siden bliver "usynlig" når søger med "vis
kun sider på dansk".

> Men du kunne helgardere dig med et script der aflæste browserns sprog og
> som dirigere videre til siden med det rigtige sprog. Dermed bliver det
> lidt ligegyldigt hvilket sprog siden indekseres under, for det rigtige
> sprog bliver vist til brugeren.

Jeg er mest interesseret i at få siden indekseret rigtigt.

Tak for svar.

Mikkel



Jens Gyldenkærne Cla~ (23-08-2005)
Kommentar
Fra : Jens Gyldenkærne Cla~


Dato : 23-08-05 23:12

Johnny Winther Ronnenberg skrev:

> I følge w3c skal sprog angives sådan her <html lang="da-DK">
> eller sådan her <html lang="dan">

Hvor ser du det? Prøv at kigge på kapitel 8 i html-specifikationen
- parameteren lang kan bruges på meget andet end blot html-
elementet.

<http://www.w3.org/TR/html401/struct/dirlang.html>


> Problemet opstår formentlig fordi du også bruger lang
> attibutten ned på på siden men ikke ikke sætter sproget
> tilbage.

Nej - sådan fungerer html-attributter ikke. En attribut virker kun
for det element den står i (og eventuelle børn til elementet). Når
elementet lukkes, ophører virkefeltet for attributten.

Det gælder præcis på samme måde for lang som for class, style,
align og lignende html-parametre.

Eksempel:
<p lang="da-DK" class="dansk">
   Teksten her - <em>og her</em> - er påvirket af lang- og class-
parametrene til p-elementet</p>

<p>
   Teksten her er ikke påvirket af parametrene på det foregående
p-element.
</p>


> Men du kunne helgardere dig med et script der aflæste
> browserns sprog og som dirigere videre til siden med det
> rigtige sprog. Dermed bliver det lidt ligegyldigt hvilket
> sprog siden indekseres under,

Nej - sådan et script hjælper ikke hvis man slet ikke finder siden
(fx fordi man har søgt på dansksprogede sider, og siden fejlagtigt
er indekseret som engelsksproget).
--
Jens Gyldenkærne Clausen
Svar venligst under det du citerer, og citer kun det der er
nødvendigt for at forstå dit svar i sammenhængen. Se hvorfor og
hvordan på http://usenet.dk/netikette/citatteknik.html

Johnny Winther Ronne~ (24-08-2005)
Kommentar
Fra : Johnny Winther Ronne~


Dato : 24-08-05 18:37

In news:<Xns96BC21B51BDAjcdmfdk@gyrosmod.cybercity.dk>
Jens Gyldenkærne Clausen typed:
> Johnny Winther Ronnenberg skrev:
>
>> I følge w3c skal sprog angives sådan her <html lang="da-DK">
>> eller sådan her <html lang="dan">
>
> Hvor ser du det? Prøv at kigge på kapitel 8 i html-specifikationen
> - parameteren lang kan bruges på meget andet end blot html-
> elementet.
>
> <http://www.w3.org/TR/html401/struct/dirlang.html>
>


>
>> Problemet opstår formentlig fordi du også bruger lang
>> attibutten ned på på siden men ikke ikke sætter sproget
>> tilbage.
>
> Nej - sådan fungerer html-attributter ikke. En attribut virker kun
> for det element den står i (og eventuelle børn til elementet). Når
> elementet lukkes, ophører virkefeltet for attributten.
>
> Det gælder præcis på samme måde for lang som for class, style,
> align og lignende html-parametre.
>
> Eksempel:
> <p lang="da-DK" class="dansk">
> Teksten her - <em>og her</em> - er påvirket af lang- og class-
> parametrene til p-elementet</p>
>
> <p>
> Teksten her er ikke påvirket af parametrene på det foregående
> p-element.
> </p>
>
>

I specifikationen siges det i meget klar tekst at lang virker på samme
måde som class. Ingen diskussion om det. Det er ikke til at misforstå.

Men for et stykke tid siden måtte jeg gennemlæse sektionen om
internatiolisering fordi jeg faldt over referencer om at skift i sprog
gav et problem i talesyntese. Desværre er den oprindlige artikel blevet
væk under omstruktureringer i w3c.org.

Der var ellers en glimrende kortfattet artikel, der dokumneterede at
tidens browsere ikke skifter tilbage til det oprindelige sprog. Så hvis
ikke browseren kan skifte sprog korrekt, så ville jeg ikke satse på at
Google kan.

De nye arkler kan findes her:

http://www.w3.org/International/tutorials/language-decl/en/slides/Slide0150.html

>> Men du kunne helgardere dig med et script der aflæste
>> browserns sprog og som dirigere videre til siden med det
>> rigtige sprog. Dermed bliver det lidt ligegyldigt hvilket
>> sprog siden indekseres under,
>
> Nej - sådan et script hjælper ikke hvis man slet ikke finder siden
> (fx fordi man har søgt på dansksprogede sider, og siden fejlagtigt
> er indekseret som engelsksproget).

Hvis man eksplicit beder om et specifikt sprog, nej. Men jeg tror
faktisk ikke, at det så er almindeligt at bede om sprog og mange danske
sider findes faktisk kun på engelsk. Firmasider hvor koncern sproget er
engelsk, er normalt også skrevet på engelsk selv om domænet hører under
dk.

Jeg gennemlæste de nye sider og selv om specifikationen ikke er ændret
endnu, så er sprogkoder på tre bogstaver yt og erklæret decreprecated.
Problemet med browserne, nævnes ikke mere, men om det er væk svæver i
det uvisse.

Den nye sektion er nemmere at overskue, men har et seriøst
tilgængeligheds problem, Sidernes overordnede overskrifter er nemlig
indkapslet i billeder og det gælder også links til reference sider.
Hverken teksten eller links er gengivet under nogen form i html koden,
så fejlen er virkelig stor

Spøg til side i spørgerens svar fremgår det at Google har brugt de først
ord i dokumentet til at indeksere sproget efter og hvis det er rigtigt
,så er man skråt på røven, hvis man øverst på siden giver brugeren
mulighed for at skifte sprog, ligegyldig hvad man gør.

Med venlig hilsen
Johnny Winther Ronnenberg

--
Internettet er for alle!
http://80.62.61.212/webuseability/index.asp



Jens Gyldenkærne Cla~ (24-08-2005)
Kommentar
Fra : Jens Gyldenkærne Cla~


Dato : 24-08-05 22:09

Johnny Winther Ronnenberg skrev:
> Der var ellers en glimrende kortfattet artikel, der
> dokumneterede at tidens browsere ikke skifter tilbage til det
> oprindelige sprog. Så hvis ikke browseren kan skifte sprog
> korrekt, så ville jeg ikke satse på at Google kan.

Det ræsonnement kan jeg sagtens følge - men jeg vil meget gerne se
den omtalte artikel. Sprogangivelse har ingen praktisk betydning
for almindelige browsere, men det vil selvfølgelig have betydning
for talesynteseprogrammer.


> De nye arkler kan findes her:
>
> http://www.w3.org/International/tutorials/language-decl/en/slid
> es/Slide0150.html

Jeg er ikke helt sikker på om du mener at den nye artikel
dokumenterer det samme som den gamle der er blevet væk - det mener
jeg i hvert fald ikke er tilfældet. Der står to ting (plus en note)
på siden - dels at man skal erklære hovedsproget på siden i html-
elementet og dels at man skal bruge sprog-parametre (lang og evt.
dir) på elementer der omkranser tekst på et andet sprog.

Der står netop ikke at det er nødvendigt at erklære hovedsproget
igen efter et element med et andet sprog.


> Hvis man eksplicit beder om et specifikt sprog, nej. Men jeg
> tror faktisk ikke, at det så er almindeligt at bede om sprog

Det har du givetvis ret i (om end jeg selv bruger det en del). Men
det oprindelige spørgsmål gik på at få siden indekseret på det
korrekte sprog - hvad et sprogvalgsscript ikke kan hjælpe på.

Selv om en bruger ikke begrænser en søgning til et bestemt sprog,
kan googles kategorisering af sproget på siden stadig have
betydning. Google placerer nemlig danske sider højere end
tilsvarende engelske sider (jeg ved ikke om det er sproget,
landekoden/topdomænet eller begge dele der spiller ind her).


> Jeg gennemlæste de nye sider og selv om specifikationen ikke
> er ændret endnu, så er sprogkoder på tre bogstaver yt og
> erklæret decreprecated.

Det var også min fornemmelse, men jeg har ikke set det på skrift.
Har du et direkte link til den side?


NB: Kan du lokkes til at klippe lidt mere i dine citater?
--
Jens Gyldenkærne Clausen
Svar venligst under det du citerer, og citer kun det der er
nødvendigt for at forstå dit svar i sammenhængen. Se hvorfor og
hvordan på http://usenet.dk/netikette/citatteknik.html

Johnny Winther Ronne~ (25-08-2005)
Kommentar
Fra : Johnny Winther Ronne~


Dato : 25-08-05 17:36

In news:<Xns96BCEB76B9FD8jcdmfdk@gyrosmod.cybercity.dk>
Jens Gyldenkærne Clausen typed:
> Det ræsonnement kan jeg sagtens følge - men jeg vil meget gerne se
> den omtalte artikel. Sprogangivelse har ingen praktisk betydning
> for almindelige browsere, men det vil selvfølgelig have betydning
> for talesynteseprogrammer.
>

Det ville jeg også gerne, men dem der redigere den ny sektion om sprog
og koder, har fjernet den oprindelige vejledning og erstattet den af den
nye, de plejer at arkivere ældre artikler, men jeg kunne ikke finde den
oprindelige ;-(

> Jeg er ikke helt sikker på om du mener at den nye artikel
> dokumenterer det samme som den gamle der er blevet væk - det mener
> jeg i hvert fald ikke er tilfældet. Der står to ting (plus en note)
> på siden - dels at man skal erklære hovedsproget på siden i html-
> elementet og dels at man skal bruge sprog-parametre (lang og evt.
> dir) på elementer der omkranser tekst på et andet sprog.
>
> Der står netop ikke at det er nødvendigt at erklære hovedsproget
> igen efter et element med et andet sprog.
>

Nej det kunne jeg heller ikke finde, men hvis jeg husker rigtig var den
gamle artikel fra starten af året og dermed ikke specielt gammel. Så jeg
undre mig også lidt over, at det er bortfaldet i de nye, så megen
bevægelse har der ikke været i browserne i løbet af året.

> Det har du givetvis ret i (om end jeg selv bruger det en del). Men
> det oprindelige spørgsmål gik på at få siden indekseret på det
> korrekte sprog - hvad et sprogvalgsscript ikke kan hjælpe på.
>

Det er vi enige i.

> Selv om en bruger ikke begrænser en søgning til et bestemt sprog,
> kan googles kategorisering af sproget på siden stadig have
> betydning. Google placerer nemlig danske sider højere end
> tilsvarende engelske sider (jeg ved ikke om det er sproget,
> landekoden/topdomænet eller begge dele der spiller ind her).
>
Ud fra det beskrevne lyder det som at at de kigger på de første ord
sammenligner med en ordbog og sætter sproget. Hvor domæne endelsen nok
burde have højeste prioritet, mren det er et gæt og Google har nok
heller ikke tænkt sig at fortælle os det.

>> Jeg gennemlæste de nye sider og selv om specifikationen ikke
>> er ændret endnu, så er sprogkoder på tre bogstaver yt og
>> erklæret decreprecated.
>
> Det var også min fornemmelse, men jeg har ikke set det på skrift.
> Har du et direkte link til den side?
>

Som jeg læser det nederst på denne side:

http://www.w3.org/International/tutorials/language-decl/en/slides/Slide0210.html


> NB: Kan du lokkes til at klippe lidt mere i dine citater?

Vi får se

Med venlig hilsen
Johnny Winther Ronnenberg

--
Internettet er for alle!
http://80.62.61.212/webuseability/index.asp



Jan Tuxen (25-08-2005)
Kommentar
Fra : Jan Tuxen


Dato : 25-08-05 14:23

On Tue, 23 Aug 2005 18:23:39 +0200, "Johnny Winther Ronnenberg"
<johnny.winther@XYZ789tdcadsl.dk> wrote:

>
>I følge w3c skal sprog angives sådan her <html lang="da-DK"> eller sådan
>her <html lang="dan">
>

Hvoraf fremgår det, at man skal bruge en sprogkode som lang="da-DK"?
Jeg har noget svært ved at finde rundt i referencerne, men dem, som
jeg kan finde ud af, ender alle i ISO 639, som - efter hvad jeg kan se
- giver to alternativer:

639-1 alpha-2 codes, hvor dansk udtrykkes ved forkortelsen "da".
639-2 alpha-3 codes, hvor dansk udtrykkes ved forkortelsen "dan".

Betyder det ikke, at valgmulighederne er lang="da" og lang="dan"?


Johnny Winther Ronne~ (25-08-2005)
Kommentar
Fra : Johnny Winther Ronne~


Dato : 25-08-05 18:27

In news:<g4hrg19dfofd3mgqr8763jsu4h9tsjqorn@4ax.com>
Jan Tuxen typed:
>
> Hvoraf fremgår det, at man skal bruge en sprogkode som lang="da-DK"?
> Jeg har noget svært ved at finde rundt i referencerne, men dem, som
> jeg kan finde ud af, ender alle i ISO 639, som - efter hvad jeg kan se
> - giver to alternativer:

For dansk er det ikke nødvendigt med -DK for der findes kun en form for
dansk, selv om jyderne godt nok burde have deres egen sprogkode

> 639-1 alpha-2 codes, hvor dansk udtrykkes ved forkortelsen "da".
> 639-2 alpha-3 codes, hvor dansk udtrykkes ved forkortelsen "dan".
>
> Betyder det ikke, at valgmulighederne er lang="da" og lang="dan"?

Jo, men det ser ud til at "dan" også er på vej ud, den del er jeg nu
ikke sikker på, at jeg forstår helt, for tre karakterer giver et bredere
spektrum. Der hvor problemet opstår nu, er at w3c tager udgangspunkt i
RFC først og ISO efterfølgende og der er kommet en ny RFC der ændrer
lidt på tingende.

Af hensyn til bagudkompatibilitet med både browsere og søgemaskiner
mener jeg, at man skal fastholde den lange form da-DK.

Tilføjelsen har dog størst betydning ved sprog der findes i flere former
som f.eks. engelsk, fransk og kinesisk som har selvstændige hovedformer,
med selvstændig grammatik.

Jeg vil anbefale dig at læse artiklerne om brug af sprog og sprogkoder
som også indeholder links til den nyeste RFC og ISO.

http://www.w3.org/International/tutorials/language-decl/Overview.en.html

Med venlig hilsen
Johnny Winther Ronnenberg

--
Internettet er for alle!
http://80.62.61.212/webuseability/index.asp



Jan Tuxen (25-08-2005)
Kommentar
Fra : Jan Tuxen


Dato : 25-08-05 20:27

On Thu, 25 Aug 2005 19:27:07 +0200, "Johnny Winther Ronnenberg"
<johnny.winther@XYZ789tdcadsl.dk> wrote:

>Jeg vil anbefale dig at læse artiklerne om brug af sprog og sprogkoder
>som også indeholder links til den nyeste RFC og ISO.
>
>http://www.w3.org/International/tutorials/language-decl/Overview.en.html
>

Det har jeg så gjort. Det lykkedes mig næsten at falde i søvn, mens
den grafisk tunge PowerPoint præsentation blev downloadet, men jeg fik
dog ud af den, at det kun er, når der er tale om en regional variant
af en sprogkode, at man udover ISO 639 language code skal bruge en ISO
3166 country code.

Så mon ikke vi skal holde fast ved lang="da"?

--
Jan Tuxen
Fjern postnummeret i min e-mail adresse,
hvis du vil skrive privat til mig.

Frank (27-08-2005)
Kommentar
Fra : Frank


Dato : 27-08-05 00:21


Jan Tuxen wrote:

> Det har jeg så gjort. Det lykkedes mig næsten at falde i søvn, mens
> den grafisk tunge PowerPoint præsentation blev downloadet, men jeg fik
> dog ud af den, at det kun er, når der er tale om en regional variant
> af en sprogkode, at man udover ISO 639 language code skal bruge en ISO
> 3166 country code.
>
> Så mon ikke vi skal holde fast ved lang="da"?
>

Så burde lang="da-JY" (m.fl.) også indføres :)
/frank

Søg
Reklame
Statistik
Spørgsmål : 177501
Tips : 31968
Nyheder : 719565
Indlæg : 6408527
Brugere : 218887

Månedens bedste
Årets bedste
Sidste års bedste