/ Forside / Teknologi / Udvikling / HTML / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
HTML
#NavnPoint
molokyle 11184
Klaudi 5506
bentjuul 3377
severino 2040
smorch 1950
strarup 1525
natmaden 1396
scootergr.. 1320
e.c 1150
10  miritdk 1110
sprog på web pages
Fra : Mikkel Møldrup-Lakje~


Dato : 12-07-05 18:59

Google har en indstilling så man kan søge efter sider på et bestemt sprog.

Hvordan identificerer Google hvilket sprog en side er på?

Her er et metatag fra en af mine weblog-sider, som er oprettet med
blogger.com:
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">

Hvad betyder de to angivelser med lang="en"?

Skal jeg rette det til da hvis jeg skriver på dansk?

Mikkel
Weblog fra Guatemala - http://lakjer.dk/mikkel/blog/



 
 
Knud Gert Ellentoft (12-07-2005)
Kommentar
Fra : Knud Gert Ellentoft


Dato : 12-07-05 20:00

Mikkel Møldrup-Lakjer skrev:

>Hvordan identificerer Google hvilket sprog en side er på?

Ingen anelse, men de bruger næppe nedenstående.

><html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
>
>Hvad betyder de to angivelser med lang="en"?

Den første at xml definitionerne er skrevet på engelsk og den
anden hvilket sprog siden er på.

>Skal jeg rette det til da hvis jeg skriver på dansk?

Så den sidste skal rettes til da.
--
Knud
Topposter du svar, så ryger du på min ignoreringsliste.
Svar under det du citerer og citer kun det du svarer på - tak.
http://usenet.dk/netikette/citatteknik.html

Jens Gyldenkærne Cla~ (12-07-2005)
Kommentar
Fra : Jens Gyldenkærne Cla~


Dato : 12-07-05 21:53

Knud Gert Ellentoft skrev:

>>Hvad betyder de to angivelser med lang="en"?
>
> Den første at xml definitionerne er skrevet på engelsk og den
> anden hvilket sprog siden er på.

Nej - begge definitioner betyder det samme (at indholdet er på et
bestemt sprog). Parameteren lang hører til html-specifikationen,
mens xml:lang er den tilsvarende parameter i xml. I xhtml - der jo
både er en xml-variant og en html-variant - kan begge parametre
bruges. Følger man retningslinjerne for kompatibilitet mellem html
og xhtml bør man angive sprog med begge parametre (se
<http://www.w3.org/TR/xhtml1/#C_7>)

Her er specifikationerne for hhv. lang og xml:lang:

<http://www.w3.org/TR/html401/struct/dirlang.html#adef-lang>
<http://www.w3.org/TR/REC-xml/#sec-lang-tag>
--
Jens Gyldenkærne Clausen
Svar venligst under det du citerer, og citer kun det der er
nødvendigt for at forstå dit svar i sammenhængen. Se hvorfor og
hvordan på http://usenet.dk/netikette/citatteknik.html

Mikkel Møldrup-Lakje~ (12-07-2005)
Kommentar
Fra : Mikkel Møldrup-Lakje~


Dato : 12-07-05 22:02

"Jens Gyldenkærne Clausen" <jens@gyros.invalid> skrev i en meddelelse
news:Xns9691E8D0FDE89jcdmfdk@gyrosmod.cybercity.dk...
>
> Nej - begge definitioner betyder det samme (at indholdet er på et
> bestemt sprog).

Er der så i øvrigt en parameter der angiver hvilket sprog brødteksten er på?

Mikkel



Martin Hintzmann And~ (13-07-2005)
Kommentar
Fra : Martin Hintzmann And~


Dato : 13-07-05 09:14

Jens Gyldenkærne Clausen wrote:
>
> Nej - begge definitioner betyder det samme (at indholdet er på et
> bestemt sprog). Parameteren lang hører til html-specifikationen,
> mens xml:lang er den tilsvarende parameter i xml. I xhtml - der jo
> både er en xml-variant og en html-variant - kan begge parametre
> bruges. Følger man retningslinjerne for kompatibilitet mellem html
> og xhtml bør man angive sprog med begge parametre (se

Blot for at udpensle det helt og for at være pernittengryn

Det skader ikke at sætte både xml:lang og lang, men xml:lang er beregnet
til sider der fortolkes som XML, altså sendes med MIME-typen
"application/xhtml+xml".
Hvis man sender sin side med standard MIME-typen "text/html" er xml:lang
overflødig, men som sagt skader den ikke.

--
Martin Hintzmann Andersen
http://www.hintzmann.dk/

Mikkel Møldrup-Lakje~ (14-07-2005)
Kommentar
Fra : Mikkel Møldrup-Lakje~


Dato : 14-07-05 02:18

"Martin Hintzmann Andersen" <no@spam.invalid> skrev i en meddelelse
news:42d4cd48$0$18647$14726298@news.sunsite.dk...
>
> Blot for at udpensle det helt og for at være pernittengryn
>
> Det skader ikke at sætte både xml:lang og lang, men xml:lang er beregnet
> til sider der fortolkes som XML, altså sendes med MIME-typen
> "application/xhtml+xml".
> Hvis man sender sin side med standard MIME-typen "text/html" er xml:lang
> overflødig, men som sagt skader den ikke.

Og hvornår er det så det har betydning, hvilket sprog man har angivet at
siden er skrevet på?

På mit website har jeg aldrig angivet noget sprog i tags. Burde jeg gøre
det?

Mikkel




Martin Hintzmann And~ (14-07-2005)
Kommentar
Fra : Martin Hintzmann And~


Dato : 14-07-05 09:14

Mikkel Møldrup-Lakjer wrote:
>
> Og hvornår er det så det har betydning, hvilket sprog man har angivet at
> siden er skrevet på?
>

Jeg har på fornemmelsen at google bruger det.
http://www.google.dk/
Man kan jo søge sider både på dansk og sider fra Danmark.
Hvor dansk har med lang-attributten at gøre og fra Danmark må være ud
fra top-domænet (.dk)



> På mit website har jeg aldrig angivet noget sprog i tags. Burde jeg gøre
> det?
>

Alt andet lige kan det ikke skade, men kun gøre gavn for de søgemaskiner
der bruger det. Og evt. også for tale-browsere.


--
Martin Hintzmann Andersen
http://www.hintzmann.dk/

Jens Gyldenkærne Cla~ (14-07-2005)
Kommentar
Fra : Jens Gyldenkærne Cla~


Dato : 14-07-05 09:25

Mikkel Møldrup-Lakjer skrev:

> Og hvornår er det så det har betydning, hvilket sprog man har angivet at
> siden er skrevet på?

Det kunne fx have betydning i forhold til søgemaskiners indeksering af
siden. På Google, MSN, Teoma m.fl. kan man vælge at søge efter sider på
et bestemt sprog. Man kan hjælpe søgemaskinen med at bestemme hvilket
sprog der er på siden, ved at bruge en lang-parameter. Det er dog
tvivlsomt hvor meget det betyder i praksis - langt de fleste sider
angiver ikke noget sprog, men søgemaskinerne kan alligevel genkende det
ud fra indholdet.

I nogle tilfælde vil en sprogangivelse også kunne hjælpe det program der
behandler teksten. Det kunne fx være en browser med indbygget mulighed
for at slå et ord op i en ordbog - hvor den så kunne vælge en passende
ordbog ud fra det angivne sprog. Eller det kunne være et xml-baseret
tekstbehandlingsprogram hvor stave- og grammatikkontrollen fulgte det
sprog der var angivet i xml:lang.


> På mit website har jeg aldrig angivet noget sprog i tags. Burde jeg gøre
> det?

Det skader ikke, men omvendt er der nok heller ikke nogen direkte
gevinst i det. Jeg kunne dog godt forestille mig at anvende
lang-parameteren hvis jeg havde forskellige sprog på samme side (fx for
at markere et tysk eller et engelsk citat).

--
Jens Gyldenkærne Clausen
Svar venligst under det du citerer, og citer kun det der er
nødvendigt for at forstå dit svar i sammenhængen. Se hvorfor og
hvordan på http://usenet.dk/netikette/citatteknik.html

Mikkel Møldrup-Lakje~ (15-07-2005)
Kommentar
Fra : Mikkel Møldrup-Lakje~


Dato : 15-07-05 16:43

"Jens Gyldenkærne Clausen" <jens@gyros.invalid> skrev i en meddelelse
news:1h9gptju4y5xc.dlg@jcdmfdk.invalid...
> Mikkel Møldrup-Lakjer skrev:
>
>> Og hvornår er det så det har betydning, hvilket sprog man har angivet at
>> siden er skrevet på?
>
> Det kunne fx have betydning i forhold til søgemaskiners indeksering af
> siden. På Google, MSN, Teoma m.fl. kan man vælge at søge efter sider på
> et bestemt sprog. Man kan hjælpe søgemaskinen med at bestemme hvilket
> sprog der er på siden, ved at bruge en lang-parameter. Det er dog
> tvivlsomt hvor meget det betyder i praksis - langt de fleste sider
> angiver ikke noget sprog, men søgemaskinerne kan alligevel genkende det
> ud fra indholdet.

Præcis. Jeg var inde på det samme i den originale post, men Knud Ellentoft
svarede også, at det næppe var den parameter Google brugte. Sider på dansk
hvor skabelonen indeholder lang=en kan Google sagtens finde ud af at
kategorisere på dansk.

Mikkel



Mikkel Møldrup-Lakje~ (15-07-2005)
Kommentar
Fra : Mikkel Møldrup-Lakje~


Dato : 15-07-05 17:06

"Mikkel Møldrup-Lakjer" <mikkel@fabel.dk> skrev i en meddelelse
news:42d7da2b$0$18646$14726298@news.sunsite.dk...
> Sider på dansk hvor skabelonen indeholder lang=en kan Google sagtens finde
> ud af at kategorisere på dansk.

Nå, nu fandt jeg lige et eksempel, hvor Google alligevel ikke kunne finde ud
af det, men tror at en dansk side er på engelsk.

Nu har jeg rettet sproget fra "en" til "da", så skal jeg nok melde tilbage
om Google finder ud af at siden er på dansk.

Mikkel



Mikkel Møldrup-Lakje~ (21-07-2005)
Kommentar
Fra : Mikkel Møldrup-Lakje~


Dato : 21-07-05 16:37

"Mikkel Møldrup-Lakjer" <mikkel@fabel.dk> skrev i en meddelelse
news:42d7df03$0$18647$14726298@news.sunsite.dk...
> "Mikkel Møldrup-Lakjer" <mikkel@fabel.dk> skrev i en meddelelse
> news:42d7da2b$0$18646$14726298@news.sunsite.dk...
>> Sider på dansk hvor skabelonen indeholder lang=en kan Google sagtens
>> finde ud af at kategorisere på dansk.
>
> Nå, nu fandt jeg lige et eksempel, hvor Google alligevel ikke kunne finde
> ud af det, men tror at en dansk side er på engelsk.
>
> Nu har jeg rettet sproget fra "en" til "da", så skal jeg nok melde tilbage
> om Google finder ud af at siden er på dansk.

Jeg lovede at melde tilbage vedr. Googles opfattelse af sprog på
hjemmesider.

Jeg fandt et bedre eksempel end det ovennævnte:
En side på dansk, hvor jeg havde indsat et link øverst i html-koden (med
anchor text på engelsk) til den engelske oversættelse af siden. Det fik
pludselig Google til at opfatte hele siden som engelsk, og det betød, at
siden ikke kom med på søgeresultatsiderne, når man søger med
standardindstillingen i Danmark: søg sider på dansk.

Nu indsatte jeg så <html lang="da"> øverst i koden og efter at have crawlet
siden på ny er Google igen begyndt at opfatte siden som dansk.

Så det ser ud til at Google faktisk bruger lang attributten til noget.

Mikkel



Jens Gyldenkærne Cla~ (12-07-2005)
Kommentar
Fra : Jens Gyldenkærne Cla~


Dato : 12-07-05 22:25

Mikkel Møldrup-Lakjer skrev:

>> Nej - begge definitioner betyder det samme (at indholdet er
>> på et bestemt sprog).
>
> Er der så i øvrigt en parameter der angiver hvilket sprog
> brødteksten er på?

Øh - det er jo netop lang/xml:lang.

Hvis jeg skriver <html lang="da"> i et html-dokument, angiver jeg
at indholdet i html-elementet (det vil sige hele siden) er skrevet
på dansk - medmindre det overstyres af en lang-parameter længere
inde.

Eksempel:
<DOCTYPE...>
<html lang="da">
<head>
   <title>Min danske side</title>
</head>
<body>
   <h1>En dansk overskrift</h1>
   <p lang="en">But now to something completely different</p>
   <p>Nu er sproget igen dansk</p>
</body>
</html>

lang/xml:lang dækker både sproget i attributter i elementet samt
indholdet i elementet.

Hvis jeg fx angiver følgende xml-kode:

<chapter xml:lang="da" heading="Zebraers parringsritualer">
<text>Når zebraer skal parre sig sker det som regel to og
to...</text>
</chapter>

- vil det indledende xml:lang gælde for såvel attributværdien
(overskriften på afsnittet) og indholdet i chapter-elementet (der
her er identisk med indholdet i text-elementet).
--
Jens Gyldenkærne Clausen
Svar venligst under det du citerer, og citer kun det der er
nødvendigt for at forstå dit svar i sammenhængen. Se hvorfor og
hvordan på http://usenet.dk/netikette/citatteknik.html

Mikkel Møldrup-Lakje~ (13-07-2005)
Kommentar
Fra : Mikkel Møldrup-Lakje~


Dato : 13-07-05 23:07

"Jens Gyldenkærne Clausen" <jens@gyros.invalid> skrev i en meddelelse
news:Xns9691EE2488599jcdmfdk@gyrosmod.cybercity.dk...
> Mikkel Møldrup-Lakjer skrev:
>
>>> Nej - begge definitioner betyder det samme (at indholdet er
>>> på et bestemt sprog).
>>
>> Er der så i øvrigt en parameter der angiver hvilket sprog
>> brødteksten er på?
>
> Øh - det er jo netop lang/xml:lang.

D'oh... jeg sad vist og sov... Tak

Mikkel



philaweb (13-07-2005)
Kommentar
Fra : philaweb


Dato : 13-07-05 23:20

Jens Gyldenkærne Clausen skrev:

>>>Nej - begge definitioner betyder det samme (at indholdet er
>>>på et bestemt sprog).
>>
>>Er der så i øvrigt en parameter der angiver hvilket sprog
>>brødteksten er på?
>
>
> Øh - det er jo netop lang/xml:lang.
>
> Hvis jeg skriver <html lang="da"> i et html-dokument, angiver jeg
> at indholdet i html-elementet (det vil sige hele siden) er skrevet
> på dansk - medmindre det overstyres af en lang-parameter længere
> inde.

Prøv med den her:
<meta name="language" content="da" />

Bagefter kan du crawleteste siden her:
http://www.seekport.co.uk/seekbot/

--
Med venlige hilsener,

philaweb
*************

Johnny Winther Ronne~ (15-07-2005)
Kommentar
Fra : Johnny Winther Ronne~


Dato : 15-07-05 17:59

In news:<42d404e6$0$18647$14726298@news.sunsite.dk>
Mikkel Møldrup-Lakjer typed:
> Google har en indstilling så man kan søge efter sider på et bestemt
> sprog.
>
> Hvordan identificerer Google hvilket sprog en side er på?
>
> Her er et metatag fra en af mine weblog-sider, som er oprettet med
> blogger.com:
> <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
>
> Hvad betyder de to angivelser med lang="en"?
>
> Skal jeg rette det til da hvis jeg skriver på dansk?
>
> Mikkel
> Weblog fra Guatemala - http://lakjer.dk/mikkel/blog/

En enkelt kommentar vedrørende sprog der er også en anden måde at angive
en sides sprog nemlig denne.

<head lang="dan-DK"><!-- dan|da-DK eng|en-GB ger|deu|de-DE -->

Jeg har læst et sted hos W3C at det er denne måde som browserne bruger
til at definere sproget på en side, om det er sandt har jeg ingen anelse
om, men hvis de gør det, vil jeg gætte på at søgemaskinerne også vil
forstå det.

Til gengæld skulle det gøre en forskel på sider der er gemt i utf
format, disse mangler ofte æøå selv om sidedeklarationen er korrekt.

Men eller har Gyldenkærne ret, selve deklarationen burde være nok.

Kommentaren efter <head> viser blot de mulige lovlige kombinationer til
at angive dansk, engelsk og tysk sprog.

Ved at bruge lang attributten skulle det være muligt, at skifte til et
andet sprog, også inde på en side, inklusiv til kinesisk, det ved jeg så
ikke lige hvor meget gavn man har af

Med venlig hilsen
Johnny Winther Ronnenberg

--
Internettet er for alle!
http://80.62.61.212/webuseability/index.asp



Søg
Reklame
Statistik
Spørgsmål : 177501
Tips : 31968
Nyheder : 719565
Indlæg : 6408527
Brugere : 218887

Månedens bedste
Årets bedste
Sidste års bedste