/ Forside / Interesser / Familie & Relationer / Slægtsforskning / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Slægtsforskning
#NavnPoint
senta 50517
svendgive.. 41640
vith 39181
modersvil.. 17589
Påsse 14847
LisBJensen 13749
jyttemor 12290
jkrjk2 11934
Bille1948 10898
10  Varla 8031
Spørgsmål angående GEDCOMP
Fra : Michael Schneiders


Dato : 27-01-03 21:15

Hej NG.

Jeg har kikket på min Gedcom fil og har lagt mærke til at Æ Ø Å er blevet
erstattet med tegn.
Kan det give problemer med GEDCOMP sameligning.

Med Venlig Hilsen

Michael Schneiders









 
 
Lars Kr. Lundin (27-01-2003)
Kommentar
Fra : Lars Kr. Lundin


Dato : 27-01-03 23:02

Mon, 27 Jan 2003 21:15:22 +0100 skrev Michael Schneiders:

> Jeg har kikket på min Gedcom fil og har lagt mærke til at Æ Ø Å er
> blevet erstattet med tegn.
> Kan det give problemer med GEDCOMP sameligning.

Det du observerer behøves ikke at være en fejl i din GEDCOM-eksport.

Hvis du vil vide det nærmere, så vis fra starten af GEDCOM-filen
den linje, der starter med
1 CHAR
samt nogle ord, der skrives med danske specialtegn.

Hvis det skulle være en fejl, så er GEDCOMP er god til at
håndtere forkert GEDCOM-eksporterede special-tegn.

Send evt. filen, så skal du nok få besked om eventuelle
problemer.

Mvh,
-Lars Lundin.
--
GEDCOMP: En omfattende og gratis database for slægtsforskere med
interesse i Danmark: http://www.lklundin.dk/gedcomp/

Michael Schneiders (28-01-2003)
Kommentar
Fra : Michael Schneiders


Dato : 28-01-03 17:19

Hej

Starten af min Gedcom fil ser sådan ud.

0 HEAD
1 SOUR BROSKEEP

2 VERS 6.1.11 WINDOWS

1 DEST BROSKEEP (BROTHERS KEEPER)

1 DATE 27 JAN 2003

1 CHAR ANSEL

1 FILE E:\PROGRAMMER\BROTHER'S KEEPER 6\MICHAEL\MICHAEL.GED

1 GEDC

2 VERS 5.5

2 FORM LINEAGE-LINKED

1 SUBM @SUB1@



Hilsen

Michael Schneiders



"Lars Kr. Lundin" <news-gi-17@lklundin.dk> skrev i en meddelelse
news:v%hZ9.46513$Hl6.5943727@news010.worldonline.dk...
> Mon, 27 Jan 2003 21:15:22 +0100 skrev Michael Schneiders:
>
> > Jeg har kikket på min Gedcom fil og har lagt mærke til at Æ Ø Å er
> > blevet erstattet med tegn.
> > Kan det give problemer med GEDCOMP sameligning.
>
> Det du observerer behøves ikke at være en fejl i din GEDCOM-eksport.
>
> Hvis du vil vide det nærmere, så vis fra starten af GEDCOM-filen
> den linje, der starter med
> 1 CHAR
> samt nogle ord, der skrives med danske specialtegn.
>
> Hvis det skulle være en fejl, så er GEDCOMP er god til at
> håndtere forkert GEDCOM-eksporterede special-tegn.
>
> Send evt. filen, så skal du nok få besked om eventuelle
> problemer.
>
> Mvh,
> -Lars Lundin.
> --
> GEDCOMP: En omfattende og gratis database for slægtsforskere med
> interesse i Danmark: http://www.lklundin.dk/gedcomp/



Tom Stryhn Sr. (28-01-2003)
Kommentar
Fra : Tom Stryhn Sr.


Dato : 28-01-03 17:59

Prøv at skifte ANSEL ud med ANSI
så det kommer til at se således ud

0 HEAD
1 SOUR BROSKEEP
2 VERS 6.1.11 WINDOWS
1 DEST BROSKEEP (BROTHERS KEEPER)
1 DATE 28 JAN 2003
1 CHAR ANSI
1 FILE G:\xxx.GED
1 GEDC
2 VERS 5.5
2 FORM LINEAGE-LINKED
1 SUBM @SUB1@

i BK står der også ANSI ( standard til GEDCOM )

--
Regards / Med venlig hilsen

Tom Stryhn
stryhn@email.dk
http://freepages.genealogy.rootsweb.com/~stryhn/
last update 28. Jan. 2003

Outgoing mail is certified Virus Free.
Checked by Norton anti-virus system


"Michael Schneiders" <msc@adslhome.dk> wrote in message
news:3e36ad59$0$13247$edfadb0f@dread11.news.tele.dk...
> Hej
>
> Starten af min Gedcom fil ser sådan ud.
>
> 0 HEAD
> 1 SOUR BROSKEEP
>
> 2 VERS 6.1.11 WINDOWS
>
> 1 DEST BROSKEEP (BROTHERS KEEPER)
>
> 1 DATE 27 JAN 2003
>
> 1 CHAR ANSEL
>
> 1 FILE E:\PROGRAMMER\BROTHER'S KEEPER 6\MICHAEL\MICHAEL.GED
>
> 1 GEDC
>
> 2 VERS 5.5
>
> 2 FORM LINEAGE-LINKED
>
> 1 SUBM @SUB1@
>
>
>
> Hilsen
>
> Michael Schneiders
>
>
>
> "Lars Kr. Lundin" <news-gi-17@lklundin.dk> skrev i en meddelelse
> news:v%hZ9.46513$Hl6.5943727@news010.worldonline.dk...
> > Mon, 27 Jan 2003 21:15:22 +0100 skrev Michael Schneiders:
> >
> > > Jeg har kikket på min Gedcom fil og har lagt mærke til at Æ Ø Å er
> > > blevet erstattet med tegn.
> > > Kan det give problemer med GEDCOMP sameligning.
> >
> > Det du observerer behøves ikke at være en fejl i din GEDCOM-eksport.
> >
> > Hvis du vil vide det nærmere, så vis fra starten af GEDCOM-filen
> > den linje, der starter med
> > 1 CHAR
> > samt nogle ord, der skrives med danske specialtegn.
> >
> > Hvis det skulle være en fejl, så er GEDCOMP er god til at
> > håndtere forkert GEDCOM-eksporterede special-tegn.
> >
> > Send evt. filen, så skal du nok få besked om eventuelle
> > problemer.
> >
> > Mvh,
> > -Lars Lundin.
> > --
> > GEDCOMP: En omfattende og gratis database for slægtsforskere med
> > interesse i Danmark: http://www.lklundin.dk/gedcomp/
>
>


Lars Kr. Lundin (29-01-2003)
Kommentar
Fra : Lars Kr. Lundin


Dato : 29-01-03 02:03

Tue, 28 Jan 2003 17:59:15 +0100 skrev Tom Stryhn Sr.:

> Prøv at skifte ANSEL ud med ANSI
> så det kommer til at se således ud

> 1 CHAR ANSI

> i BK står der også ANSI ( standard til GEDCOM )

NEJ! Dette er endnu et punkt hvor BK ikke har
respekt for GEDCOM-standarden.


http://www.gendex.com/gedcom55/55gcch2.htm#CHARACTER_SET
kan ikke-analfabeter stave sig frem til at de eneste
gyldige tegnsæt i GEDCOM er:

ANSEL, UNICODE og ASCII

hvor ANSEL er default, og hvor ASCII kun kan anvendes
hvis GEDCOM-filen ikke indeholder specialtegn, så som
æ, ø og å. ASCII indkodning er identisk med ANSEL,
hvorfor ASCII er en overflødighed.

BK har eksisteret i størrelsesordenen 10 år, og alligevel
har forfatteren ikke formået at få en så simpel ting på
plads. Ynkeligt.

Når det er sagt, vil jeg tilføje at (mis)brugen af ANSI
er ganske udbredt, og at GEDCOMP kan tolke dette tegnsæt
korrekt.

> "Michael Schneiders" <msc@adslhome.dk> wrote in message
> news:3e36ad59$0$13247$edfadb0f@dread11.news.tele.dk...
>> Hej
>>
>> Starten af min Gedcom fil ser sådan ud.

>>
>> 1 CHAR ANSEL

Så har du været heldig/dygtig nok til at vælge en korrekt
indkodning. Heldige såvel som dygtige mennesker skal prise
sig lykkelige.

Specialtegnene er i ANSEL ikke så nemme at læse (for et menneske),
men det skal man ikke lade sig forvirre af.

I et andet indlæg
Tue, 28 Jan 2003 18:49:50 +0100 skrev Tom Brøndsted:

> Et sidespørgsmål: CHAR attributtet i mine gedcom-filer genereret af det
> ældgamle Leister Reunion kaldes
> 1 CHAR IBM WINDOWS
> Dette mærkværdige udtryk dækker over ISO 8859

Det er endnu en programmørmæssig svinestreg.

Mens GEDCOMP også godt kan afkode denne fejl-indkodning,
så skal man ikke regne med at det går godt i almindelige
slægtsprogrammer.

> Er dette den almindelige gedcom-betegnelse for ISO 8859 eller findes der
> andre? Og hvad er nu de almindeligste karaktersæt i gedcomfiler indsendt
> til gedcomp?

Min respekt for programmører af slægtsprogrammer kan efterhånden
ligge på et meget lille sted. Hvor svært kan det være ?

I programmets GEDCOM-eksport skal man højst kunne vælge mellem
ANSEL, UNICODE og evt. ASCII.

Men de båt-horn, der udvikler BK, Reunion, FTW, Winfam, FamilyOrigins
og hvad det nu ellers hedder skal åbenbart forvirre de sagesløse
slægtsforskere (inklusive Tom & Michael) med deres helt unødvendige
non-standard indkodning.

Så fik jeg det på plads.

Og så vil jeg tilføje at i et rigtigt slægtsprogram, nemlig GRAMPS,
er indkodningen ifbm. GEDCOM-eksport som udgangspunkt ANSEL, som via
1 enkelt knap kan ændres til UNICODE. Så simpelt kan og bør det være.

Og så siger jeg det lige een gang til:
Ved GEDCOM-eksport bør man anvende enten ANSEL, UNICODE (eller ASCII),
- angivet i den foretrukne orden.

-Lars Lundin.
--
GEDCOMP: En omfattende og gratis database for slægtsforskere med
interesse i Danmark: http://www.lklundin.dk/gedcomp/

PC Jensen (29-01-2003)
Kommentar
Fra : PC Jensen


Dato : 29-01-03 10:47

Lars Kr. Lundin wrote:

> Tue, 28 Jan 2003 17:59:15 +0100 skrev Tom Stryhn Sr.:


[snip]


> Men de båt-horn, der udvikler BK, Reunion, FTW, Winfam, FamilyOrigins
> og hvad det nu ellers hedder skal åbenbart forvirre de sagesløse
> slægtsforskere (inklusive Tom & Michael) med deres helt unødvendige
> non-standard indkodning.
>
> Så fik jeg det på plads.


:) Ellere rettere: Så fik du luft! :) Jeg vidste slet dit temperament
havde den dynamik, Lars.

Selvfølgelig har du ret! Det er ganske enkelt tåbeligt og en hån mod
køberne at man ikke ordner en så simpel ting.

Men hvad skal/kan de pågældende købere gøre? Det vender jeg tilbage til
om et øjeblik.

Jeg har først for ganske nylig benyttet GEDCOMP og overtog en linie fra
en anden slægtsforskers GEDCOM-fil, som hed
1 CHAR IBM PC

Det er der heller ikke noget, der hedder! Og det fik jeg at vide i den
første fejlliste fra GEDCOMP.

Jeg er så i den forholdsvis lykkelige situation at jeg i mange år har
arbejdet professionelt med databasesystemer, så jeg bruger et
hjemmelavet program. Det er opbygget over GEDCOM med de begrænsninger
der nu ligger i det. Men det gør at jeg selv kan bestemme hvordan min
GEDCOM-eksport foregår.

Det tog under et kvarter at lave det sådan at "mine" specialtegn kom ud
i ANSEL. Jeg har ingen umlaut eller andre spidsfindigheder, kun æ, ø og
å. Men det svære var at finde ANSEL-standarden. Den koster åbenbart
penge - det er den besked man får, selv på GEDCOM-hjemmesiderne - den
skal købes fra American National Standards Institute.

GENDEX, som vil være kendt af nogle for GED2HTML, har dog været så
flinke at lægge en gratis beskrivelse ud:
http://www.gendex.com/gedcom55/55gcappd.htm

For ikke-programmører er det sin sag at dechiffrere denne side. Så her
følger "det lette fix" for Windowsbrugere (dog kun æ,ø,å samt umlaut):
----------------------------------------------
1) Læs GEDCOM-filen ind i Notes eller Wordpad

2) Lav linien der begynder med 1 CHAR ... om så der står:
1 CHAR ANSEL

3) Lav en erstat-operation for hhv. æ, ø, å, Æ, Ø og Å:
æ erstattes med karakter nr. 181
ø erstattes med karakter nr. 178
å erstattes med karakter nr. 234 efterfulgt af "a" (altså to tegn)
Æ erstattes med karakter nr. 165
Ø erstattes med karakter nr. 162
Å erstattes med karakter nr. 234 efterfulgt af "A" (altså to tegn)

Når jeg giver karakternes numre i stedet for bare at skrive dem er det
fordi de ser forskellige ud i forskellige tegnsæt. De kan skrives fra
tastaturet ved at holde Alt-knappen og taste fire cifre, først et nul og
derefter de tre ovennævnte cifre - eksempelvis tastes karakter 181 som
Alt+0181 (og husk så lige at bruge "regnemaskinetasterne" til højre og
ikke tallene ovenover bogstaverne).

Som standard bruger Wordpad Courier New (ændres under
Formatter/Skrifttype), og der ser tegnene således ud:

æ erstattes med µ
ø erstattes med ²
å erstattes med êa
Æ erstattes med ¥
Ø erstattes med ¢
Å erstattes med êA

Bemærk: Du ser dog de rigtige tegn her hvis din newsreader bruger
Courier New.

For at være på den sikre side: Brug ovst. tastemetode eller brug
Tegnoversigt til at finde frem til de rigtige erstatningstegn.

4) Umlaut-tegn ændres på samme måde - hvis det f.eks. er u umlaut (ü)
ændres det til karakter 232 + bogstavet uden umlaut. Dvs.:
ü erstattes med karakter 232 + u - i Courier New: èu
ö erstattes med karakter 232 + o - i Courier New: èo
osv.

5) Bed en bøn for dine programleverandørers sjæle - disse
samvittighedsløse mennesker, som først tager dine penge og derefter
lader dig lave en ren slaveoperation som ovenstående. Det ville tage dem
max. en time at programmere det ind én gang for alle!
----------------------------------------------

Jeg er en af dem der håber at den nye GEDCOM XML standard vil slå
igennem. Der er der frit slag for forskellige tegnsæt, idet
international sprogsupport allerede er indbygget i XML standarden. Men
"slå igennem" er et vidt begreb. De slægtsprogrammer, Lars nævner, vil
næppe tilbyde deres brugere denne mulighed før om en halv snes år.

PC





Michael Schneiders (29-01-2003)
Kommentar
Fra : Michael Schneiders


Dato : 29-01-03 16:51

Hej

Tak for svarene så vil jeg forsætte med at bruge Ansel format.
Men jeg kan nu godt se et formål med ANSI formatet feks. hvis man bruger et
gedcom til html program så vil der stå æøå og ikke et heller andet tegn.

Hilsen
Michael Schneiders

"PC Jensen" <pc@dewa.dk> skrev i en meddelelse
news:3E37A32F.8000205@dewa.dk...
> Lars Kr. Lundin wrote:
>
> > Tue, 28 Jan 2003 17:59:15 +0100 skrev Tom Stryhn Sr.:
>
>
> [snip]
>
>
> > Men de båt-horn, der udvikler BK, Reunion, FTW, Winfam, FamilyOrigins
> > og hvad det nu ellers hedder skal åbenbart forvirre de sagesløse
> > slægtsforskere (inklusive Tom & Michael) med deres helt unødvendige
> > non-standard indkodning.
> >
> > Så fik jeg det på plads.
>
>
> :) Ellere rettere: Så fik du luft! :) Jeg vidste slet dit temperament
> havde den dynamik, Lars.
>
> Selvfølgelig har du ret! Det er ganske enkelt tåbeligt og en hån mod
> køberne at man ikke ordner en så simpel ting.
>
> Men hvad skal/kan de pågældende købere gøre? Det vender jeg tilbage til
> om et øjeblik.
>
> Jeg har først for ganske nylig benyttet GEDCOMP og overtog en linie fra
> en anden slægtsforskers GEDCOM-fil, som hed
> 1 CHAR IBM PC
>
> Det er der heller ikke noget, der hedder! Og det fik jeg at vide i den
> første fejlliste fra GEDCOMP.
>
> Jeg er så i den forholdsvis lykkelige situation at jeg i mange år har
> arbejdet professionelt med databasesystemer, så jeg bruger et
> hjemmelavet program. Det er opbygget over GEDCOM med de begrænsninger
> der nu ligger i det. Men det gør at jeg selv kan bestemme hvordan min
> GEDCOM-eksport foregår.
>
> Det tog under et kvarter at lave det sådan at "mine" specialtegn kom ud
> i ANSEL. Jeg har ingen umlaut eller andre spidsfindigheder, kun æ, ø og
> å. Men det svære var at finde ANSEL-standarden. Den koster åbenbart
> penge - det er den besked man får, selv på GEDCOM-hjemmesiderne - den
> skal købes fra American National Standards Institute.
>
> GENDEX, som vil være kendt af nogle for GED2HTML, har dog været så
> flinke at lægge en gratis beskrivelse ud:
> http://www.gendex.com/gedcom55/55gcappd.htm
>
> For ikke-programmører er det sin sag at dechiffrere denne side. Så her
> følger "det lette fix" for Windowsbrugere (dog kun æ,ø,å samt umlaut):
> ----------------------------------------------
> 1) Læs GEDCOM-filen ind i Notes eller Wordpad
>
> 2) Lav linien der begynder med 1 CHAR ... om så der står:
> 1 CHAR ANSEL
>
> 3) Lav en erstat-operation for hhv. æ, ø, å, Æ, Ø og Å:
> æ erstattes med karakter nr. 181
> ø erstattes med karakter nr. 178
> å erstattes med karakter nr. 234 efterfulgt af "a" (altså to tegn)
> Æ erstattes med karakter nr. 165
> Ø erstattes med karakter nr. 162
> Å erstattes med karakter nr. 234 efterfulgt af "A" (altså to tegn)
>
> Når jeg giver karakternes numre i stedet for bare at skrive dem er det
> fordi de ser forskellige ud i forskellige tegnsæt. De kan skrives fra
> tastaturet ved at holde Alt-knappen og taste fire cifre, først et nul og
> derefter de tre ovennævnte cifre - eksempelvis tastes karakter 181 som
> Alt+0181 (og husk så lige at bruge "regnemaskinetasterne" til højre og
> ikke tallene ovenover bogstaverne).
>
> Som standard bruger Wordpad Courier New (ændres under
> Formatter/Skrifttype), og der ser tegnene således ud:
>
> æ erstattes med µ
> ø erstattes med ²
> å erstattes med êa
> Æ erstattes med ¥
> Ø erstattes med ¢
> Å erstattes med êA
>
> Bemærk: Du ser dog de rigtige tegn her hvis din newsreader bruger
> Courier New.
>
> For at være på den sikre side: Brug ovst. tastemetode eller brug
> Tegnoversigt til at finde frem til de rigtige erstatningstegn.
>
> 4) Umlaut-tegn ændres på samme måde - hvis det f.eks. er u umlaut (ü)
> ændres det til karakter 232 + bogstavet uden umlaut. Dvs.:
> ü erstattes med karakter 232 + u - i Courier New: èu
> ö erstattes med karakter 232 + o - i Courier New: èo
> osv.
>
> 5) Bed en bøn for dine programleverandørers sjæle - disse
> samvittighedsløse mennesker, som først tager dine penge og derefter
> lader dig lave en ren slaveoperation som ovenstående. Det ville tage dem
> max. en time at programmere det ind én gang for alle!
> ----------------------------------------------
>
> Jeg er en af dem der håber at den nye GEDCOM XML standard vil slå
> igennem. Der er der frit slag for forskellige tegnsæt, idet
> international sprogsupport allerede er indbygget i XML standarden. Men
> "slå igennem" er et vidt begreb. De slægtsprogrammer, Lars nævner, vil
> næppe tilbyde deres brugere denne mulighed før om en halv snes år.
>
> PC
>
>
>
>



PC Jensen (29-01-2003)
Kommentar
Fra : PC Jensen


Dato : 29-01-03 19:44

Michael Schneiders wrote:

> Tak for svarene så vil jeg forsætte med at bruge Ansel format.
> Men jeg kan nu godt se et formål med ANSI formatet feks. hvis man bruger et
> gedcom til html program så vil der stå æøå og ikke et heller andet tegn.

Klart nok, Michael - selv om der også er forskel på gedcom->html
programmer hvad tegnsæt angår.

Men nu gjaldt altså spørgsmålet om hvad GEDCOM-standarden er, og der har
Lars svaret - uanset hvad forskellige programmer digter sig frem til, er
der kun: Unicode, ANSEL og ASCII - og sidstnævnte er en 7-bit standard,
dvs. den indeholder kun 128 tegn og er derfor udelukket hvis man har
andet end det engelske alfabet indblandet.

Unicode bruger to bytes/tegn pr. bogstav og fylder derfor dobbelt så
meget - til gengæld er det en forholdsvis moderne standard. Men det er
alt for besværligt at omkode sin GEDCOM-fil til Unicode manuelt. ANSEL
er et levn fra en fjern computerfortid, men skal man omkode sin
ikke-standard GEDCOM fil i hånden til rigtig GEDCOM, er det trods alt
det nemmeste valg.

PC


Lars Kr. Lundin (29-01-2003)
Kommentar
Fra : Lars Kr. Lundin


Dato : 29-01-03 20:53

Wed, 29 Jan 2003 19:44:28 +0100 skrev PC Jensen:

> Michael Schneiders wrote:
>
>> Tak for svarene så vil jeg forsætte med at bruge Ansel format. Men jeg
>> kan nu godt se et formål med ANSI formatet feks. hvis man bruger et
>> gedcom til html program så vil der stå æøå og ikke et heller andet
>> tegn.
>
> Klart nok

Nej, det er ikke klart, men forkert.

En GEDCOM-til-HTML konverter skal kunne konvertere hele
GEDCOM-standarden, inklusive ANSEL/UNICODE-tegnsæt.

Konverteren læser altså ANSEL-tegn og skriver HTML-tegn.

Dette må være mit sidste opgivende indlæg om tegnsæt.

-Lars Lundin.
--
GEDCOMP: En omfattende og gratis database for slægtsforskere med
interesse i Danmark: http://www.lklundin.dk/gedcomp/

AAFE (31-01-2003)
Kommentar
Fra : AAFE


Dato : 31-01-03 03:57

"Lars Kr. Lundin" <news-gi-17@lklundin.dk> skrev:

> Konverteren læser altså ANSEL-tegn og skriver HTML-tegn.

Hvis konverteren skal skrive HTML-tegn, og det
mener jeg den skal, så burde den efter min mening
skrive HTML-entities for de internationale karakterers
vedkommende. Og det gør Gene Starks GED2HTML
f.eks. ikke. Denne konverter skriver blot ANSI koderne,
for de internationale karakterers vedkommende.

med venlig hilsen
Arne




Arne Feldborg (31-01-2003)
Kommentar
Fra : Arne Feldborg


Dato : 31-01-03 08:20

"AAFE" <intet@svar.dk> skrev Fri, 31 Jan 2003 03:57:13 +0100

>> Konverteren læser altså ANSEL-tegn og skriver HTML-tegn.
>
>Hvis konverteren skal skrive HTML-tegn, og det
>mener jeg den skal, så burde den efter min mening
>skrive HTML-entities for de internationale karakterers
>vedkommende.
>
Nej. Det er der absolut ingen grund til, det er faktisk endda en dårlig
ide. ISO-Latin er standard på Internet og alle internet programmer kan
læse det.

HTML-entities er til for folk der sidder på systemer der ikke kan
*skive* ISO-Latin.



--
mvh, A:\Feldborg

http://www.haunstrup.dk/feldborg/genealogi/opslag/
http://www.haunstrup.dk/feldborg/genealogi/download/

AAFE (31-01-2003)
Kommentar
Fra : AAFE


Dato : 31-01-03 11:42

"Arne Feldborg" <feldborg@haunstrup.dk> skrev:

> Nej. Det er der absolut ingen grund til, det er faktisk endda en dårlig
> ide. ISO-Latin er standard på Internet og alle internet programmer kan
> læse det.

Det er muligt du har ret, jeg ved det ikke. Men,
jeg ser jo, at det selv her i gruppen forekommer
(omend sjældent), at µ bruges istedet for æ, og
at ¢ bruges istedet for ø (for blot at nævne et par
stykker), og der kan jeg så godt være i tvivl om,
hvordan folk med en sådan opsætning ser vi
andres ISO-Latin på deres skærme.

Og for at komme ud over denne MIN tvivl, bruger
jeg HTML-entities, på HTML-sider, idet det efter
min opfattelse sikrer en entydig repræsentation.

Men, i det omfang det forholder sig, som du skriver,
at alle, verden over, ser ISO-Latin karakterer korrekt
repræsenteret, er dette selvfølgelig mindre bøvlet
end disse HTM-entities.

med venlig hilsen
Arne







>
> HTML-entities er til for folk der sidder på systemer der ikke kan
> *skive* ISO-Latin.
>
>
>
> --
> mvh, A:\Feldborg
>
> http://www.haunstrup.dk/feldborg/genealogi/opslag/
> http://www.haunstrup.dk/feldborg/genealogi/download/



Arne Feldborg (31-01-2003)
Kommentar
Fra : Arne Feldborg


Dato : 31-01-03 19:01

"AAFE" <intet@svar.dk> skrev Fri, 31 Jan 2003 11:42:22 +0100

>Det er muligt du har ret, jeg ved det ikke. Men,
>jeg ser jo, at det selv her i gruppen forekommer
>(omend sjældent), at µ bruges istedet for æ, og
>at ¢ bruges istedet for ø (for blot at nævne et par
>
Hvilket netop skyldes at den pågældende skriver fra et OS/2 system, hvor
der er en kendt fejl den codepage der angiveligt skulle være ISO-Latin.


--
mvh, A:\Feldborg

http://www.haunstrup.dk/feldborg/genealogi/opslag/
http://www.haunstrup.dk/feldborg/genealogi/download/

Alf Christophersen (31-01-2003)
Kommentar
Fra : Alf Christophersen


Dato : 31-01-03 21:24

On Fri, 31 Jan 2003 08:20:01 +0100, Arne Feldborg
<feldborg@haunstrup.dk> wrote:

>Nej. Det er der absolut ingen grund til, det er faktisk endda en dårlig
>ide. ISO-Latin er standard på Internet og alle internet programmer kan
>læse det.

Forutsetter at man bruker enten Windows eller Linux, og bor i et land
hvor 8859-1 er default. Har man 8859-2 som default vil det vises helt
andre tegn der hvor disse er forskjellige.

På Mac'er blir det helt andre tegn. Komplett forskjellige tegn.

Eneste sikre er å bruke entiteter (Så fremt ikke ønsker å
utestenge alle med Mac eller stormaskiner med EBCDIC-tegnsett (Det
er vel dem som har denslags agenda i bakhodet)

Arne Feldborg (01-02-2003)
Kommentar
Fra : Arne Feldborg


Dato : 01-02-03 08:17

Alf Christophersen <alf.christophersen@basalmed.uio.no> skrev Fri, 31
Jan 2003 21:23:36 +0100

>>Nej. Det er der absolut ingen grund til, det er faktisk endda en dårlig
>>ide. ISO-Latin er standard på Internet og alle internet programmer kan
>>læse det.
>
>Forutsetter at man bruker enten Windows eller Linux, og bor i et land
>hvor 8859-1 er default. Har man 8859-2 som default vil det vises helt
>andre tegn der hvor disse er forskjellige.
>
Nixen. Det er browseren - ikke operativsystemet - der skal (og kan) læse
ISO-Latin

>På Mac'er blir det helt andre tegn. Komplett forskjellige tegn.
>
Ikke hvis browseren følger standarden.

>Eneste sikre er å bruke entiteter (Så fremt ikke ønsker å
>utestenge alle med Mac eller stormaskiner med EBCDIC-tegnsett (Det
>er vel dem som har denslags agenda i bakhodet)
>
Eneste sikre er, at hvis man *skriver* fra et system der buger et andet
tegnsæt, så skal man bruge entities.

Hvis man skriver fra et system med ISO-Latin, så er der ingen grund til
det. Udover at gøre koden mere vanskelig at læse og at få den til at
fylde lidt mere.


--
mvh, A:\Feldborg

http://www.haunstrup.dk/feldborg/genealogi/opslag/
http://www.haunstrup.dk/feldborg/genealogi/download/

AAFE (31-01-2003)
Kommentar
Fra : AAFE


Dato : 31-01-03 03:45

"Michael Schneiders" <msc@adslhome.dk> skrev:

> Men jeg kan nu godt se et formål med ANSI formatet feks. hvis man bruger
et
> gedcom til html program så vil der stå æøå og ikke et heller andet tegn.

Hvis du bruger Gene Starks GED2HTML, kommer
der til at stå æøå, hvad enten din GEDCOM fil så er
i ANSI eller i ANSEL.

med venlig hilsen
Arne



AAFE (31-01-2003)
Kommentar
Fra : AAFE


Dato : 31-01-03 03:43

"PC Jensen" <pc@dewa.dk> skrev:

> Men det svære var at finde ANSEL-standarden. Den koster åbenbart
> penge - det er den besked man får, selv på GEDCOM-hjemmesiderne - den
> skal købes fra American National Standards Institute.

Hvis du søger på Z39-47.pdf burde du kunne finde
den frit tilgængelig på internettet. Du kan ihvertfald
finde den her:

http://www.niso.org/standards/resources/Z39-47.pdf

Du kan også finde indgangsvinklen til den her:

http://www.niso.org/standards/standard_detail.cfm?std_id=472

Hvor du enten kan købe den som hardcopy, eller nøjes
med at tage .pdf versionen gratis

Det skal måske lige bemærkes, at dette er 1993
udgaven, hvor GEDCOM jo refererer til 1985
udgaven.

med venlig hilsen
Arne



Otto Jorgensen (29-01-2003)
Kommentar
Fra : Otto Jorgensen


Dato : 29-01-03 17:46

Wed, 29 Jan 2003 02:02:34 +0100, in dk.videnskab.historie.genealogi,
"Lars Kr. Lundin" <news-gi-17@lklundin.dk> wrote:

>I programmets GEDCOM-eksport skal man højst kunne vælge mellem
>ANSEL, UNICODE og evt. ASCII.

Pragrammet har både ANSI, ANSEL og ASCII.
Dette er ikke bare for å dekke nåveærende situasjon men også med tanke
på andre program som har samme eller kun har et av disse formatene

Når det gjelder UNICODE så er det en anbefaling og det står ikke
spesifikk at det er et "must", Se dokumentasjonen for GEDCOM 5.5
Men det kan legges til at ønsket om å få på plass UNICODE er fremmet for
produsenten og kommer etterhver

--
Otto Jørgensen
http://home.online.no/~otjoerge/
http://home.online.no/~otjoerge/bk/
All email is controlled by NORTON

Lars Kr. Lundin (29-01-2003)
Kommentar
Fra : Lars Kr. Lundin


Dato : 29-01-03 18:25

Wed, 29 Jan 2003 17:45:43 +0100 skrev Otto Jorgensen:

> Wed, 29 Jan 2003 02:02:34 +0100, in dk.videnskab.historie.genealogi,
> "Lars Kr. Lundin" <news-gi-17@lklundin.dk> wrote:
>
>>I programmets GEDCOM-eksport skal man højst kunne vælge mellem ANSEL,
>>UNICODE og evt. ASCII.
>

> Når det gjelder UNICODE så er det en anbefaling og det står ikke
> spesifikk at det er et "must",

Bemærk nu at jeg skrev 'højst', altså at jeg netop ikke skrev at
UNICODE er et "must".

-Lars Lundin.
--
GEDCOMP: En omfattende og gratis database for slægtsforskere med
interesse i Danmark: http://www.lklundin.dk/gedcomp/

Alf Christophersen (29-01-2003)
Kommentar
Fra : Alf Christophersen


Dato : 29-01-03 20:28

On Wed, 29 Jan 2003 02:02:34 +0100, "Lars Kr. Lundin"
<news-gi-17@lklundin.dk> wrote:

> ANSEL, UNICODE og ASCII
>
>hvor ANSEL er default, og hvor ASCII kun kan anvendes
>hvis GEDCOM-filen ikke indeholder specialtegn, så som
>æ, ø og å. ASCII indkodning er identisk med ANSEL,
>hvorfor ASCII er en overflødighed.

ASCII er kun et7-bits tegnsett og støtter ikke annet enn bokstavene
A-Z samt en del tegn ellers med lavere ASCII-verdi. 8-bits tegnsett er
mange typer standarder, derav er ANSI ett, ISO 8859-1 et annet, ANSEL
er hveken det ene eller det annet og kun en mormoner-standard.

ANSI er Microsoft sin versjon


Lars Kr. Lundin (29-01-2003)
Kommentar
Fra : Lars Kr. Lundin


Dato : 29-01-03 20:50

Wed, 29 Jan 2003 20:28:18 +0100 skrev Alf Christophersen:

> On Wed, 29 Jan 2003 02:02:34 +0100, "Lars Kr. Lundin"
> <news-gi-17@lklundin.dk> wrote:
>
>> ANSEL, UNICODE og ASCII
>>
>>hvor ANSEL er default, og hvor ASCII kun kan anvendes hvis GEDCOM-filen
>>ikke indeholder specialtegn, så som æ, ø og å. ASCII indkodning er
>>identisk med ANSEL, hvorfor ASCII er en overflødighed.
>
> ASCII er kun et7-bits tegnsett og støtter ikke annet enn bokstavene A-Z
> samt en del tegn ellers med lavere ASCII-verdi. 8-bits tegnsett er mange
> typer standarder, derav er ANSI ett, ISO 8859-1 et annet, ANSEL er
> hveken det ene eller det annet og kun en mormoner-standard.
>
> ANSI er Microsoft sin versjon

Hold nu op med det sludder om tegnsæt.

Når der står ASCII i GEDCOM-standarden, så specificeres det i
kapitel 3 om anvendelse af tegnsæt i GEDCOM, at der med ASCII
ifbm. med GEDCOM menes 8-bits USA versionen.

-Lars Lundin.
--
GEDCOMP: En omfattende og gratis database for slægtsforskere med
interesse i Danmark: http://www.lklundin.dk/gedcomp/

Alf Christophersen (30-01-2003)
Kommentar
Fra : Alf Christophersen


Dato : 30-01-03 14:16

On Wed, 29 Jan 2003 20:49:57 +0100, "Lars Kr. Lundin"
<news-gi-17@lklundin.dk> wrote:

>ifbm. med GEDCOM menes 8-bits USA versionen.

Det er det som kalles ANSI ellers i verden. ASCII er kun 7-bits
tegnsett. Pr. definisjon. Samme hva mormonere tror. Det er mye rart de
tror om edb til sine tider. 8-bits tegnsett USA versjon er identisk
lik ANSI.

Erik Helmer Nielsen (30-01-2003)
Kommentar
Fra : Erik Helmer Nielsen


Dato : 30-01-03 22:13

Alf Christophersen <alf.christophersen@basalmed.uio.no> skrev:
Thu, 30 Jan 2003 14:16:05 +0100 i dk.videnskab.historie.genealogi

>> ifbm. med GEDCOM menes 8-bits USA versionen. [af ASCII]
>
>Det er det som kalles ANSI ellers i verden.
>8-bits tegnsett USA versjon er identisk lik ANSI.

Det lyder meget interessant.

Siger du hermed, at når Mormonerne skriver ASCII, så mener de i
virkeligheden ANSI. D.v.s. at det meget omdiskuterede ANSI tegnsæt
derved er godkendt for anvendelse i en Gedcom fil?

Hvordan forklarer du så, at Mormonerne tydeligt anfører som betingelse
for brug af ASCII, at det forudsætter 'When a language does not need
diacritic characters..' ?
Det 8 Bit ANSI tegnsæt overfører jo fint så alle de vigtigste af disse
tegn i modsætning til det 7 Bit ASCII.

Erik Helmer Nielsen




Chris Gade Oxholm Sø~ (30-01-2003)
Kommentar
Fra : Chris Gade Oxholm Sø~


Dato : 30-01-03 23:12

ASCII tegnsættet findes i en lang række under versioner (437, 850, 864, 865)
bare for at nævne nogle få.
ASCII tegnsættet var betinget af hvilken code page der blev indlæst og høre
vel i grunden til fortidens DOS opsætning i opstarts filerne CONFIG.SYS og
AUTOEXEC:BAT

Blev/bliver dog også anvendt for Windows 95 og delvis i Windows 98 - men kun
for DOS programmer.
For moderne Windows versioner som ME, 2000 og XP er det reelt helt ude.

--
Chris Gade Oxholm Sørensen
support@brotherskeeper.dk

BK - software - opdatering - manual - www.brotherskeeper.dk


"Alf Christophersen" <alf.christophersen@basalmed.uio.no> skrev i en
meddelelse news:pgrg3vkamg7bqt4g3b24c54gjcab4pv3e1@4ax.com...
> On Wed, 29 Jan 2003 20:49:57 +0100, "Lars Kr. Lundin"
> <news-gi-17@lklundin.dk> wrote:
>
> >ifbm. med GEDCOM menes 8-bits USA versionen.
>
> Det er det som kalles ANSI ellers i verden. ASCII er kun 7-bits
> tegnsett. Pr. definisjon. Samme hva mormonere tror. Det er mye rart de
> tror om edb til sine tider. 8-bits tegnsett USA versjon er identisk
> lik ANSI.



Arne Feldborg (31-01-2003)
Kommentar
Fra : Arne Feldborg


Dato : 31-01-03 08:20

"Chris Gade Oxholm Sørensen" <support@brotherskeeper.dk> skrev Thu, 30
Jan 2003 23:11:47 +0100

>ASCII tegnsættet var betinget af hvilken code page der blev indlæst og høre
>vel i grunden til fortidens DOS opsætning
>
Ikke at det har så forfærdelig meget med sagen her at gøre, men det
stammer faktisk fra trådtelegrafien i 20'erne - hvor det såmænd afløste
morsetabellen.

Det skyldes alene IBMs stædighed at det overhovedet har vundet indpas i
computerverdenen. Og som tegnsæt for udveksling af data (feks. gedcom
filer) over landegrænser er det aldeles ubrugeligt.


--
mvh, A:\Feldborg

http://www.haunstrup.dk/feldborg/genealogi/opslag/
http://www.haunstrup.dk/feldborg/genealogi/download/

Erik Helmer Nielsen (31-01-2003)
Kommentar
Fra : Erik Helmer Nielsen


Dato : 31-01-03 13:34

"Chris Gade Oxholm Sørensen" <support@brotherskeeper.dk> skrev:
Thu, 30 Jan 2003 23:11:47 +0100 i dk.videnskab.historie.genealogi
>ASCII tegnsættet findes i en lang række under versioner (437, 850, 864, 865)
>bare for at nævne nogle få.

Det er en lidt misvisende beskrivelse af forholdene omkring disse
vøsentlig forskellige tegnsæt.
ASCII er et 7 Bit tegnsæt.
IBM PC Codepage 437,850.. er et 8 Bit tegnsæt.
Lad os nu ikke blive mere forvirrede end nødvendigt.

Læs
http://www.microsoft.com/typography/unicode/cs.htm
der er der fra formodentlig autoritativ side lidt orientering om
forskellen mellem ASCII, OEM tegnsæt som IBM PC 437/850/864, Windows
ANSI 1252, DBCS og Unicode.

Erik Helmer Nielsen


Otto Jorgensen (29-01-2003)
Kommentar
Fra : Otto Jorgensen


Dato : 29-01-03 21:07

Wed, 29 Jan 2003 02:02:34 +0100, in dk.videnskab.historie.genealogi,
"Lars Kr. Lundin" <news-gi-17@lklundin.dk> wrote:

>BK har eksisteret i størrelsesordenen 10 år, og alligevel
>har forfatteren ikke formået at få en så simpel ting på
>plads. Ynkeligt.

Første versjonene av BK var i DOS versjon og da eksisterte ikke GEDCOM
5.5 :=))

Hva du synes er ynkeligt sier mer om deg enn om programmet. Produsenten
tar også hensyn til de ulike brukergruppene og ASCII er ikke det samme
overalt. dette vil avhenge meget etter hvilken CODE-page brukerne har
brukt til sine DOS-versjoner av BK.

At UNICODE ikke er på plass, er beklagelig, men det er ikke et krav om
at det skal være på plass, sett med den tekst som kom til GEDCOM5.5

--
Otto Jørgensen
http://home.online.no/~otjoerge/
http://home.online.no/~otjoerge/bk/
All email is controlled by NORTON

Erik Helmer Nielsen (29-01-2003)
Kommentar
Fra : Erik Helmer Nielsen


Dato : 29-01-03 23:27

Otto Jorgensen <otjoerge@online.no> skrev:
Wed, 29 Jan 2003 21:07:23 +0100 i dk.videnskab.historie.genealogi

>"Lars Kr. Lundin" <news-gi-17@lklundin.dk> wrote:
>>BK har eksisteret i størrelsesordenen 10 år, og alligevel
>>har forfatteren ikke formået at få en så simpel ting på
>>plads. Ynkeligt.

Otto Jørgensen svarer:
>Første versjonene av BK var i DOS versjon og da eksisterte ikke GEDCOM
>5.5 :=))

Begge dele er selvfølgelig i sig selv korrekt, men det er bare totalt
irrelevant. Det er ikke noget reelt svar og det bevirker kun at at
læsernes opmærksomhed bliver afledet fra det væsentlige.

I mit eksemplar af Gedcom vers. 5.1 af 18 sept 1992 (mere end 10 år
gammel) står der:
"Only one character set is currently defined. It accommodates the set
of Latin-based languages, as explained below.
8-Bit ANSEL--The GEDCOM Default Character Set.
The 8-Bit ANSEL (American National Standard for Extended Latin
Alphabet Coded Character Set for Bibliographic Use, Z39.47, 1985
copyright) is the default character set for GEDCOM.
"

>..............ASCII er ikke det samme
>overalt. dette vil avhenge meget etter hvilken CODE-page brukerne har
>brukt til sine DOS-versjoner av BK.
Dette er en misvisende eller misforstået sammenblanding af ASCII og
IBM's Codepage systemer og det fjerner også debatten fra det
væsentlige.

Erik Helmer Nielsen


Otto Jorgensen (30-01-2003)
Kommentar
Fra : Otto Jorgensen


Dato : 30-01-03 00:08

Wed, 29 Jan 2003 23:26:55 +0100, in dk.videnskab.historie.genealogi,
Erik Helmer Nielsen <ehelmer@boerne.dk> wrote:

>Otto Jorgensen <otjoerge@online.no> skrev:
> Wed, 29 Jan 2003 21:07:23 +0100 i dk.videnskab.historie.genealogi
>
>>"Lars Kr. Lundin" <news-gi-17@lklundin.dk> wrote:
>>>BK har eksisteret i størrelsesordenen 10 år, og alligevel
>>>har forfatteren ikke formået at få en så simpel ting på
>>>plads. Ynkeligt.
>
>Otto Jørgensen svarer:
>>Første versjonene av BK var i DOS versjon og da eksisterte ikke GEDCOM
>>5.5 :=))
>
>Begge dele er selvfølgelig i sig selv korrekt, men det er bare totalt
>irrelevant. Det er ikke noget reelt svar og det bevirker kun at at
>læsernes opmærksomhed bliver afledet fra det væsentlige.

Og hva er det vesentlig; at brukerne kan bruke GEDCOM til å kommunisere
med hverandre og at brukere som har ANSI, ASCII; ANSEL eller UNICODE
skal kunne kommunisere.

Det er ikke noe i dokumentasjonen som sier at man kan har mer enn
standard. Det er også et ønske at UNICODE skal innføres, men det er det
ikke.

Dette tilsvarer alle de programversjoner som i tillegg til GEDCOM 5.5
også kan levere andre formater av GEDCOM!"
Er det feil at man har noe mer på enkelte områder?

>I mit eksemplar af Gedcom vers. 5.1 af 18 sept 1992 (mere end 10 år
>gammel) står der:

GEDCOM5.1 er Draft og ikke noe gyldig dokument. I serien 5.* finnes kun
en gyldig versjon og det er 5.5

--
Otto Jørgensen
http://home.online.no/~otjoerge/
http://home.online.no/~otjoerge/bk/
All email is controlled by NORTON

AAFE (31-01-2003)
Kommentar
Fra : AAFE


Dato : 31-01-03 03:28

"Lars Kr. Lundin" <news-gi-17@lklundin.dk> skrev:

> NEJ! Dette er endnu et punkt hvor BK ikke har
> respekt for GEDCOM-standarden.

Er det ikke at rette smed for bager?

I BKW (engelsk) står der:

Character in gedcom file
o DOS
o Windows
o Ansel (Normal for gedcom)


I BKW (dansk) derimod, står der:

Tegnsæt i GEDCOM fil
o ASCII (Tegntabel 437)
o ANSI (Standard til GEDCOM)
o ANSEL

I begge tilfælde er ANSEL valgt som default.

Det forekommer mig således, at det ikke er BK, som
sådan, der ikke har respekt for GEDCOM-standarden.
Men at det snarere er den danske oversættelse, der
ikke har respekt for GEDCOM-standarden, og altså
heller ikke har respekt for det engelsksprogede
udgangspunkt

> På
> http://www.gendex.com/gedcom55/55gcch2.htm#CHARACTER_SET
> kan ikke-analfabeter stave sig frem til at de eneste
> gyldige tegnsæt i GEDCOM er:
>
> ANSEL, UNICODE og ASCII

Man kan også være pragmatisk at se således på
det, at BK har tilpasset sig virkelighedens verden,
og altså generer ANSEL som default, og derudover
tilbydes der to andre muligheder, der ganske vist
ikke er standard GEDCOM, men som måske kan
være brugbare i visse sammenhænge.

[nej, jeg kan ikke uddybe, hvilke "visse" sammenhænge
det kan være, for jeg aner det ikke ]

> BK har eksisteret i størrelsesordenen 10 år, og alligevel
> har forfatteren ikke formået at få en så simpel ting på
> plads. Ynkeligt.

Med fare for at gentage mig selv, retter du så ikke
bager for smed? Når nu Ansel er valgt som default
og der i BKW (engelsk) står:

Character in gedcom file
o DOS
o Windows
o Ansel (Normal for gedcom)

med venlig hilsen

Arne



Arne Feldborg (31-01-2003)
Kommentar
Fra : Arne Feldborg


Dato : 31-01-03 08:20

"AAFE" <intet@svar.dk> skrev Fri, 31 Jan 2003 03:28:20 +0100

>Det forekommer mig således, at det ikke er BK, som
>sådan, der ikke har respekt for GEDCOM-standarden.
>Men at det snarere er den danske oversættelse, der
>ikke har respekt for GEDCOM-standarden, og altså
>heller ikke har respekt for det engelsksprogede
>udgangspunkt
>
Og når der så henvises til CodePage 437 (hvilket jo i sig selv er
korrekt), så burde der stå med meget store bogstaver at det kun er til
brug i engelsksprogede lande. Og kun hvis man ikke påtænker at sende
data ud af disse områder.

Og hvor mange danskere er mon i den situation.?


--
mvh, A:\Feldborg

http://www.haunstrup.dk/feldborg/genealogi/opslag/
http://www.haunstrup.dk/feldborg/genealogi/download/

Alf Christophersen (31-01-2003)
Kommentar
Fra : Alf Christophersen


Dato : 31-01-03 18:05

On Fri, 31 Jan 2003 08:20:02 +0100, Arne Feldborg
<feldborg@haunstrup.dk> wrote:

>Og når der så henvises til CodePage 437 (hvilket jo i sig selv er
>korrekt), så burde der stå med meget store bogstaver at det kun er til
>brug i engelsksprogede lande. Og kun hvis man ikke påtænker at sende
>data ud af disse områder.

Den eneste forskjell mellom 437 og 865 er yen og centimes i stedet for
stor og liten ø
Mellom 850 og 437 eller 865 er det derimot store forskjeller.


Arne Feldborg (01-02-2003)
Kommentar
Fra : Arne Feldborg


Dato : 01-02-03 08:17

Alf Christophersen <alf.christophersen@basalmed.uio.no> skrev Fri, 31
Jan 2003 18:05:26 +0100

>>Og når der så henvises til CodePage 437 (hvilket jo i sig selv er
>>korrekt), så burde der stå med meget store bogstaver at det kun er til
>>brug i engelsksprogede lande. Og kun hvis man ikke påtænker at sende
>>data ud af disse områder.
>
>Den eneste forskjell mellom 437 og 865 er yen og centimes i stedet for
>stor og liten ø
>
Både ja og nej. I 437 eksisterer ø og Ø overhovedet ikke og derfor er
den ubrugelig i Skandinavien. Og derfor er det næsten også altid de to
bogstaver der er mest bøvl med - også kendt som IBM's 'lille ø' problem.

>Mellom 850 og 437 eller 865 er det derimot store forskjeller.
>
Men til gengæld ligger alle de skandinaviske tegn og alle omlydene på de
samme pladser i 850 og 865, og det må være det interessante i den her
forbindelse.

Det er vel næppe heller uden grund at de er navngivet henholdsvis USA
(437), Multilingual (850) og Nordisk (865).


--
mvh, A:\Feldborg

http://www.haunstrup.dk/feldborg/genealogi/opslag/
http://www.haunstrup.dk/feldborg/genealogi/download/

Tom Brøndsted (28-01-2003)
Kommentar
Fra : Tom Brøndsted


Dato : 28-01-03 18:50



"Lars Kr. Lundin" wrote:Hvis du vil vide det nærmere, så vis fra starten
af GEDCOM-filen

> den linje, der starter med
> 1 CHAR
> samt nogle ord, der skrives med danske specialtegn.
>

Et sidespørgsmål: CHAR attributtet i mine gedcom-filer genereret af det
ældgamle Leister Reunion kaldes
1 CHAR IBM WINDOWS
Dette mærkværdige udtryk dækker over ISO 8859

Er dette den almindelige gedcom-betegnelse for ISO 8859 eller findes der
andre? Og hvad er nu de almindeligste karaktersæt i gedcomfiler indsendt
til gedcomp?

mvh tom brøndsted



Alf Christophersen (29-01-2003)
Kommentar
Fra : Alf Christophersen


Dato : 29-01-03 13:15

On Tue, 28 Jan 2003 18:49:50 +0100, Tom Brøndsted <tom@brondsted.dk>
wrote:

>ældgamle Leister Reunion kaldes
>1 CHAR IBM WINDOWS
>Dette mærkværdige udtryk dækker over ISO 8859
>
>Er dette den almindelige gedcom-betegnelse for ISO 8859 eller findes der
>andre? Og hvad er nu de almindeligste karaktersæt i gedcomfiler indsendt
>til gedcomp?

Det er nok mer korrekt kalt ANSI. Det er for alle praktiske formål
identisk med ISO 8859, men skal være utvidet i forhold til det i og
med det også innbefatter noen utvidete tegn (to-tegns tegnsett)

Lars Kr. Lundin (29-01-2003)
Kommentar
Fra : Lars Kr. Lundin


Dato : 29-01-03 14:29

Wed, 29 Jan 2003 13:14:39 +0100 skrev Alf Christophersen:

> On Tue, 28 Jan 2003 18:49:50 +0100, Tom Brøndsted <tom@brondsted.dk>
> wrote:
>> Og hvad er nu de almindeligste karaktersæt i gedcomfiler indsendt
>>til gedcomp?
>

Jeg fik aldrig svaret på det spørgsmål. Svaret er ANSEL.

> Det er nok mer korrekt kalt ANSI. Det er for alle praktiske formål
> identisk med ISO 8859, men skal være utvidet i forhold til det i og med
> det også innbefatter noen utvidete tegn (to-tegns tegnsett)

ANSI og ISO 8859 er ukendte begreber i GEDCOM-standarden.

-Lars Lundin.
--
GEDCOMP: En omfattende og gratis database for slægtsforskere med
interesse i Danmark: http://www.lklundin.dk/gedcomp/

Alf Christophersen (30-01-2003)
Kommentar
Fra : Alf Christophersen


Dato : 30-01-03 00:58

On Wed, 29 Jan 2003 14:29:27 +0100, "Lars Kr. Lundin"
<news-gi-17@lklundin.dk> wrote:

>ANSI og ISO 8859 er ukendte begreber i GEDCOM-standarden.

Mer korrekt er at de gikk ut i 5.5-standarden. ANSI er nevnt
tidligere, sammen med IBM DOS tegnsett som gikk ut fordi det var
codepage avhengig. Ant. fordi de som laget standarden ikke visste
forskjell mellom DOS og ANSI, gikk også ANSI ut med samme begrunnelse
av at det var nasjonsspesifikt, noe det strengt tatt ikke er,men med
unntak av to uinteressante tegn, yen og centimes.

Erik Helmer Nielsen (30-01-2003)
Kommentar
Fra : Erik Helmer Nielsen


Dato : 30-01-03 14:39

Alf Christophersen <alf.christophersen@basalmed.uio.no> skrev:
Thu, 30 Jan 2003 00:57:30 +0100 i dk.videnskab.historie.genealogi

>>ANSI og ISO 8859 er ukendte begreber i GEDCOM-standarden.
>
>Mer korrekt er at de gikk ut i 5.5-standarden.

Det stemmer ikke helt med hvad jeg kan læse.

I mit eksemplar af Gedcom vers. 5.1 af 18 sept 1992 (mere end 10 år
gammel) står der:
"Only one character set is currently defined. It accommodates the set
of Latin-based languages, as explained below.
8-Bit ANSEL--The GEDCOM Default Character Set."

Nu kan du selvfølgelig hævde at alle versioner af Gedcom 5 før 5.5
rent formelt blev udsendt som Draft, men det ændrer dog ikke ved den
kendsgerning at forfatterne allerede for mere end 10 år siden
anbefalede ANSEL og kun ANSEL som tegnsæt for Gedcom.

Erik Helmer Nielsen


Alf Christophersen (30-01-2003)
Kommentar
Fra : Alf Christophersen


Dato : 30-01-03 21:00

On Thu, 30 Jan 2003 14:38:55 +0100, Erik Helmer Nielsen
<ehelmer@boerne.dk> wrote:

>Nu kan du selvfølgelig hævde at alle versioner af Gedcom 5 før 5.5
>rent formelt blev udsendt som Draft, men det ændrer dog ikke ved den
>kendsgerning at forfatterne allerede for mere end 10 år siden
>anbefalede ANSEL og kun ANSEL som tegnsæt for Gedcom.

standarden inntil løsslipping av 5.5 var 4.0.

Søg
Reklame
Statistik
Spørgsmål : 177501
Tips : 31968
Nyheder : 719565
Indlæg : 6408528
Brugere : 218887

Månedens bedste
Årets bedste
Sidste års bedste