Kandu.dk - Parser


/ Forside / Teknologi / Udvikling / PHP / Nyhedsindlæg

Glemt dit kodeord?

Brugernavn*

Kodeord *

Husk mig

Brugerservice

Kom godt i gang

Bliv medlem

Seneste indlæg

Find en bruger

Stil et spørgsmål

Skriv et tip

Fortæl en ven

Pointsystemet

Kontakt Kandu.dk

Emnevisning

Kategorier

Alfabetisk

Karriere

Interesser

Teknologi

Reklame

Top 10 brugere

PHP

#	Navn	Point
1	rfh	3959
2	natmaden	3372
3	poul_from	3310
4	funbreak	2700
5	stone47	2230
6	Jin2k	1960
7	Angband	1743
8	Bjerner	1249
9	refi	1185
10	Interkril..	1146

Parser
Fra : Søren Hansen

Dato : 28-08-02 17:14

Jeg skal lave en parser til GEDCOM-filer (GEnealogical Data COMmunication).

Standardens grammatiske opbygning er nøje beskrevet her:
http://www.gendex.com/gedcom55/55gcch1.htm

Og her er nogle eksempler på en sådan fils opbygning:
http://www.genealogy.org/~ttw/lines/userguide/gedcom.html

Jeg forestiller mig, at parseren skal hente ét tegn ad gangen fra en file
pointer vha. fgetc(). Eksempelvis starter hver linie med en eller flere
"digits". Disse tegn hente vha. følgende kode:

function fun_level($chars) {
global $fp;
$char = fgetc($fp);
if (ctype_digit($char)) fun_level($chars.$char);
else return $chars;
}

$fp = fopen ("test.ged", "r");
print fun_level("");

Denne kode er bare lidt rodet dels fordi de enkelte klassificerede tegn skal
returneres samlet og dels for det tegn som læses for meget i slutningen (det
tegn som ikke længere er et "digit") skal gemmes til næste funktion.

Er der en mere hensigtsmæssig måde at parse en sådan fil på?

Arnulf Sortland (29-08-2002)

Kommentar
Fra : Arnulf Sortland

Dato : 29-08-02 16:23

class GEDCOM
{
...
function GetLine()
{
$this->line="";
if(! feof( $this->fhandle) )
{
$this->line = trim( fgets( $this->fhandle, 1024) );
$this->line_no++;
}
return ( $this->line<>"" );
}

function GetLevel()
{
if( sscanf( $this->line, "%d", &$this->level) ==1)
{
return $this->level;
}else
{
if( $this->line<>"")
printf("Unknown level, line(%d):'%s'<br>\n", $this->line_no, $this->line);
return -1;
}
}
....
}
arnulf @ http://sa.no/slekt/

"Søren Hansen" <jes-s@mail1.stofanet.dk> wrote in message news:3d6cf6ae$0$699$ba624c82@nntp04.dk.telia.net...
> Jeg skal lave en parser til GEDCOM-filer (GEnealogical Data COMmunication).
>
> Standardens grammatiske opbygning er nøje beskrevet her:
> http://www.gendex.com/gedcom55/55gcch1.htm
>
> Og her er nogle eksempler på en sådan fils opbygning:
> http://www.genealogy.org/~ttw/lines/userguide/gedcom.html
>
> Jeg forestiller mig, at parseren skal hente ét tegn ad gangen fra en file
> pointer vha. fgetc(). Eksempelvis starter hver linie med en eller flere
> "digits". Disse tegn hente vha. følgende kode:
>
> function fun_level($chars) {
> global $fp;
> $char = fgetc($fp);
> if (ctype_digit($char)) fun_level($chars.$char);
> else return $chars;
> }
>
> $fp = fopen ("test.ged", "r");
> print fun_level("");
>
> Denne kode er bare lidt rodet dels fordi de enkelte klassificerede tegn skal
> returneres samlet og dels for det tegn som læses for meget i slutningen (det
> tegn som ikke længere er et "digit") skal gemmes til næste funktion.
>
> Er der en mere hensigtsmæssig måde at parse en sådan fil på?

Søg

Reklame

Statistik

Spørgsmål :	177520
Tips :	31968
Nyheder :	719565
Indlæg :	6408660
Brugere :	218887

Månedens bedste

Årets bedste

Sidste års bedste