/ Forside / Interesser / Familie & Relationer / Slægtsforskning / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Slægtsforskning
#NavnPoint
senta 50517
svendgive.. 41640
vith 39181
modersvil.. 17589
Påsse 14847
LisBJensen 13749
jyttemor 12290
jkrjk2 11934
Bille1948 10898
10  Varla 8031
Scanning af tekst
Fra : J.k.


Dato : 18-10-03 23:11

Jeg har en 3-4 år gammel scanner ( HP Scanjet 3300c ), og vil nu gerne
indscanne nogle gamle maskinskrevne sider jeg har i fotokopi omkring mine
aner (der er mange sider).
Men når jeg scanner det bliver det til noget ulæseligt vrøvl. Er det min
scanner der er for dårlig/gammel (normal scanner den godt nok).? Er det min
software der ikke dur.? I såfald hvad skal jeg have fat i.Gode råd
efterlyses
Med venlig hilsen
Jørn




 
 
Arne Feldborg (19-10-2003)
Kommentar
Fra : Arne Feldborg


Dato : 19-10-03 00:58

"J.k." <ikast@email.dk> skrev Sun, 19 Oct 2003 00:11:04 +0200

>Men når jeg scanner det bliver det til noget ulæseligt vrøvl. Er det min
>scanner der er for dårlig/gammel (normal scanner den godt nok).? Er det min
>software der ikke dur.? I såfald hvad skal jeg have fat i.Gode råd
>efterlyses
>
Du bliver nok nødt til at beskrive problemet lidt mere.

Vil du scanne siderne til billeder for at have kopier af dem, eller
scanner du til OCR-læsning (tekstgenkendelse) for efterfølgende
tekstbehandling.?

I begge tilfælde vil jeg iøvrigt mene at du skal scanne i 300ppi og i
256 gråtoner. Og hvis eller teknikken er i orden så skulle din scanners
alder absolut ikke være noget problem til den her opgave.

Noget andet er så, at netop maskinskrevene sider ofte afviger ganske
meget fra de tegnsæt diverse OCR programmer er født til at kunne
genkende.

Især hvis det er skrevet på et gammelt hakkebrædt kan en betydelig
oplæring være nødvendig, hvilket alle ordentlige OCR programmer iøvrigt
også har mulighed for. Men det kan godt kræve en betydelig manuel
indsats - især ved de første sider.


--
mvh, A:\Feldborg

Folketælllinger Hammerum og Bølling herreder, kirkebøger Hammerum herred
http://www.haunstrup.dk/feldborg/genealogi/download/

Niels Gjermandsen (19-10-2003)
Kommentar
Fra : Niels Gjermandsen


Dato : 19-10-03 09:25

Hej
Dette problem havde jeg også før i tiden før jeg fik kørt mig selv ind på
teknikken.
Jeg har faktisk en billig skanner der er flere år gammel og den er faktisk
god nok til et formål der er lig dit.
Jeg tror du har skannet på samme måde som jeg gjorde fra starten med for
mange farver, så kan du risikere at få en flammet baggrund fra papiret, som
kan gøre din skanning ulæselig, papiret er faktisk ikke hvidt men det
indeholder et utal af forskellige farver der danner en hvid flade som øjet
opfater som hvid. Så hvis dine dokumenter du vil skanne er rimelige uden en
masse snavs så burde du ikke have store problemer.
Når jeg skanner tekster så skanner jeg altid med 300 dpi, og jeg sætter
skanningen til kun at skanne i 2 farver, sort og hvid.
Jeg har skannet maskinskrevne sider der er skrevet på gennemslagspapir der
endvidere er gult i bunden så det med at skanne i 2 farver gør at skanneren
kun ser to nyancer. det er en mørk tekst på en lys bund.
Når jeg så OCR behandler det skannede så bruger jeg det medfølgende program
som også er et billigt program, der kun kan omsætte tekster når de er
maskinskrevne eller lignende.
Der er der så et problem hvis bogstaverne ikke hænger sammen i det dokument
som du skanner ind, Tænk på at "m" faktisk kan komme til at ligne "rn" ja
hvis jeg skriver det med mellemrum "r n" det sker for det meste når der
kommer huller i bitmappen der danner bogstavet. Derfor bruger jeg 300 dpi.
Hvis der er mange problemer med at få læst siden i OCR programmet så går jeg
op til 600 dpi. men det er faktisk kun nødvendigt ved ganske få tilfælde, og
så tager det jo mindst fire gange længere tid at skanne siden.
De andre problemer jeg får er faktisk mange gange "v V, s S, o O, z Z" som i
ser er det programmets evne til at se forskel på store og små bogstaver hvor
bogstaverne er ens i udformning.
Men jeg er storforbruger af det simple værktøj jeg har da jeg lægger alle de
tekster jeg får fat i som er skrevet med maskine eller på PC ind i
tekstbehandling på min PC og jeg transkriberer de tekster jeg finder på
arkiverne og lægger dem ind i teksbehandlingen.
Det er kun fotokopier der er meget dårlige hvor bogstaverne ikke er
sammenhængende inden for det enkelte bogstav som kan give mange problemer
med OCR behandlingen.

mvh
Niels Gjermandsen



"J.k." <ikast@email.dk> skrev i en meddelelse
news:bmsdj0$2ppn$1@news.cybercity.dk...
> Jeg har en 3-4 år gammel scanner ( HP Scanjet 3300c ), og vil nu gerne
> indscanne nogle gamle maskinskrevne sider jeg har i fotokopi omkring mine
> aner (der er mange sider).
> Men når jeg scanner det bliver det til noget ulæseligt vrøvl. Er det min
> scanner der er for dårlig/gammel (normal scanner den godt nok).? Er det
min
> software der ikke dur.? I såfald hvad skal jeg have fat i.Gode råd
> efterlyses
> Med venlig hilsen
> Jørn
>
>
>



Erik Helmer Nielsen (19-10-2003)
Kommentar
Fra : Erik Helmer Nielsen


Dato : 19-10-03 13:07

"J.k." <ikast@email.dk> skrev:
19 Oct 2003 00:11:04 +0200 i dk.videnskab.historie.genealogi
>Jeg har en 3-4 år gammel scanner ( HP Scanjet 3300c ), og vil nu gerne
>indscanne nogle gamle maskinskrevne sider jeg har i fotokopi omkring mine
>aner (der er mange sider).
>Men når jeg scanner det bliver det til noget ulæseligt vrøvl....

Problemet med gammel maskinskrift er ofte at skriften er svag eller
falmet og samtidig er papiret måske gulnet. Det giver en dårlig
kontrast mellem tekst og baggrund.

Sådan en side skal du -ikke- scanne i sort/hvid, men i gråtoner.
Indstil Scanneren til at scanne i 256 gråtoner og sæt opløsningen til
200 dpi. Juster scanneren så baggrunden er svagt lysegrå og klip evt.
lidt i sort så bogstaverne bliver tydeligere.
Så vil du få en pæn og vellignende udskrift på en god sort/hvid
printer med 600 dpi opløsning.

Erik Helmer Nielsen


Søg
Reklame
Statistik
Spørgsmål : 177558
Tips : 31968
Nyheder : 719565
Indlæg : 6408929
Brugere : 218888

Månedens bedste
Årets bedste
Sidste års bedste