/ Forside / Teknologi / Multimedie & design / Andet multimedie / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Andet multimedie
#NavnPoint
refi 19159
Klaudi 13515
severino 5400
pallebhan.. 4553
molokyle 4203
o.v.n. 3762
tedd 3707
bentjuul 3670
transor 2817
10  miritdk 2644
Scanning til tekstgenkendelse
Fra : Marianne


Dato : 10-11-02 19:34

Hej

Er der en, der kan give mig lidt tips til at scanne for senere
tekstgenkendelse.

Jeg scanner fra en alm. hus-scanner (HP2200), og jeg benytter det
medfølgende software.
Bogen, jeg scanner fra, er trykt på gulligt papir med sorte bogstaver. Jeg
forsøger at scanne med så stor opløsning som muligt (output: text and
image), og det giver 300 dpi. Scanneren skulle kunne scanne med 600 dpi, men
det kan jeg ikke få den til.

Jeg sender dernæst billedet over i Photoshop. Her prøver jeg mig frem !
Billedet er i udgangspunktet et bmp-billede. Jeg konverterer til 'graytone',
øger kontrasten til '50', øger brightness til så meget, at baggrunden er på
den sikre side af hvid. Endelig konverterer jeg til RGB for at kunne gemme
som TIF (hvilket mit OCR-program kræver).

Nogen gange bliver resultatet tilfredsstillende, men ofte er bogstaverne for
udviskede og ikke markante nok til at kunne blive genkendt.

Er der råd for dette ???

På forhånd tak


mvh
Marianne



 
 
Studio Smalbro (10-11-2002)
Kommentar
Fra : Studio Smalbro


Dato : 10-11-02 21:04

Det lyder fornuftiigt nok med de "øvelser" du har gang i med photoshop. Det
kunne muligvis svare sig at eksperimentere med baggrundsfarven. Du forsøger
at få baggrundsfarven væk, men det er vigtigt for dig er at bogstavet står
skarpt. Det kan godt stå skarpt på en gul baggrund. Når du forsøger at
fjerne baggrundsfarven gør du sikkert også bogstaverne mere uldne, fordi
noget af den farveinfo der går i den sorte forsvinder. Men OCR programmet er
ret vigtigt. Jeg bruger selv OmniPage Pro, som er det bedste af dem jeg har
prøvet. Jeg kan ikke huske hvad det koster. Det har en god brugerflade og et
fornuftigt dansk ordforråd.
Kh
Bjørn


"Marianne" <hoyen@lundbak.dk> wrote in message
news:3dcea697$0$75411$edfadb0f@dread15.news.tele.dk...
> Hej
>
> Er der en, der kan give mig lidt tips til at scanne for senere
> tekstgenkendelse.
>
> Jeg scanner fra en alm. hus-scanner (HP2200), og jeg benytter det
> medfølgende software.
> Bogen, jeg scanner fra, er trykt på gulligt papir med sorte bogstaver. Jeg
> forsøger at scanne med så stor opløsning som muligt (output: text and
> image), og det giver 300 dpi. Scanneren skulle kunne scanne med 600 dpi,
men
> det kan jeg ikke få den til.
>
> Jeg sender dernæst billedet over i Photoshop. Her prøver jeg mig frem !
> Billedet er i udgangspunktet et bmp-billede. Jeg konverterer til
'graytone',
> øger kontrasten til '50', øger brightness til så meget, at baggrunden er

> den sikre side af hvid. Endelig konverterer jeg til RGB for at kunne gemme
> som TIF (hvilket mit OCR-program kræver).
>
> Nogen gange bliver resultatet tilfredsstillende, men ofte er bogstaverne
for
> udviskede og ikke markante nok til at kunne blive genkendt.
>
> Er der råd for dette ???
>
> På forhånd tak
>
>
> mvh
> Marianne
>
>



Digit (10-11-2002)
Kommentar
Fra : Digit


Dato : 10-11-02 21:29

"Marianne" ræsonnerede, og skrev d. 10 nov 2002:

> Er der en, der kan give mig lidt tips til at scanne for senere
> tekstgenkendelse.
>
> Jeg sender dernæst billedet over i Photoshop. Her prøver jeg mig frem
> ! Billedet er i udgangspunktet et bmp-billede. Jeg konverterer til
> 'graytone', øger kontrasten til '50', øger brightness til så meget, at
> baggrunden er på den sikre side af hvid. Endelig konverterer jeg til
> RGB for at kunne gemme som TIF (hvilket mit OCR-program kræver).
>
> Nogen gange bliver resultatet tilfredsstillende, men ofte er
> bogstaverne for udviskede og ikke markante nok til at kunne blive
> genkendt.
>
> Er der råd for dette ???

1. Scan som 'lineart' og brug så høj en opløsning som muligt.

2. Scan som grayscale i så høj en opløsning som muligt. I photoshop
vælger du kommandoen 'threshold' (tærskel på dansk) og sætter en optimal
værdi (læs. læsbarhed).

Noget OCR soft arbejder dog bedst med 300 dpi.

Wayne Fulton (som altid) har en glimrende gennemgang af lineart
<http://www.scantips.com/basics04.html>


--
/Digit

»The enigma lies broken
Searching for those precious moments
Reaching for a higher of existence
Like a newborn migrant in the void«
Dimmu Borgir

Marianne (10-11-2002)
Kommentar
Fra : Marianne


Dato : 10-11-02 23:01

Tak for rådene - det fungerer straks bedre. Glimrende link til
'scantips.com'.

mvh
Marianne



Søg
Reklame
Statistik
Spørgsmål : 177557
Tips : 31968
Nyheder : 719565
Indlæg : 6408881
Brugere : 218888

Månedens bedste
Årets bedste
Sidste års bedste