SME wrote:Thiram henviser til
SUN PDF Import udvidelsen, men denne kan du kun anvende, hvis teksten i PDF-filen er gemt som tekst.
Jeg tror dog, at siden indscannede dokumenter, står teksten som et billede. Derfor har du brug for et såkaldt OCR program ("Optical Character Recognition"). Har du MS Office installeret har du faktisk et program til det (Microsoft Office Document Imaging), men du har heldigvis et par gratis valgmuligheder.
Jeg må dog erkende, at jeg ikke har nogle erfaringer med nogle af programmerne, men her er hvad jeg fandt fra google.
- Free Online OCR: Her kan du uploade dine PDF'er og få dem analyseret ganske gratis.
- Free OCR: Et gratis program til OCR. Desværre kunne jeg ikke se noget på deres hjemmeside, men jeg fandt et sted hvor den muligvis kan downloades
- Simple OCR: Endnu et gratis program.
- Top OCR: Endnu et gratis program.
Jeg håber det hjælper dig meget!
/Stefan
Først tak til Thiram og Stefan for hjælpen!
Som du rigtigt skriver, Stefan er mine gamle dokumenter gemt som PDF billeder, så man er afhængig af at have et OCR program til at læse teksten. Jeg troede, at et sådant program måske fandtes i Open office, men tak for dine forslag til andree løsninger, som jeg nu har haft lejlighed til at prøve.
Det viser sig, at det bedste af de foreslåede programmer til mit formål må siges at være "
http://www.topocr.com/topocr.html", som dog ikke umiddelbart kan åbne PDF billeder. Men hvis man kopierer PDF dokumentbillederne ind i f.eks "Paint" og derfra gemmer dem som .jpg filer, kan de konverteres af "Top OCR" til redigerbar tekst med et glimrende resultat, som også får de specielle danske tegn æ,ø og å med, hvilket ikke var tilfældet med de andre programmer.
Nu må jeg så bare udforske mulighederne i programmet yderligere
Tak igen for hjælpen!