Skeniranje dokumentov, OCR in iskanje po besedilu
Za dokument ni pomembna samo slika strani. Pogosto je pomembno, da lahko po vsebini tudi iščete.
Pripravil: Tomi Meglenov, Normstudio / Presnemavanje.si. Besedilo temelji na praktičnem delu z video kasetami, filmskimi trakovi, avdio posnetki, fotografijami in družinskimi arhivi.
Zadnja posodobitev: 22.05.2026
Kratek odgovor
Kdaj izbrati PDF, kdaj slike, kaj pomeni OCR in zakaj je 300 DPI pogosto osnovna meja za besedila. Za dokument ni pomembna samo slika strani. Pogosto je pomembno, da lahko po vsebini tudi iščete. Če niste prepričani, pošljite fotografijo materiala ali oznak in predlagamo najbolj varen naslednji korak.
Zakaj je to pomembno?
Podjetja in organizacije pogosto skenirajo dokumente kot fotografije. Kasneje ugotovijo, da ne morejo iskati po besedilu, kopirati vsebine ali hitro najti pogodbe.
Kaj je najboljši izvirnik: Skeniranje dokumentov, OCR in iskanje po besedilu
Pri digitalizacija dokumentov, arhivov, map in preglednih PDF datotek je pomembno ločiti papirno fotografijo, negativ, diapozitiv in dokument. Papirna fotografija je že kopija, negativ ali diapozitiv pa pogosto vsebuje več informacij, če je dobro ohranjen. Pri temi "Skeniranje dokumentov, OCR in iskanje po besedilu" je zato ključen konkreten material: digitalizacija dokumentov, arhivov, map in preglednih PDF datotek.
Pred skeniranjem ne trgajte fotografij iz albumov in ne čistite filmov z agresivnimi sredstvi. Hrbtna stran fotografije je lahko enako pomembna kot slika, ker vsebuje datum, kraj, imena ali rokopis. Odločitev pri temi "Skeniranje dokumentov, OCR in iskanje po besedilu" naj sledi stanju izvirnika, ne samo želenemu izhodu.
- za OCR je običajno smiselna dovolj dobra ločljivost in kontrast
- PDF je praktičen za dokumente z več stranmi
- fotografije in dokumenti zahtevajo drugačne nastavitve
- slabo poravnane ali zmečkane strani zmanjšajo prepoznavo besedila
| Namen uporabe | Priporočena ločljivost | Tipičen format |
|---|---|---|
| družinski pregled | 300 DPI pri papirnih fotografijah | JPG |
| ponovni tisk fotografij | 600 ali 1200 DPI | JPG ali TIFF |
| negativi in diapozitivi | 2400 DPI ali več, odvisno od materiala | JPG/TIFF |
| dokumenti in iskanje po besedilu | 300 DPI | PDF ali slika z OCR po dogovoru |
Ločljivost, datoteke in realna obnova
300 DPI je pogosto dovolj za osnovni pregled papirnih fotografij, 600 ali 1200 DPI je smiselno za tisk in arhiv, pri negativih in diapozitivih pa se uporabljajo višje optične ločljivosti. Odločitev pri temi "Skeniranje dokumentov, OCR in iskanje po besedilu" naj sledi stanju izvirnika, ne samo želenemu izhodu.
Digital ICE lahko pomaga pri prahu in praskah na primernih barvnih filmih, ne deluje pa enako pri vseh črno-belih materialih. Retuša je realna, kadar odstranjuje madeže in manjše poškodbe; popolna rekonstrukcija je drugo delo. Za temo "Skeniranje dokumentov, OCR in iskanje po besedilu" je koristno pred oddajo napisati namen uporabe, okvirno količino in rok.
Kako ohraniti vrstni red in podatke
Če so fotografije v albumih, kuvertah ali škatlah, je vrstni red del zgodbe. Pred oddajo je koristno narediti fotografijo celotne postavitve in označiti skupine, ki sodijo skupaj. Za temo "Skeniranje dokumentov, OCR in iskanje po besedilu" je koristno pred oddajo napisati namen uporabe, okvirno količino in rok.
Pri negativih pustite trakove v obstoječih ovojnicah, če so označene. Pri dokumentih napišite, ali potrebujete samo sliko dokumenta ali tudi OCR za iskanje po besedilu. Če je material pri temi "Skeniranje dokumentov, OCR in iskanje po besedilu" pomemben, naj bo prvi korak previden pregled, ne več zaporednih poskusov doma.
- za OCR je običajno smiselna dovolj dobra ločljivost in kontrast
- PDF je praktičen za dokumente z več stranmi
- fotografije in dokumenti zahtevajo drugačne nastavitve
- slabo poravnane ali zmečkane strani zmanjšajo prepoznavo besedila
- ne čistite negativov z mokrimi krpami
- ne trgajte fotografij iz albumov, če so prilepljene
- ne zavrzite hrbtne strani fotografij z datumi in imeni
- ne izberite najnižje ločljivosti, če želite kasnejši tisk
Kaj lahko naredimo pri Presnemavanje.si
Za dokumente lahko pripravimo pregledne PDF datoteke in po dogovoru OCR, da je arhiv bolj uporaben. Če je material pri temi "Skeniranje dokumentov, OCR in iskanje po besedilu" pomemben, naj bo prvi korak previden pregled, ne več zaporednih poskusov doma.
Material lahko najprej pregledamo, izberemo primeren postopek in pripravimo rezultat za dejansko uporabo: MP4 za ogled, WAV ali MP3 za zvok, JPG/TIFF za slike, USB, zunanji disk ali spletni prenos. Če je gradivo mešano, ga razdelimo po formatih in prioritetah. Pri temi "Skeniranje dokumentov, OCR in iskanje po besedilu" je zato ključen konkreten material: digitalizacija dokumentov, arhivov, map in preglednih PDF datotek.
Kam naprej
Preberite še
Pogosta vprašanja o tej temi
Rešitev za vaš material
Za dokumente lahko pripravimo pregledne PDF datoteke in po dogovoru OCR, da je arhiv bolj uporaben.
Pošljite vprašanje ali naročilo Nazaj na nasvete