 |
İlgili Linkler
|
|
|
|
Siz tarayın, bilgisayarınız okusun : FineReader
 |
|
|
Pdf formatında görmek için tıklayınız.
OCR: Optik karakter tanıma
Siz tarayın, bilgisayarınız okusun OCR teknolojisi sayesinde, basılı her tür dokümanda yer alan bilgileri zahmetsizce bilgisayar ortamına aktarabilir, böylelikle sayfalarca bilgiyi bin bir zahmetle tekrar yazma derdinden kurtulabilirsiniz.
Son dönemde tarayıcılar giderek ucuzlayan fiyatlarıyla multimedya sistemlerinin vazgeçilmez bir parçası olarak birçoğumuzun evinde yer alıyorlar. Ancak kabul etmek lazım ki, büyük boyutları nedeniyle koyacak yer bulmanın zor olması ve son dönemde dijital fotoğrafçılığın hızla yaygınlaşması gibi sebeplerle çoğumuz evimizde ve işyerimizde bulunan tarayıcılardan gerektiği ölçüde faydalanamıyoruz.
Oysa diğer bilgisayar çevre birimleriyle karşılaştırıldığında günlük hayatta nispeten az kullanılan bu cihazlar, aynı zamanda OCR (Optical Character Recognition, yani Optik Karakter Tanıma) isimli bir teknolojinin donanım ayağını oluşturuyorlar. Bir tarayıcı ve bir de OCR yazılımına ihtiyaç duyan bu teknoloji, kağıda basılmış yazılı dokümanların içeriğini bilgisayarınızdaki herhangi bir kelime işlem yazılımının anlayabileceği ve üzerinde değişiklikler yapabileceği şekle dönüştürebilir. Sık sık yazılı kaynaklardan belli bölümleri bilgisayarına aktarmak zorunda olan bir öğrenci konumundaysanız veya ofisinizde sürekli basılı dokümanların içeriğini temize çekmekle uğraşıyorsanız, OCR yardımıyla hayatınızı çok daha ko lay hale getirebilirsiniz.
OCR'ın çalışma mantığı ve temel tarama bilgileri İşe ilk olarak merak edenler için OCR teknolojisinin işleyiş mantığını açıklayarak başlayalım. OCR, yazılı dokümanlardan tarayıcı yardımıyla alınan görüntünün içeriğinde yer alan metnin bilgisayarınızın anlayacağı dile çevrilebilmesini sağlayan bir teknoloji. Bu sayede metni elle yazmaya gerek kalmadan bilgisayar üzerinde yeniden düzenlenebilir, birçok program altında kullanılabilir ve yeniden düzenlenebilir hale getirebilirsiniz. Basılı sayfalarda yer alan yazıların sizin için ne kadar okunaklı olduğunu düşünün. Peki aynı sayfalar Çin alfabesiyle veya hiyerogliflerle kaplı olsaydı, sizin için bu kadar anlamlı olabilir miydi? Bilgisayarınız da OCR yazılımları olmadan yazı ları tanımlamaya karşı alabildiğine duyarsızdır ve herhangi bir yazılı metnin taranmış görüntüsünün OCR yazılımları olmadığı sürece bilgisayarınız için vesikalık resminizden farkı yoktur. OCR teknolojisi, karakterlerin tanımlanması için temel olarak üç farklı yöntem kullanır: Matrix Matching (Matris Eşleme) Bu yöntemde OCR yazılımı, karşılaşması muhtemel tüm karakterlerin görüntüsünü bir veritabanında tutar. Daha sonra taranmış dokümandaki karakterleri bir bir bu kütüphanedeki şekillerle eşleyerek hangisine uygun olduğunu bulmaya çalışır. Ucuz ve hızlı çalışan bir yöntemdir, ancak okunacak fontun şekli biraz olsun değiştiğinde hassasiyeti kaybolur. Feature Analysis (İçerik Analizi) Bu yöntemde yazılım, karakterleri görüntüsünden değil, kendilerine özgü özelliklerinden hareketle tanımlamaya çalışır. Kullanılan harfte kaç tane düz çizgi var, bunların kaçı dikey kaçı yatay, yuvarlak köşelerin konumları neler, karakterde delikler var mı, vb. Bu sayede tanımlama kriterlerine ve genel kuralına uygun olarak yazılmış hemen her karakter içerik analizi yöntemiyle tanımlanabilir. İçerik analizinde karakterin şekli genel karakter kurallarına uyduğu sürece hangi karakter setinin kullanıldığının pek bir önemi yoktur. Self-Assertion (Özgün Tanımlama) Bu yöntemde yukarıdaki iki yöntem bir arada kullanılır. Önce doküman içerik analizi yöntemiyle taranarak genel bir tablo oluşturulur ve bu sayede kesinliği yüksek karakterler bir kenara ayrılarak bir veritabanına kaydedilir. Daha sonra ilk tarama sonucunda ne olduğundan emin olunamayan karakterler, veritabanındaki ne olduğu kesinleşmiş karakterlerle karşılaştırılarak "benzetilmeye" çalışılır. Yani sistem önce içerik analiziyle kesinlikle A olduğuna emin olduğu bir A yakalayarak bunun fotoğrafını çeker. Daha sonra da bu A harfinin görüntüsünü A olduğundan emin olamadığı, fakat A'ya benzediğini düşündüğü karakterlerle karşılaştırıp ortak noktalarına bakarak gerçekten A olup olmadığına karar verir. Bu karar verme aşamaları tamamen yazılım tarafından işletilen bir süreçtir ve çoğu zaman en uygun yöntemin hangisi olduğuna yazılım karar vererek uygular. Dolayısıyla bu aşamada sizin yapabileceğiniz pek bir şey yoktur; karakterleri başarılı bir şekilde tanıma yüzdesi sadece OCR yazılımının yeteneklerine bağlıdır.
En iyi sonuçları elde etmek için nasıl taramalı? OCR işleminin doğruluğu açısından kullanılan yöntemlerin verimliliği OCR programının yeteneklerine bağlı olsa da, OCR işlemi öncesinde yapacağınız bazı ön hazırlıklarla doğruluğun artmasına katkıda bulunabilirsiniz. Bu aşamada sizin kontrolünüzde olan iki şey var: Birincisi tarayıcınızın ayarları sayesinde harfleri mümkün olan en net ve en kolay algılanabilir şekilde tarayarak programa iletmek, ikincisi de OCR yazılımının fonksiyonları üzerinde esaslı bir hakimiyet kurmak. Öncelikle OCR teknolojisinin, tarayıcı tarafından metnin sayısal ortama aktarılan görüntüsü üzerindeki harflerin ve sembollerin önceden belirlenmiş birtakım karakter bilgileriyle eşleştirilmesi temeline dayandığını biliyoruz. Yani elde edilen görüntüdeki örneğin bir A harfinin, yazılım tarafından mevcut karakter haritalarıyla ya da tanımlarıyla eşlenerek A olup olmadığına karar verilmesi lazım. İşte burada OCR yazılımının eşleme ve doğru karar verebilme yeteneği kadar, bizim d ona ne kadar "A'ya benzeyen bir A" gösteriyor oluşumuzun da büyük önemi var. Şimdi, temelde bir metni OCR işlemine tabi tutacak biçimde tarayabilmek için üç farklı seçenek kullanabilirsiniz: Renkli, gri tonlama (grayscale) ve siyah-beyaz (lineart). Karmaşık resimlerle dolu bir dokümanı olduğu gibi aktarmak ve resimleri de kaybetmemek için renkli tarama yapmaktan başka seçeneğiniz yok. Fakat OCR işleminde amacınız sadece yazıları tanımlamaksa ve sayfa düzenindeki resimlerle uğraşmayı planlamıyorsanız, gri tonlama veya siyah beyaz tarama arasından bir seçim yapmak sizi daha doğru sonuçlara götürecektir. Peki bu ikisinden hangisi OCR için daha uygun? Bunun için her iki yönteme de biraz değinmekte fayda var. Lineart (Siyah beyaz) Lineart, pikselleri sadece siyah ve beyaz olarak tanımlayabilen bir format olduğu için görüntü üzerinde oynayabileceğiniz sadece bir tek parametreye sahip. Bu yegane parametre threshold, yani algılama eşiği adını taşıyor. Algılama eşiğini, tarayıcının taramakta olduğu metin üzerinde bir pikselle karşılaştığında bunun siyah mı, yoksa beyaz mı olacağına dair verdiği kararı etkileyen bir değer olarak düşünebilirsiniz. 0-255 Arasında değişen ve orijinali 128 olan algılama eşiği değerinin 0'a yaklaşması okunan piksellerin renginin siyah ya da beyaz oluşuna dair verilen kararın beyaza doğru, 255'e yaklaşması ise siyaha doğru kaymasına neden olur. Bu nedenle algılama eşiği değerini 255'e yaklaştırdıkça tamamen siyah, 0'a yaklaştırdıkça tamamen beyaz bir sayfanın önünüzde belirdiğini görürsünüz. Bu ayara bazı tarayıcı yazılımlarında güneş ya da aydınlık-parlaklık simgesi olarak rastlayabilirsiniz. OCR yazılımı ideal sonuçlara ulaşabilmek için karakter sınırlarının iyi ve temiz belirlenmiş olmasını ister ki, gördüğü harfi referanslarıyla karşılaştırdığında doğru sonuca ulaşabilsin. Eğer ortada karakterin tanınmasını zorlaştıracak kadar yabancı piksel varsa, karakterler birbiri içine geçmişse ya da karakterlerin sınırlarını oluşturan pikseller eşleştirmeyi zorlaştıracak ölçüde kaybolmuşsa, OCR yazılımının doğruluğu bunlardan etkilenecektir. Dolayısıyla algılama eşiğini öyle bir ayarlanmalısınız ki ne çok koyu olup karakterlerin iyice birbirine geçmesine sebep olsun, ne de çok açık olup karakterlerin sınırlarının kaybolmasına yol açsın. Lineart'ın en büyük avantajı, lineart taramada elde edilen her bir piksel sadece 1 bitlik (siyah veya beyaz) renk bilgisi içerdiğinden dolayı dosya boyutunun düşük ve tarama hızının yüksek olması. Dezavantajları ise görüntülere keskinleştirme ya da otomatik aydınlık seviyesi belirleme gibi fonksiyonların uygulanamaması ve güzel bir algılama eşiği dengesi tutturmanın nispeten zahmetli oluşu. Grayscale (Gri tonlama) Grayscale modunda her piksel için 256 gri tonu (8 bit) tanımlaması yapılabiliyor ve haliyle sahip olduğu parametrelerle özelleştirme imkanları daha fazla. Bu formattaki bir görüntüye sadece parlaklık ayarı değil, keskinleştirme gibi OCR işlemini kolaylaştıran efektler de eklenebiliyor. Grayscale birçok doküman için OCR amaçlı tavsiye edilen en uygun tarama şekli, ancak birkaç ufak kusuru da yok değil. Birincisi, grayscale modunda resim tarandığında arka plan hafif gri bir renge bürünüyor ve bu da lineart'ın keskin siyah-beyaz ayrımlarıyla karşılaştırıldığında karakter tanımlama yeteneğine az da olsa etki edebilecek bir faktör. İkincisi, taranan görüntünün dosya boyu lineart eşiyle karşılaştırıldığında 8 kat daha fazla ve tarama süresi biraz daha uzun. Bu faktörler çok sayıda sayfanın taranıp işlenmesini gerektiren durumlarda göz önüne alınabilir. Gelelim gerçekte hangisinin OCR için ideal olduğu sorusunun cevabına. Aslında seçim yaptığınız işin ihtiyaçlarına göre değişiyor. FineReader ısrarla OCR için grayscale isterim derken, tarayıcı yazılımlarının neredeyse tamamı yardım dosyalarında ideal OCR taraması için lineart modunu adres gösteriyorlar. Biz de bu amaçla tamamen aynı dokümanın aynı bölgesindeki metinleri her iki yolla da tarayarak birbiriyle kıyaslama yoluna gittik. Denemelerimizde algılama eşiği iyi dengelenmiş bir lineart görüntüyle, aynı görüntünün parlaklık ayarları programın inisiyatifine bırakılmış grayscale halini FineReader ile OCR işleminden geçirdiğimizde her ikisinde de benzer başarılar yakaladığımızı, ancak her ikisinde de algılama hatası yaşanan yerlerin farklı bölgelerde oluştuğunu gözlemledik. Dolayısıyla bu iki tarama biçimi algılama başarısı yönünden birbirlerinden kesin sınırlarla ayrılabilen farklılıklara sahip değiller. Bu durumda yer ve zaman kıtlığı çekiyorsanız lineart, böyle sorunlarınız yoksa ve imaj seçeneklerini otomatiğe bağlayıp yine de tatminkar sonuçlar almak peşindeyseniz grayscale yöntemini kullanabilirsiniz. Hangisi olduğu benim için farketmez derseniz, o zaman tercihinizi nispeten daha zahmetsiz olan grayscale yönünde kullanmanızı öneririz.
Dokümanları kaç DPI çözünürlükte taramalı? Amaç taranan dokümandaki karakterlerin maksimum okunabilirliğini sağlamak olduğunda, elde edilen görüntünün kalitesi ve parlaklığı kadar boyutu da önemli. Bu nedenle biraz da dpi (dots per inch-inç başına düşen nokta sayısı) şeklinde tabir edilen çözünürlükten bahsetmekte fayda var. OCR işlemi için kabul edilen standart tarama çözünürlüğü genel olarak 300 dpi ve en iyi başarının bu çözünürlükle sağlanabildiği belirtiliyor. Ancak taranan metinde karakterlerin boyu 9 puntonun altına inmişse, okuma işleminin sağlıklı yürümesi açısından 400 ve 600 dpi tarama yapmanız gerekebiliyor. Peki normal boyuttaki karakterler için neden 300dpi'ın üstündeki çözünürlüklerin kullanılması önerilmesin? Mantıklı düşündüğünüzde yüksek çözünürlük daha fazla ayrıntı anlamına gelmiyor mu? Aslında öyle, ancak bu durumu normal boyuttaki karakterlere uygulamaya yeltendiğinizde yüksek çözünürlüklü karakterlerin aynı zamanda boyları da gereğinden fazla büyümüş olduğundan karakter eşlemede problemler çıkabiliyor. Diğer bir deyişle, grafik üzerinde beklediğinden daha büyük bir karakter boyuyla karşılaşan yazılım bu kocaman cisimleri harfe benzetmekte biraz daha fazla zorlanıyor ve buna bağlı olarak da doğruluk payı düşüyor.
Bir OCR ustası
Finereader 7 Professional İdeal bir OCR işleminin ön hazırlık aşamalarından etraflıca bahsettikten sonra, OCR işleminin yazılım üzerinde hangi aşamalardan geçtiğini görebilmek için Abbyy firmasının tanınmış OCR ürünü FineReader'ı kılavuz alacağız. FineReader 7, tarama ve tanıma işlerini toplam dört aşamada gerçekleştiriyor: Tarama, okuma, kontrol ve kayıt.
1-Aktarma (SCAN/OPEN IMAGE) İlk açıldığında FineReader arabirimi oldukça boş ve anlamsız görünüyor, ancak bu durum sadece programa OCR işleminden geçirmek üzere bir doküman yükleyene kadar geçerli. FineReader'a OCR işlemine tabi tutulacak doküman görüntüsünü iki şekilde verebilmek mümkün: Tarayıcıdan görüntüyü şimdi taramak ya da daha önce taranmış bir görüntüyü dosyadan yüklemek. Tarama yapmak için tarayıcınızın kendi TWAIN arabirimini veya FineReader ile gelen arabirimi kullanabilirsiniz. Bu ayrımı, resimde Scan butonunun yanındaki oka bastığınızda altta açılan ufak menüden Options bölümüne girerek yapabiliyorsunuz. Burada sizi genel opsiyonların tarayıcı seçimiyle ilgili bölümleri karşılıyor ve en üstte Use FineReader Interface ile Use TWAIN Source Interface olarak iki seçenek buluyorsunuz. Bu ikisinin farkı şu: Twain Source Interface denilen şey aslında tarayıcınızın sürücülerini yükledikten sonra bir resim taramak istediğinizde karşınıza çıkan kendine özgü arabirimin ta kendisi. Bu arabirim hemen her tarayıcı modeline göre değişen görünüm ve özelliklere sahip, ayrıca tarayıcının özelliklerine ve yeteneklerine uygun birtakım ayarlara erişmenize de olanak sağlıyor. Bu ayarlar arasında tarama işleminin kalitesinin belirlenebilmesinden hassas parlaklık ayarlarına, hatta görüntü keskinleştirme gibi özel fonksiyonlara kadar birçok şey bulmak mümkün. Yine tarayıcıya özel arabirimler taranacak görüntünün bir ön görüntüsünü kullanıcıya göstererek bütün bir sayfa yerine sadece belli bir alanın taranabilmesine de olanak sağlıyorlar. FineReader arabirimi ise biraz daha kolay gibi görünmekle beraber fazla bir özelleştirmeye olanak sağlamıyor. Yine de iki güzel tarafı var: Birincisi, bu arabirimi kullanarak grayscale modunda tarama yaparsanız parlaklık ayarını FineReader kendi ihtiyaçlarına uygun biçimde otomatik olarak ayarlıyor. Bunu sağlamak için Brightness ayarını FineReader konumunda bırakmanız yeterli, ikincisi de bu arabirimin yüksek miktarda doküman taramak için özelleşmiş fonksiyonlara sahip oluşu. Kısacası, FineReader arabirimi bu işler için özelleşmiş arabirimi olmayan tarayıcı cihazları için düşünülmüş. Tabii sizinkinin kendine has arabirimi varsa onu kullanmanızı öneririz. Daha önceden taranmış bir görüntüyü yazılıma aktarmak için kullanacağınız Open Image seçeneğinin ise özel veya anlaşılmayacak bir yönü yok. Bildiğiniz gibi tarayıcıdan çıkan resimleri hemen her tarz görüntü formatına çevirip saklamak mümkün. Bu şekilde tarayıcıdan görüntüyü alıp sonradan OCR işlemine koyacaksanız ya da ağ üzerinde görüntü tarama işini bir sisteme, okuma işini bir diğer sisteme vermeyi planlıyorsanız bu özelliği kullanabilirsiniz.
2-Okuma (READ) Sayfayı okutup buraya geldiğinizde yazılımın ayarlarıyla oynamadıysanız ekranın dörde ayrılmış olduğunu göreceksiniz: Yüklenmiş sayfaların ufak resimlerinin olduğu bölüm (en sol), taranmış sayfanın görüntüsünün yer aldığı sol üst pencere, okutma işlemini yaptığımızda okuma sonucunun yer alacağı sağ üst pencere ve altta da yazı içindeki harflerin piksel ayrıntılarını gösteren büyüteç penceresi. Bu pencere sayesinde tanıma işlemi için iyi bir görüntü yakalayıp yakalamadığınızı bir kez daha gözleyebilirsiniz. Karakterlerle bir sorununuz yoksa, sıra değişik sayfa düzenlerinin tanıtılması için gereken ayarların yapılmasına gelmiş demektir. FineReader ile gelen sayfa analizcisi basit dokümanların formlarını tanımlamakta pek zorlanmazken, karmaşık dokümanlarda dikkat edilmesi gereken birtakım noktalar var. Taranmış bir sayfa üzerindeki nesneleri temel olarak üçe ayırmak mümkün: Yazı, resim ve tablo. FineReader'ın analiz aracı bunları birbirinden gerektiği gibi ayıramamışsa ufak birkaç hareketle bu durumu telafi edebilirsiniz. Bunun için sayfayı görüntülerken Image penceresinin solunda yer alan sayfa düzenleme araçlarını kullanabilirsiniz. Bazen de FineReader bazı bölümlerde ayırım yapamayıp yazıları yanlışlıkla resim gibi işaretleyebiliyor. Bu durumda da Delete Block ile yanlış işaretli kutuyu silerek doğru biçimde tanımlamanız mümkün. Ancak ilginçtir, FineReader kullandıkça bu metinleri ne şekilde işaretlediğinizi ufaktan öğrenmeye başladığı gibi bir his uyandırıyor. Bu araç çubuğunun altında yer alan kısımlar ise tabloların çubuklarını yerleştirmekle ilgili. Elinizdeki doküman bir tablo içeriyorsa ve FineReader buna ait bazı satırları ısrarla tablo satırı olarak tanımlamak istemiyorsa, tablo sınırlarını isteğiniz doğrultusunda belirleme şansına sahipsiniz.
3-Kontrol (CHECK SPELLING) Okuma sırasında FineReader'in bazı kelime ve harflere renkli işaretler koyduğu dikkatinizi çekmiştir. FineReader çok güçlü bir OCR yazılımı, ama hata yapabileceği programcıları tarafından öngörülmüş. İşte bu nedenle yazılım dahili bir Spell Checker, yani yazım denetçisi içeriyor. Sonuçları kelime işlemcinize veya üretim aşamasına göndermeden önce taranmış ve okunmuş metinler üzerinde bir düzeltme yapmak istiyorsanız, bu bölüm ayrı bir değer kazanıyor. Özelliği kullanmak oldukça basit: FineReader yanlış olduğunu düşündüğü bir kelimeyle karşılaşınca bunu size bildiriyor ve siz de ya doğrusunu yazıp sözlüğüne ekliyor, ya da listeden doğru karşılığı seçiyorsunuz. Ayrıca Options bölümünde özelliğin hata algılama veya duraklama seviyelerini belirleyebileceğiniz birkaç tane ayar mevcut. Böylece hata arama hassasiyetini değiştirebiliyorsunuz.
4-Kayıt (SAVE) Kayıt aşaması OCR işleminin artık son ayağını oluşturuyor. FineReader'ın kayıt için sunduğu geniş seçenekler arasında kaybolmak istemiyorsanız size tavsiyemiz doğrudan Save Wizard'a yönelmeniz. Zira tek ekranda ihtiyacınız olan tüm seçenekleri size sunuyor. Save Wizard'a bastığınızda Save to File, Word, Excel, Send by e-mail, Copy to Clipboard ve Web Browser gibi seçenekler görüyorsunuz. Bu seçeneklerin tamamı ilgili yazılıma tanıtılmış sayfayı anında yönlendirmeye yarıyor. Yani diyelim ki Word'ü seçtiniz, bilgisayarınızda Word yüklüyse hemen Wbrd açılıp okutulmuş sayfa oraya yönlendiriliveriyor. Ya da Web Browser'ı seçiyorsunuz, yazı tarayıcınızda beliriyor. Clipboard seçerseniz de herhangi bir boş belgeye [Ctrl| + [V] (Paste) işlemi yaptığınızda FineReader'dan gelen dokümana aktarılıveriyor. Ama denemelerimizde (özellikle Word ve F.xcel altına dosya aktarırken bunun birtakım sorunlara neden olduğunu ve doğru çalışmadığını gördük, OLE bağlantısının kurulamaması sorunuyla yüzleşebiliyorsunuz. O nedenle bunun işe yaramadığı durumlarda Save to File seçeneğini kullanmanızı öneriyoruz. Bu seçenek anında bir Word açarak dokümanı yönlendirmek yerine, dokümanı dilediğiniz isimle DOC olarak kaydedip sonradan Word ile açmanıza olanak sağlıyor. Kesinlikle daha sorunsuz bir yöntem. Tabii verdiğimiz bu örnek PDF, XLS, HTML gibi her formata uyarlanabiliyor. Bu aşamada sayfa düzeniyle ilgili birkaç tane de seçeneğiniz var: Aktarma yapacağınız ortam sayfa düzeni aktarımını destekliyorsa (Word, Acrobat Reader, HTML, Excel gibi dosyaları gibi) yazının hangi formatlarının aktarılacağını burada seçebiliyorsunuz. Seçenekleriniz de yukarıdan aşağıya doğru Retain Full Page Layout (sayfa düzenini olduğu gibi koru), Retain Font and Font Size (sadece font şekil ve boylarını koru) ve Remove All Formatting (sayfa düzenini hiç işe karıştırma) olarak sıralanıyorlar. Ayrıca Keep pictures bölümüne bir işaret koyarak sayfadaki resimleri de olduğu gibi aktarabiliyorsunuz. Ve son olarak, Formats Settings butonlarıyla da her dosya türünün kendi karakteri olan bir takım özellikleri işin içine katıştırabiliyorsunuz. Word'e özel olan karakterlerin renginin de korunması, PDF'e özel olan emin olunamayan karakterlerin resim olarak aktarılması ve HTML'e özel code page seçeneği bunlara birer örnek. Genel olarak OCR teknolojisinin işleyiş mantığı, uygulanması gereken püf noktaları ve başarılı bir OCR yazılımının işleyiş şeklini bu şekilde açıklamak mümkün. Tabii tüm bu anlatılanların yanında sizin de bu konuda keşfedeceğiniz çok şey olacaktır. Çünkü OCR, kullanım amacınıza göre hayatı kolaylaştıracak ölçüde genişlemeye son derece açık bir teknoloji. OCR sayesinde dokümanları içerik ve bi çimlerini koruyarak sayısal ortama aktarmak, düzenlenebilir hale getirerek değişik biçimlere dönüştürmek son derece kolay. OCR teknolojisi maalesef henüz düzensiz el yazılarını tanımlayabilecek olgunluğa erişmiş değil. Ancak her geçen gün doğruluğu artan bu teknoloji, elbet bir gün gelir el yazısıyla tuttuğunuz ders notlarının da kolayca bilgisayar ortamına aktarılabilmesi için bir çare olup karşınıza dikilir. ?
OKUMA ÜZERİNE İNCE AYARLAR FineReader oldukça akıllı bir yazılım ve okuma sırasında birtakım eksikliklerle karşılaşırsa, sadece hatalı okuma ya da kuru hata mesajları sunmuyor. Takıldığı yeri size söyleyerek yön gösteriyor. Dolayısıyla karşınıza böyle bir uyarı çıkarsa, sorunu gidermek için öncelikle size gösterilen hata mesajındaki tavsiyeye kulak verin. Bu kez de taradığınız doküman formunun gerektiği gibi algılamadığından mı şikayetçi oldunuz? O zaman genelde karşılaşılan karmaşık doküman grupları için aşağıdaki tavsiyeleri uygulayabilirsiniz. Unutmadan, burada bahsedeceğimiz ayarlar genelde Tools / Options / Recognition menüsü altında veya civarında bulunuyor.
1) Tek sütunlu doküman: Bazı dokümanların şekilleri Tab kullanılarak ayarlanır. Ancak FineReader bunları iki sütun olarak algılamaya çalışıyor ve dokümanın şekli bozuluyor. Çözüm: Dokümanın tek sütun olarak algılanması için Recognition menüsüne gidin ve Document Type yazan başlıkta Single Column bölümünü işaretleyin. Böylece Tab boşluklarının sütun olarak algılanmasının önüne geçebilirsiniz.
2) Program kodları: Özellikle bilgisayar programcılığıyla ilgili sayfalarda çoğu zaman basılı örnek kodlar görürsünüz. Ancak bu kadar şeyi şaşırmadan yazmak zor. OCR bu iş için kullanılamaz mı? Çözüm: FineReader ile sayfalara basılı kodların bilgisayara aktarılması mümkün, açıkçası düşünenlerin de ellerine sağlık. Yapmanız gereken ilk şey, Recognition menüsünden yine Document Type altından Plain text formatted with spaces seçeneğini seçmek. Böylece dokümanın boşluklarının boşluk tuşu vuruşuyla kıyaslanarak tam olarak hesaplanmasını ve tüm paragrafların alt alta olması gerekliliğini ortadan kaldırıyorsunuz. Bu ilk adım.. İkincisi, yukarıdaki Recognition Language menüsünün aşağı kayan bir menü olduğu dikkatinizi çekmiş olabilir. Hatta bu menüye programın ana ekranından da bir referans var. İşte bu menüyü çekince karşınıza bir miktar ana dil çıkıyor. Bunları seçmek yerine Choose more language'e tıklayıp C/C++ dilini seçebiliyorsunuz.
3) Birden fazla dilde hazırlanmış dokümanlar: Kimi zaman elinize üstte İngilizce metnin altta da Türkçe çevirisinin olduğu dokümanlar geçebilir. Peki İngilizcedeki Q, W ile Türkçedeki ğ, Ş nasıl kaynaşacak? Çözüm: Elbette ki birden fazla dili seçerek. Yine Recognition menüsünde Recognition Language bölümünü aşağı doğru çekin ve Select Multiple Languages'i işaretleyin. Karşınıza birden fazla dile işaret koyabileceğiniz bir menü çıkacak. OCR işlemi için kullanılmasını istediğiniz dilleri işaretleyin ve onaylayın. Yalnız her eklenen dil algılama başarısını düşürüyor ve en fazla üç dilin bir arada kullanılması tavsiye ediliyor.
4) İkili sayfa: Bir kitabı çifter sayfa olarak taradığınızı varsayın. Kitaplar normalde tarayıcıda beklendiği gibi taranmazlar, bir sayfası kanadı sağa diğeri de sola doğru açılanır. Normalde FineReader sayfa yerleşim açısını karakterlerin konum ve duruşuna bakarak ayarlayabiliyor, ama tek bir resim üzerinde farklı açılanmış iki farklı sayfa görürse bunları ne tarafa çevireceğini nasıl anlayacak? Çözüm: En iyisi tahmin ettiğiniz gibi bunları ikiye ayırıp ikisini de gerektiği açıyla çevirmek. Ancak bunun ayarını bulmak için Tools/ Options kısmına girerek bu kez Scan / Open Image bölümüne yönelmeniz lazım. Burada Split dual pages diye bir opsiyon göreceksiniz. Bu seçeneği işaretlediğinizde FineReader bu dokümanı iki sayfa halinde algılayacak ve gerekeni de bu yönde yapacaktır.
FINEREADER 7 CORP. ED. FineReader 7'nin Pro dışında özellikle şirket ihtiyaçlarına cevap vermek üzere geliştirilmiş Corporate adlı bir diğer sürümü daha mevcut. Eğer doküman tanıma işlemleri şirketinizde yoğun bir iş kolunu oluşturuyorsa ve bu işe derinlemesine dalma ihtiyacı hissediyorsanız bu durumda Corporate sürümünün avantajlarını gözden geçirebilirsiniz. İşte Corporate sürümünün getirdikleri: 1) Fazla miktardaki dokümanların OCR işleminden geçirilmesine daha uygun ve bu yönde iyileştirmeler içeriyor. 2) Ağ ortamına uyumlu, ağ üzerinden OCR işlemi yapmanıza izin veriyor. 3) Çoklu işlemci ve çok sayıda sisteme iş dağıtabilme desteğine sahip. Böylece birden fazla sunucu veya iş istasyonunu aynı anda kullanarak işleri hızlandırabiliyor. 4) Yeni diller yaratmanıza ve yeni sözlüklerle çalışmanıza izin veriyor. Şirketinizin kendine has terimleri ya da sembolleri varsa bu özellik sizin için uygun olabilir.
FINEREADER 7 PROFESSIONAL SİSTEM GEREKSİNİMLERİ İşletim Sistemi: Windows XP, Windows 98/Me, Windows 2000, Windows NT 4 (En az SP6). İşlemci: Pentium 200 (veya eşdeğeri) ve üstü Bellek: Windows XP için 64MB, Windows 98/Me için 32MB. Sabit disk alanı: Kurulum için 220MB. Diğer donanımlar: TWAIN uyumlu tarayıcı, fare, CDROM, disket sürücü, en az 800x600 çözünürlüğü destekleyen VGA Monitor.
Levent Daşkıran, levent@chip.com.tr
|
|
|
|