Kaç tane indeks alanına ihtiyacınız var?
En basit anlamıyla, dokümanların üretim ortamına aktarılması (document capture) işlemi dört temel adımdan oluşur: tarama, görüntü işleme, indeksleme ve oluşan elektronik dokümanın üretim ortamına yerleştirilmesi (release).
İndeksleme, her dokümana belirli anahtar kelimeler atanması işlemidir. Sonuçta görüntüleme sisteminin (imaging system) kullanıcıları, ilgili dokümana atanan indeksler yardımıyla ulaşabileceklerdir. En önemli ve üzerinde en çok zaman harcanılan adımdır. İndeksler genel olarak bir ilişkisel veritabanında ilgili dokümanın adına bağlı olarak tutulurlar. Büyük görüntüleme sistemlerinde, doküman görüntüleri genellikle ardışıl sayılarla adlandırılır (Örneğin; AO4323424.TIF). Bu isimlendirme şekli ise istenilen dokümanın sistemdeki milyonlarca doküman içinden ayırt edilmesini neredeyse olanaksız hale getirir. Sonuç olarak, indekslemenin istenilen doküman görüntüsünü geri getirmek için tek yöntem olduğu ortaya çıkmaktadır, dokümanın elde edilebilmesi için, indekslemenin doğru bir şekilde yapılması gerekir. Çünkü yanlış yapılan indeksleme, dokümanın görüntüsünün kaybolması anlamına gelir.
Bir Doküman Görüntüsüne Kaç Tane İndeks Alanı Atanmalı?
Her doküman tipi için atanması gereken indeks alanı sayısı farklıdır. Fakat genel olarak aşağıdaki unsurlar göz önüne alınmalıdır: - Bir doküman görüntüsüne bir tek indeks alanı atanması son derece yanlış ve tehlikelidir. Eğer indeks yanlış yazılırsa, ilgili görüntüye bir daha ulaşılamaz.
- Bir doküman görüntüsüne çok fazla indeks alanı atamaksa zaman kaybına yol açar. Günde 5000 sayfa tarayan bir görüntüleme sisteminde, yılda yaklaşık 14,000$, günde bir tek indeks alanına yazmak için harcanan zamanın bedelidir. Eğer bir yerine iki indeks alanınız varsa, bu durum ek 14,000$ anlamına gelmektedir.
- Bir doküman görüntüsüne atanması gereken indeks sayısı maliyet ve alanların doğru olarak yazılması kriterlerine bağlı olarak belirlenir. Burada değerlendirilmesi gereken unsur, kaybedilen dokümanın maliyetinin ne kadar olacağıdır. Genelde, kayıp doküman maliyetinin yüksek olduğu iş dokümanlarında, kayıt uzmanları tarafından önerilen indeks sayısı üçtür. Böylece bir indeksin yanlış yazılması durumunda, diğer iki indeksten yararlanarak doküman geri getirilebilir.
Hangi indeks alanları daha çok işe yarar?
Özel bir doküman tipi için indeks alanı tanımlanırken şu unsurlara dikkat edilmelidir: - İndeks alanını mümkün olduğunca kısa tutulmalıdır. İndeks alanının yazılmasında harcanılan ekstra bir saniye, yılda 5000 doküman işleyen bir kurum için yaklaşık 4,000$ maliyet kaybına neden olur.
- İndeks alanları kolay hatırlanabilir türden olmalıdır. Örneğin; bir müşteriyle görüşme esnasında onunla ilgili bir dokümana ulaşmanız gerekirse, o kişinin sigorta numarasıyla dokümana ulaşmak yerine adı ve soyadı ile dokümana ulaşmak daha kolay olur.
- İndeks alanı dokümanı tek (unique) olarak ayırt edebiliyor olmalıdır. Örneğin; birçok insan aynı ad ve soyadı kullanmaktadır. Her ne kadar isimlere göre indeksleme yapmak kolay olsa da kişinin isminin indekslemede yeterli olamayacağı durumları da ele alabilmek için adres, telefon numarası ve sigorta numarası gibi indeks alanları da eklenmelidir.
Daha başka neler yapabilirsiniz?
İndeksleme alanlarının belirlenmesinde, maliyet ve doğru indeks yazımı arasındaki dengeyi sağlamak için göz önüne alınabilecek başka etkenler de vardır. Bir çok durumda, el ile indeksleme yapmak yerine OCR ya da barkod tanıma işlemleri otomatik indeksleme için kullanılabilir. Bu durumlarda indekslemenin doğruluğunu ise özel doğrulama script'leri yazarak ya da otomatik indekslenmiş alanları doküman üzerindeki gerçek bilgi ile karşılaştırarak sağlamak mümkündür.
|