Read more: http://advanceandaccurate.blogspot.com/2012/04/anti-copy-script-for.html#ixzz3oFCfyn8A Under Creative Commons License: Attribution Non-Commercial No Derivatives

Jumat, 09 Oktober 2015

Bagaimana Cara Kerja Software OCR?

Proses kerja dari software OCR

Pada dasarnya setiap dokumen yang discan menghasilkan sebuah file image (gambar) dengan format TIFF.
Setelah file image dihasilkan, langkah selanjutnya file tersebut akan diproses oleh sebuah software (program) Optical Character Recognition (OCR).
Berikut ini susuan proses kerja dari software (program) OCR:
1. Meratakan gambar (Auto Deskewing).
file image (gambar) akan diatur kemiringannya, apabila hasil scan ada kemiringan, maka gambar akan dibuat sejajar atau lurus.
2. Menganalisa (Analysis).
software (program) OCR akan menganalisa dan memisahkan bagian teks dan bagian gambar.
3. Otomatis mengatur arah gambar (Auto Orientation).
software (program) OCR akan mengambil sebagian area pada file image (gambar) dan mengidentifikasi arah teks yang benar.
file image (gambar) akan diputar ke arah yang benar, pilihannya adalah 90⁰, 180⁰ atau 270⁰.
4. Memisahkan setiap karakter huruf dan angka (Separating single character).
software (program) OCR akan memisahkan setiap karakter yang terdapat pada image (gambar) menjadi sebuah huruf atau angka.
5. Mengidentifikasi gambar (Capturing the features of the characters and comparing).
software (program) OCR akan mengidentifikasi satu persatu setiap gambar yang sudah dipisahkan, dan melakukan pengecekan terhadap database yang dimiliki oleh software (program) OCR, dan menetapkan huruf atau angka yang akan digunakan.
6. Menghasilkan file akhir (Recognition result output).
Setelah setiap image (gambar) sudah dirubah menjadi huruf atau angka (format teks) maka software (program) OCR akan menghasilkan sebuah file dengan format teks, seperti Microsoft Word, Microsoft Excel, TXT, Rich Text dan Searchable PDF, tergantung dari pengaturan awal.
Catatan:
Untuk menghasilkan sebuah proses OCR yang sempurna, gunakan resolusi scan 300dpi, dengan format warna Grayscale.
Biasanya proses OCR dibutuhkan apabila kita memiliki sebuah dokumen dan kita menginginkan sebagian teks yg terdapat didalam dokumen tersebut sehingga kita tidak perlu repot mengetik ulang.
Ada juga kebutuhkan untuk mengkonfersi buku menjadi "buku digital" sehingga kita tidak perlu repot-repot membawa buku lagi, semua buku kita sudah terdapat didalam komputer kita.

Tidak ada komentar:

Posting Komentar