Skanery I zastosowanie ich w technologii ocr



Pobieranie 0,89 Mb.
Strona1/10
Data16.05.2018
Rozmiar0,89 Mb.
  1   2   3   4   5   6   7   8   9   10

WYŻSZA SZKOŁA FINANSÓW I ZARZĄDZANIA

W BIAŁYMSTOKU

Tomasz Kosak
Nr albumu 19383


SKANERY I ZASTOSOWANIE ICH W TECHNOLOGII OCR

Praca Licencjacka

napisana pod kierunkiem
Dr inż. Piotr Bernacki

Białystok 2007-07-14

Spis treści:


1 Wstęp 3

2 Skaner 4

2.1 Budowa skanera płaskiego 5

2.2 Typy i podział skanerów 9

2.2.1 Typ skanerów 9

2.2.2 Podział według sposobu komunikacji 12

2.3 Podstawowe parametry skanera 13



2.3.1 Gęstość optyczna 13

2.3.2 Rozdzielczość optyczna 13

2.3.3 Rozdzielczość interpolowana. 15

2.4 Rodzaje skanowania: 16



2.4.1 Skanowanie refleksyjne. 16

2.4.2 Skanowanie transparentne. 16

2.5 Proces skanowania 17

2.6 Oferta rynkowa skanerów 19

2.6.1 Skanery płaskie 19

2.6.2 Skanery ręczne: 23

3 Technologia OCR 26

3.1 Historia OCR 26

3.2 Charakterystyka OCR 28

3.3 Etapy konwersji zdjęcia na tekst 30

3.4 Wzorce i sieci neuronowe, i ich rozwój 32

3.5 Silniki rozpoznawania 35



3.5.1 Silniki OCR 36

3.5.2 Silniki ICR 36

3.5.3 Silniki OMR 37

3.5.4 Silniki BARCODE 37

3.5.5 OCR-A, OCR-B 47

4 Mechanizm działania programu FineReader 48

4.1 Rozpoznawanie błędów 50

4.2 Metody konwersji zastosowane w FineReader 52

4.2.1 Metoda wariantowa 52

4.2.2 Metody oparte o sztuczne sieci neuronowe 53

5 Zastosowanie skanerów i perspektywy rozwoju 56

6 Zakończenie 59

7 Spis ilustracji: 60

8 Bibliografia: 61



  1. Wstęp

W dobie powszechnej wizualizacji przekazu informacyjnego żywe, pełne treści obrazy w znaczący sposób ułatwiają przekazywanie myśli. Aby wszystko to stało się możliwe również za pomocą komputerów potrzebne są urządzenia pozwalające przenieść człowiekowi wierny obraz otaczającej go rzeczywistości do ich wnętrza.


Celem tej pracy jest zaprezentowanie możliwości współczesnych skanerów. Przedstawiona zostało sposób wykorzystywania skanerów do pracy na programach wykorzystujących technologię OCR.

Praca składa się z 4 rozdziałów.

Rozdział pierwszy opisuje budowę skanera oraz jego podstawowe parametry. Przedstawiony został podział skanerów ze względu na typ i rodzaj oraz oferta rynkowa tych urządzeń.

W drugim rozdziale opisana została historia technologii OCR oraz charakterystyka tej technologii. Zostały także przedstawione silniki rozpoznawania tekstu ze szczególnym naciskiem na silniki kodu kreskowego (BARCODE).

Rozdział trzeci przedstawia działanie programu FineReader. Opisane zostały też metody konwersji zastosowane w tym programie. A także rozpoznawanie błędów przez ten program.

Rozdział czwarty opisuje, w jakich dziedzinach są stosowane skanery oraz w jakim kierunku dąży ich rozwój.

Ta praca jest efektem zainteresowania autora technologią OCR a co za tym idzie również skanerami. Autor ma nadzieję, że dzięki tej pracy czytelnik będzie mógł pogłębić swoją wiedzę na ten temat i dowiedzieć się, jakie są możliwości skanerów i oprogramowania współpracującego z tymi urządzeniami.

  1. Skaner


W tym rozdziale została przedstawiona budowa skanera płaskiego. Opisane elementy to źródło światła, elementy fotoczułe, układ dichroiczny, mechanizm napędowy, układy elektroniczne, szklana płyta.



Przydatnymi pojęciami w tym rozdziale będą dyskretyzacja i digitalizacja.

Dyskretyzacja czyli zamiana prądu generowanego w sposób ciągły przez czujnik na prąd o przebiegu „schodkowym”.

Digitalizacja to przyporządkowanie generowanym w procesie dyskredytacji prądom pewnej liczby (od 0 do 256 – zapis 8 – bitowy lub od 0 do 65535 zapis 16 bitowy. Następnie podczas rejestrowania obrazu liczbom tym są przypisywane poziomy jasności tzw. barw składowych

    1. Budowa skanera płaskiego



Rysunek 1 budowa skanera płaskiego



Źródło: http://zsaslawno.com/lekcje/przetwarzanie/skaner/skaner.html z dnia 3.09.2007r.


Rysunek 2 budowa skanera

źródło: http://www.goldhand.com.pl/komputer/budowa/skaner.html z dnia 3.09.2007r.




Źródłem świa­tła w skanerach płaskich są różnego rodzaju lampy fluorescencyjne. Możemy wyróżnić lampy ksenonowe, w których łuk wytwarzany jest w atmosferze ksenonu. Występują także lampy neonowe i argonowe.

„Odbite od oryginału światło pada w skanerze na układ ele­mentów fotoczułych (patrz rys.5) - czujników fotoelektrycznych. Ich zadaniem jest przetwo­rzenie padającego światła na prąd elektryczny. Im więcej światła pada na czuj­nik, tym większy powstaje prąd. Materiały elektroniczne na elementy fotoczułe dla różnych typów urządzeń rejestracji cyfrowej są różne. W najpopularniejszej konstrukcji wykorzystuje się elementy CCD ( Charge Coupled Devices) urządzenia o sprzężeniu ładunkowym. Element fotoczuły CCD stosowany w skanerach płaskich jest wykonany jako chip.”1



Układ optyczny w skanerze płaskim tworzą obiektyw soczewkowy i zwierciadła. W lepszych skanerach może być więcej obiektywów, przez co zwiększa się tzw. rozdzielczość optyczną skanera.

Kolejnym elementem budowy skanera jest filtr dichroiczny, czyli układ trzech równoległych półprzepuszczalnych luster, które rozdzielają padający strumień świetlny na trzy jednakowe strumienie.

W każdym procesie skanowania występuje ruch względny oryginału i strumienia padającego nań światła. Najczęściej ruch taki zapewnia silnik.

Skaner jest złożonym urządzeniem elektronicznym, mimo że w nowoczesnym skanerze wewnątrz jest dużo pustego miejsca. Prze­strzeń tę zawdzięcza on wysokiemu stopniowi integracji elementów elektronicz­nych, a stosunkowo duża obudowa musi umożliwiać wprowadzenie oryginału o określonym formacie. Skaner ma wbudowane układy elektroniczne z mikroprocesorem, umożliwiające m.in. procedurę tzw. samokalibracji wykonywanej automatycznie po przyłącze­niu skanera do zasilania. Jednym z najważniejszych (oprócz elementów CCD) układów elektronicznych skanera jest przetwornik analogowo-cyfrowy (A/C), do którego trafia prąd wygenerowany z czujnika fotoelektrycznego. W przetwor­niku A/C zachodzą dwa procesy - dyskretyzacja i digitalizacja. „2

W skanerze płaskim oryginały do skanowania układa się na płaskiej szklanej płycie lub w ramkach mocujących je płasko (stąd wzięła się nazwa typu skanera). Szkło płyty jest antyrefleksyjne, co zapobiega powstawaniu na obrazie wielu szkodliwych efektów, np. pierścieni Newtona(prążki interferencyjne w kształcie pierścieni). Powierzchnia płyty wyznacza wymiary oryginałów, które mogą być skanowane na danym urządzeniu - najczęściej od formatu A4 do A3.

Elementem dołączanym do każdego skanera, który nie zalicza się do jego budowy a jest niezbędny do poprawnego działania danego skanera jest specjalistyczne oprogramowanie, zbudowane wyłącznie dla określonego modelu lub typu tego urządzenia. Opro­gramowaniem tym jest tzw. sterownik (ang. Driver) nazwa ta przyjęła się wśród informatyków), który umożliwia wybór opcji dla skanowania (rys. 2.7). Bez zainstalowanego sterownika skaner nie wykona żadnego skanowania. W systemie operacyjnym sterownik jest instalowany na tzw. wieloplatformowym interfejsie TWAIN, który służy do pobierania obrazów tworzonych przez skane­ry, kamery cyfrowe i programy do przechwytywania kadrów filmów.






  1   2   3   4   5   6   7   8   9   10


©operacji.org 2019
wyślij wiadomość

    Strona główna