Poradniki

Czy w procesie opisywania dokumentów warto wspomagać się automatycznym odczytem pisma (OCR)?

26.04.2013, Albert Ziarko

Odpowiedzi są dwie: i tak i nie. Pominę uzasadnianie konieczności wykorzystania OCR do odczytu całych stron dokumentów. Są to między innymi przypadki, kiedy mamy do czynienia z np.  dokumentacją  techniczną, umowami,  sprawozdaniami czy innymi dokumentami, do których treści w całości lub części będziemy sięgali lub musieli wyszukiwać. W takim przypadku ręczne przepisywanie nie ma najmniejszego sensu, gdyż OCR w 99,9%* zastąpi naszą całą pracę.

Jak wygląda sytuacja w przypadku innych dokumentów?

Doświadczenie pokazuje nam, że użytkownicy starają się wspomóc swoją pracę przez zastosowanie OCR. Te najczęściej spotykane, a więc np. faktury, delegacje, reklamacje, listy przewozowe oraz wszelkie dokumenty przychodzące do firmy w procesie rejestracji otrzymują kod kreskowy lub mają je nawet już nadrukowane. Przy ich pomocy rozpoznajemy typ dokumentów, nadajemy mu jednoznaczny  numer, tworzymy rejestr pism przychodzących.  Później możemy taki dokument albo ręcznie opisać albo wspomóc się zczytaniem niektórych informacji z baz danych. Okazuje się, że takie ręczne opisywanie dokumentów zajmuje za dużo czasu. Zdarza się czasem, że nawet kod kreskowy się nie odczytał lub nie można go było zastosować.

Co zrobić w takim przypadku?

Wspomóc się technologią OCR. Tak najczęściej robią też użytkownicy. W procesie opisywania faktury, rozpoznane przez OCR dane (nr faktury, NIP, data, kwota brutto, itd.) są zapisywane jako słowa kluczowe oraz dane do księgowania. Inne dokumenty jak listy przewozowe mogą być identyfikowane po rozpoznanym unikalnym ciągu znaków, a następnie procesowane dalej zgodnie z ich typem. W końcu rozpoznane OCR’em ciągi znaków (dane) znacznie przyśpieszają opisywanie dokumentów.

Kiedy nie wykorzystuje się OCR?

Najczęściej ma to miejsce z dokumentami, które tworzymy samodzielnie. Mogą to być np. umowy z klientami, gdzie wszystkie dane z umowy mamy i tak w odpowiednich systemach. Dokument taki musi być tylko podpisany przez klienta. A my chcemy mieć jej obraz elektroniczny z jego podpisem. W takim przypadku wystarczy nam kod kreskowy, który zostanie odczytany w momencie skanowania takiej umowy kiedy wróci ona do nas już podpisana. Na podstawie kodu nie tylko zarchiwizujemy dokument w odpowiednim miejscu ale również automatycznie przypiszemy do niego wszystkie słowa kluczowe. W takim i podobnych przypadkach OCR nie będzie nam potrzebny.

Podsumowując

Obecnie dostępna technologia OCR charakteryzuje się wyjątkową jakością odczytu sięgającą 99,9% dla pisma drukowanego. Jest ona bardzo wydajna, niedroga i łatwa w zastosowaniu. Moim zdaniem warto z niej korzystać aby przyśpieszyć proces opisywania dokumentów, zmniejszyć prawdopodobieństwo wystąpienia błędów oraz uzyskać możliwość pełnotekstowego wyszukiwania informacji. Zachęcam więc do skorzystania z opcji OCR w naszym module CONTMAN Document Processing, który wykorzystuje  jeden z najlepszych silników OCR oraz rozpoznawania formularzy. O rozpoznawaniu formularzy napiszę jednak w następnym artykule.

Artur Pęcak
Dyrektor ds. Wdrożeń i Rozwoju

#contmanway
Więcej w kategorii >
23.05.2018, Autor: Magdalena Tuchowska
Zmiana pracy to jedno z bardziej stresujących wydarzeń w naszym życiu. Przejście przez pierwsze trzy miesiące w nowej firmie bez opieki przewodnika jest jak ...
Czytaj więcej
Aktualności
Więcej w kategorii >
31.07.2018, Autor: Piotr Szpakowski
W ostatnich dniach w sieci pojawiło się kilka wpisów m. in na portalu forsal.pl czy też cashless.pl przypominających o planowanym na październik przejęciu cz...
Czytaj więcej
Case Studies
Więcej w kategorii >
31.07.2018, Autor: Piotr Szpakowski
W ostatnich dniach w sieci pojawiło się kilka wpisów m. in na portalu forsal.pl czy też cashless.pl przypominających o planowanym na październik przejęciu cz...
Czytaj więcej
Po godzinach
Więcej w kategorii >
13.09.2016, Autor: Dawid Tomaszewski
Ansel Adams kiedyś powiedział: „prawdziwa fotografia nie musi być wyjaśniana, ani nie może być zawarta w słowach”. Każdy z nas widział zdjęcie, na które pier...
Czytaj więcej
04.09.2018, Autor: Krzysztof Grześkowiak
Na przeprowadzenie refinementu składa się nie tylko dobre opisanie czy omówienie zadania, ale też sprawne moderowanie spotkania. Po właściwym wprowadzeniu pr...
Czytaj więcej