Home » News, software » Rozpoznawanie tekstu (OCR)

Rozpoznawanie tekstu (OCR)

Zainteresowałem się oprogramowaniem rozpoznającym tekst/pismo i chciałbym korzystać z dobrego lecz bezpłatnego narzędzia. Przed­stawię w tym wpisie programy, które nie są zaawan­sowane, ale pod­stawową funkcję roz­poznawania posiadają. Będę porów­nywał swój wynik do znanego i cenionego programu ABBYY FineReader. Jaki jest rezul­tat moich poszukiwań?

Zanim jed­nak będziesz chciał wykorzystać któryś z przed­stawionych przeze mnie programów, upew­nij się że jakość dokumen­tów (skanów) które zechcesz prze­czytać mają duży DPI.

Jed­nostka dpi opisuje stopień oddawania szczegółów kształtu obrazu w sterowanych kom­puterowo urządzeniach drukujących, naświetlających, a także wycinających, grawerujących itp. Określa gęstość możliwych do uchwycenia szczegółów obrazu, który jest rozumiany jako układ plamek, których środki pozostają w stałych odległościach względem siebie a ułożone są w rzędach i kolum­nach. źródło: wikipiedia

Jak spraw­dzić DPI zdjęcia?

Klik­nij prawym przy­ciskiem myszy na zeskanowany obraz i wybierz szczegóły.

Roz­dziel­czość w poziomie i pionie w tym przy­padku to 96 dpi czyli ok.

IrfanView  (freeware)

Używam ten program jako domyślną przeglądarkę plików graficz­nych. Jest dar­mowy i można skorzystać z wielu pluginów, które uroz­maicają jego funk­cjonalność o czym pisałem już wcześniej (pobieranie gier flash na dysk). Dodatek roz­poznawania tek­stu też znalazłem:

irfan view PL — down­load

plugin OCR — down­load

Po zain­stalowaniu programu i dodatku sprawdziłem jak to działa na zwykłym screenie czyli pliku jpg. Wciskam F9 aby uruchomić plugina. Zaznaczam tekst, który ma mi odczytać. Rezultat:

Cóż za roz­czarowanie.. No ale mimo wszystko polecam ten program jako przeglądarkę plików graficznych :)

bezpłatny — to raczej jedyna dobra strona, choć prze­znaczenie tego programu jest inne 

x — plugin nie radzi sobie z roz­poznawaniem textu

x — “czyta” tylko tekst w języku angielskim


FreeOCR.net 2.6(freeware)

Wbudowany sil­nik do prze­tworzenia infor­macji wymaga zdjęcia w rozdzielczości min. 200 dpi i nie jest przy­stosowany do czytania obrazów z zrzutów ekranu dostępnych w rozdzielczości 72 dpi. Aplikacja bez­problemowo odczytuje zeskanowany tekst jak i pliki graficzne.

Więc sprawdźmy to na screenie, z którym nie mógł sobie poradzić poprzedni program.

FreeOCR.net 2.6 down­load

Jak widać wszystko odczytał poprawnie.

bezpłatny

x — tekst roz­poznaje tylko w języku angiel­skim — problem z pol­skimi znakami


ABBYY FineReader Profes­sional 10 (trial)

Zdecydowanym liderem roz­poznawania tek­stu jest ABBY FineReader. Program nie jest bezpłatny(599zł), ale za to możliwości jakie oferuje są ogromne. Potrafi roz­czytać zeskanowane dokumenty, cyfrowe zdjęcia dokumen­tów i pliki PDF do postaci edytowal­nej, czyli wyeks­por­tuje ładnie do worda. Ma sporo zalet, ale naj­bar­dziej przy­datne zwykłemu użytkownikowi wypisze:

bar­dzo wysoka skuteczność roz­poznawania tek­stu, także gor­szej jakości

roz­poznawanie dokumen­tów w języku pol­skim i nie tylko, naj­now­sza wer­sja odczyta nawet cyrylicę, a ilość języków to aż 179!

co ważne … roz­poznany tekst jest wyeks­por­towany z zachowaniem układu, więc akapity, tabele, grafika itp pozostają tak jak w oryginal­nym dokumencie

Zobaczmy jak nasz tekst prze­czytał ABBY:

Ideal­nie, choć screen nieco pomniej­szony, ale export do pliku worda wygląda tak:

Pod­sumowanie

Domyślam się, że artykuł dość ogólny, ale różnicę widać. Polecam ABBY FineReader, gdyż jest to profesjonalne narzędzie do pracy nad roz­poznawaniem tek­stu. Choć FreeOCR też poradził sobie z roz­poznaniem, ale nie potrafi czytać pol­skich znaków wstawiając w ich miej­sca przy­pad­kowe literki.

Jeżeli znacie jesz­cze jakieś godne polecenia programy OCR to napisz­cie w komentarzach.

Popularity: 2% [?]

Prześlij dalej:
  • Digg
  • del.icio.us
  • Facebook
  • Google Bookmarks
  • email
  • MySpace
  • RSS
  • Twitter
  • Wykop
  • Add to favorites
  • Diggita
  • Diigo
  • Live
  • MSN Reporter
  • PDF
  • Print
  • Reddit
  • Technorati
  • Yahoo! Bookmarks
  • Yahoo! Buzz
Tags: ,
forum.toin.pl

Leave a Reply

Podgląd komentarza:



Zobacz też:

Znaczniki HTML — prosta strona WWW
Aby można było stworzyć stronę WWW należy znać znaczniki HTML, które są dla przeglądarki, jak...
Przechwytywanie obrazu w treść
Czy zastanawiałeś się kiedykolwiek nad faktem przeniesienia tekstu czy widoku ze zdjęcia np do Worda,...
ASUS A8H drivers windows xp
Często widziałem jak na forach proszono o sterowniki do tego modelu. Na stronie producenta są dostępne,...
Ograniczanie prędkości transferu — FlashGet
Jaki jest sens w ograniczaniu prędkości transferu danych z internetu? Skoro każdy by chciał mieć...
Grab this Widget
Copyright © 2008-2010 · toin.pl · All Rights Reserved · Posts · Comments
Designed by Theme Junkie · Powered by WordPress