Skocz do zawartości


tablety.pl

Programy OCR




  • Zaloguj się, aby dodać odpowiedź
2 odpowiedzi w tym temacie

#1 Gość_picasso_*

Gość_picasso_*
  • Goście

Napisano 13 09 2006 - 03:42

Nie wiedziałam gdzie to w zasadzie umieścić bo nie mamy tu jeszcze gotowca ale rzecz warta śledzenia ......

http://google-code-updates.blogspot.com/2006/08/announcing-tesseract-ocr.html

Klaruje się open source soft do OCR (optycznego rozpoznawania tekstu). Google przearanżowało udostępniony publicznie kod źródłowy sławnego kiedyś Tesseract autorstwa HP i opublikowało swoją wersję. Wstępne wydanie okrojone i zastrzeżenia co do działania. Na teraz obsługa jedynie języka angielskiego w ASCII. Brak modułu analizującego layout (więc słaba skuteczność na materiale wielokolumnowym) i niemożność obsłużenia skanów w odcieniach szarości i kolorze. Poczekamy, zobaczymy co wymąci Google. Na razie dostępny tylko kod źródłowy więc Linuchy sobie pokompilują...... Do pobrania ze strony projektu:

http://sourceforge.net/projects/tesseract-ocr

Ogólnie darmowe OCR jest "trudne w przyrodzie" ale lepiej prezentujące się na platformie Linux oczywiście. Na otarcie łez użytkowników Windows GOCR oraz SimpleOCR - niestety program anglojęzyczny a to implikuje problem rozpoznawania ogonów.






.

#2 Gość_Unicorn_*

Gość_Unicorn_*
  • Goście

Napisano 02 12 2006 - 20:00

Dołączona grafika
SimpleOCR
Program OCR, służący do konwertowania skanowanego obrazu na tekst. Abby to nie jest ale <_<

Wspólpracuje z programem Microsoft Word, konwertując obrazy do dokumentów tego programu

DOWNLOAD
Screen:
Dołączona grafika
System: Windows

#3 The_Olo

The_Olo

    First Rank

  • Użytkownicy
  • 1 postów

Napisano 16 07 2008 - 20:43

Nie wiedziałam gdzie to w zasadzie umieścić bo nie mamy tu jeszcze gotowca ale rzecz warta śledzenia ......

http://google-code-updates.blogspot.com/2006/08/announcing-tesseract-ocr.html

Klaruje się open source soft do OCR (optycznego rozpoznawania tekstu). Google przearanżowało udostępniony publicznie kod źródłowy sławnego kiedyś Tesseract autorstwa HP i opublikowało swoją wersję. Wstępne wydanie okrojone i zastrzeżenia co do działania. Na teraz obsługa jedynie języka angielskiego w ASCII. Brak modułu analizującego layout (więc słaba skuteczność na materiale wielokolumnowym) i niemożność obsłużenia skanów w odcieniach szarości i kolorze. Poczekamy, zobaczymy co wymąci Google. Na razie dostępny tylko kod źródłowy więc Linuchy sobie pokompilują...... Do pobrania ze strony projektu:

http://sourceforge.net/projects/tesseract-ocr

Ogólnie darmowe OCR jest "trudne w przyrodzie" ale lepiej prezentujące się na platformie Linux oczywiście. Na otarcie łez użytkowników Windows GOCR oraz SimpleOCR - niestety program anglojęzyczny a to implikuje problem rozpoznawania ogonów.


Przygotowałem pliki obsługi polskiego języka do Tesseract OCR: http://code.google.c...sseract-polish/

Prace nad nimi nadal trwają, ale już teraz dzięki nim Tesseract sobie nieźle radzi z polskim tekstem.

Mam nadzieję że się komuś przydadzą.




Użytkownicy przeglądający ten temat: 0

0 użytkowników, 0 gości, 0 anonimowych