Eksperymentalna aplikacja do optycznego rozpoznawania znaków (OCR) Ta aplikacja jest eksperymentalna aplikacja, którą opracowałem kilka lat temu, która pokazuje korzystanie z silnika Tesseract OCR do rozpoznawania tekstu na zdjęciach przechwyconych przez aparat urządzenia. Ta aplikacja działa OCR na urządzeniu – bez przesyłania zdjęć na serwer – i nadaje się do rozpoznawania poszczególnych słów lub krótkich zwrotów tekstu, ale ta aplikacja jest przeznaczona dla hobbystów i programistów zainteresowanych OCR, a nie dla ogółu odbiorców. W przeciwieństwie do Google Mobile Vision API, ta aplikacja jest w stanie rozpoznać tekst drukowany w czcionkach innych niż łacińskie w trybie offline. Aby to osiągnąć, ta aplikacja zawiera niezwykle dużą ilość danych szkoleniowych dla kilku języków. Te dane szkoleniowe są przechowywane w telefonie, a ta aplikacja zajmuje znacznie więcej miejsca niż zwykłe aplikacje. Żadna wstępna obróbka obrazu nie jest wykonywana przez tę aplikację przed przekazaniem przechwyconych ramek obrazu tesseract, więc aplikacja nie jest dostrojona do konkretnego przypadku użycia, a w rezultacie jej dokładność rozpoznawania i szybkość jest w dużym stopniu zależna od czynników sytuacyjnych, takich jak perspektywa, oświetlenie i typ czcionki. Kod źródłowy dla tej aplikacji jest dostępny w usłudze GitHub (z niewielkimi zmianami w celu uwzględnienia ograniczeń rozmiaru pliku GitHub). Kod dla tej aplikacji jest kombinacją kodu związanego z kamerą open source z projektu skanera kodów kreskowych ZXing i kodu optycznego rozpoznawania znaków open source z projektu Tesseract OCR. PRZECHWYTYWANIE TEKSTU Domyślne przechwytywanie z jednym strzałem uruchamia OCR na obrazie migawki, który jest rejestrowany po kliknięciu przycisku migawki, jak zwykłe zdjęcie. Po zaznaczeniu pola wyboru "ciągły podgląd" aplikacja pokazuje dynamiczny wyświetlacz w czasie rzeczywistym tego, co urządzenie rozpoznaje tuż obok wizjera aparatu. Tryb ciągłego podglądu działa najlepiej na szybkim urządzeniu. KORZYSTANIE Z TEJ APLIKACJI • Skieruj urządzenie na mały obszar tekstu i dotknij przycisku migawki na ekranie, aby uruchomić OCR. • Aby rozpoznać poszczególne znaki chińskie/japońskie/koreańskie, ustaw tryb segmentacji strony na "pojedynczy znak". DOKŁADNOŚĆ ROZPOZNAWANIA • Różne czynniki mogą spowodować niepowodzenie OCR: nierówne oświetlenie, stylizowany tekst lub tekst bez wystarczającego kontrastu z tłem. Staraj się mieć dobre oświetlenie. • Przytrzymaj urządzenie stabilnie i upewnij się, że obraz jest ostry. • Jeśli chcesz zeskanować duży blok tekstu lub cały dokument, wypróbuj aplikację do skanowania dokumentów, taką jak Text Fairy. Języki • Ta aplikacja obsługuje kilka języków / skryptów nie rozpoznawanych przez Tłumacza Google. • Obsługiwane języki dla OCR: Afrikaans Albański Amharski Arabski Assamese Azerski Azerbejdżański (cyrylica) Baskijski Białoruski Bengalski Bośniacki Bułgarski Birmański Kataloński Cebuano Cherokee Chiński (uproszczony) Chiński (tradycyjny) Chorwacki Czeski Duński Holenderski DzongKha (DzongKha) Angielski angielski, środkowy (1100-1500) Esperanto Estoński Fiński Franków Francuski Francuski, Środkowy (ok. 1400-1600) Galicyjski Gruziński Gruziński - Stary Niemiecki grecki, starożytny (-1453) grecki, nowoczesny (1453-) Gudżarati Haiti Hebrajski Hindi Węgierski Islandzki Indonezyjski Inuktitut Irlandzki Włoski Włoski - Stary Japoński Jawajski Kannada Kazachski Khmer Koreański Kurdyjski Kirgiski Lao Łacińskiej Łotewski Litewski Macedoński Malajski Malayalam Maltański Marathi Nepalski Norweski Orija Paszto Perski Polski Portugalski Pendżabski Rumuński Rosyjski Sanskryt Serbski Serbski (łaciński) Syngaleski Słowacki Słoweński Hiszpański Hiszpański - Stary Suahili Szwedzki Syryjski Tagalog Tadżycki Tamilski Telugu Tajski Tybetański Tigrinia Turecki Ukraiński Urdu Ujgurski Uzbecki Uzbecki (Cyrylica) Wietnamski Walijski Jidysz NOTATKI URZĄDZENIA SAMSUNG • Na urządzeniach Samsung Galaxy może być konieczne długie naciśnięcie przycisku menu, aby ustawić preferencje.
historia wersji
- Wersja 0.5.14 opublikowany na 2014-05-11
- Wersja 0.4.3 opublikowany na 2011-05-13
Kilka poprawek i aktualizacji
Szczegóły programu
- Kategorii: Rozwoju > Składniki & Biblioteki
- Wydawca: Robert Theis
- Licencji: Wolna
- Cena: N/A
- Wersja: 0.6.0
- Platformy: android