Whatsapp

gImageReader – wyodrębnia tekst z obrazów i plików PDF w systemie Linux

Anonim

gImageReader to darmowy czytnik plików PDF typu open source z możliwością wyodrębniania tekstu z obrazów i plików PDF. Jest zbudowany jako prosty interfejs Gtk/Qt do Tesseract-OCR, silnik OCR typu open source do rozpoznawania tekstów i wzorców w dokumentach i obrazach za pomocąSztuczna inteligencja

Tesseract sam w sobie jest narzędziem wiersza poleceń, którego użycie jest ograniczone do użytkowników Linuksa, którzy są wystarczająco zaznajomieni ze swoimi terminalami. Dzięki gImageReader każdy może teraz skorzystać z wydajności mechanizmu OCR.

gImageReader skanuje teksty z plików PDF lub plików graficznych w dowolnym z kilku obsługiwanych języków dzięki istnieniu znaków Unicode . Zawiera prosty, dobrze zorganizowany, konfigurowalny interfejs użytkownika, za pomocą którego można wykonywać zadania sprawdzania pisowni i tłumaczenia.

Funkcje programu gImageReader

gImageReader jest łatwy w użyciu i obsługuje pracę z dokumentami programowymi, a także migawkami przesłanych multimediów, np. zrzuty ekranu. Możesz nawet wybrać obszar tekstu, który Cię interesuje, i dodać tylko potrzebny tekst. Ostatecznie gImagereader działa zarówno jako czytnik plików PDF, jak i narzędzie do wyodrębniania tekstu. Głupie rzeczy.

Zainstaluj program gImageReader w systemie Linux

Aby w pełni wykorzystać gImageReader, musisz ręcznie zainstalować program Tesseract pakiety językowe, dzięki którym można prawidłowo analizować obrazy i pliki.Pakiet nosi nazwę „Tesseract-ocr-eng” i jest dostępny w menedżerze oprogramowania w Debiani Fedora dystrybucje.

Jeśli używasz Ubuntu, możesz po prostu dodać PPAi uruchom polecenie instalacji za pomocą poniższych poleceń:

$ sudo add-apt-repository ppa:sandromani/gimagereader
$ Sudo trafna aktualizacja
$ Sudo apt zainstaluj gimagereader

W Debian, Fedora i OpenSUSE zainstaluj go z menedżera pakietów.

$ sudo apt install gimagereader
$ sudo dnf zainstaluj gimagereader
$ sudo zypper zainstaluj gimagereader

Nie czuj się pominięty, jeśli korzystasz z Arch Linux lub któregokolwiek z jego pochodnych. AUR zapewnia Ci ochronę. A jeśli wolisz odbudować aplikację ze źródła, instrukcje znajdują się w linku Wiki do repozytorium GitHub.

Czy jesteś osobą, która wyodrębnia drukowany tekst z obrazów? Możesz nawet robić zdjęcia wybranych obszarów za pomocą telefonu i przesyłać je do laptopa. Jeszcze fajniejsza jest obsługa wielu języków, która choć nie jest idealna, już teraz jest jedną z najlepszych opcji w społeczności.

gImageReader jest jednym z najlepszych czytników plików PDF w świecie open source, zwłaszcza dzięki funkcji OCR, więc wypróbuj go i zobacz jak ci się podoba.

Jak zwykle możesz podzielić się z nami swoimi doświadczeniami z aplikacją, jeśli masz jakieś. Aby dodać inne sugestie w sekcji komentarzy poniżej.