Strony internetowe

Able2Extract Konwertuje pliki PDF na bardziej użyteczne formaty

Able2Extract Professional 12: Batch Conversion

Able2Extract Professional 12: Batch Conversion
Anonim

Jeśli Zawsze trzeba było wyciągnąć tekst z dokumentu Adobe PDF, wiesz, jak frustrujące może być. Praktycznie uniwersalny format plików nie ułatwia ponownego wykorzystania tekstu z jednego dokumentu i wklejenia go do innego dokumentu. Formatowanie, odstępy między wierszami i obrazy są konspirowane, aby uczynić dokumenty PDF wyzwaniem. Ale Able2Extract (100 USD, 7-dniowy darmowy okres próbny) stanowi dziecinną zabawę w tym żmudnym zadaniu.

Able2Extract konwertuje pliki PDF z informacjami na bardziej edytowalne formaty, takie jak te używane przez aplikacje Microsoft Office.

Able2Extract po prostu czyta dokument PDF, a następnie wypluwa tekst, grafikę, tabele i inne treści do wybranego dokumentu formatu Microsoft Office - Word, Excel lub Powerpoint. Odstępy między wierszami i formatowanie są zachowywane zgodnie z najlepszymi możliwościami programu: tabele nie powodują łamania akapitów w dziwnych miejscach. Nie będzie również wbudowanych elementów graficznych, które są zachowywane i przenoszone do dokumentów Office w dokładnie tym samym miejscu, w jakim pojawiają się w dokumencie PDF.

Premia 30 USD, którą płacisz za wersję Professional produktu, dodaje kluczową cechę: optyczne rozpoznawanie znaków, lub OCR. A2E Pro może czytać w tych dokumentach PDF, które zostały zeskanowane jako plik obrazu i wykonuje niezwykle dobrą robotę polegającą nie tylko na konwersji obrazów z powrotem na tekst, ale także na odtwarzaniu paginacji, układu strony, a nawet kroju pisma stosowanego w oryginalnym dokumencie.

Wyodrębnianie tekstu z pliku PDF, który został wygenerowany przy użyciu narzędzia Adobe Acrobat (lub "Drukuj do pliku PDF"), było bardzo proste; 20-stronicowy dokument ze wstawionymi obrazami, tabelą z tekstem i innymi szczegółami został odtworzony bezbłędnie w pliku.doc programu Microsoft Word. Używanie wersji Pro do rozpoznawania OCR źle wydrukowanego dokumentu, który pierwotnie został napisany maszyną do pisania, a następnie przeskanowany krzywo, było większym wyzwaniem.

Trwało to 3 minuty i 15 sekund, aby przekonwertować inaczej fatalnie zeskanowany dokument 62-stronicowy testowy plik PDF. Pojawiły się drobne literówki, na których na niektórych stronach pojawiły się ręcznie napisane notatki, ale starał się też je odtworzyć. Oryginał został wysłany faksem, a stopka faksu, wyblakła w skanie o niskiej jakości, nie reprodukowała się identycznie - ale była również całkowicie obca. Po załadowaniu pliku PDF do programu można przeciągnąć zaznaczenia części strony, którą chcesz przekonwertować; gdybym lepiej zaplanował konwersję, unikałbym wyboru tych niepotrzebnych stopek i notatek na marginesach.

Przedstawiciel wydawcy mówi, że rysunki lub szkice w dokumentach PDF mogą być skanowane i wyprowadzane do formatu pliku, który pozwala załadować je przez AutoCAD. Chociaż nie testowałem tej funkcji, widzę, jak może to być niezwykle użyteczne dla architekta, archiwisty lub historyka, zwłaszcza jeśli plany zeskanowane do pliku PDF nie zostały pierwotnie zaprojektowane na komputerze. Podsumowując, byłem pod wrażeniem Able2Extract.