Koduleht » Tasuta tarkvara allalaadimine » Väljavõtte tekst PDF- ja pildifailidest

    Väljavõtte tekst PDF- ja pildifailidest

    Kas teil on PDF-dokument, mida soovite kogu tekstist välja võtta? Aga skannitud dokumendi pildifailid, mida soovite muuta redigeeritavaks tekstiks? Need on mõned kõige tavalisemad probleemid, mida olen töökohal näinud failidega töötamisel.

    Käesolevas artiklis räägin mitmetest erinevatest viisidest, kuidas te võite PDF-failist või pildist teksti välja võtta. Ekstraheerimise tulemused varieeruvad sõltuvalt PDF-i või pildi teksti tüübist ja kvaliteedist. Samuti on teie tulemused erinevad sõltuvalt kasutatavast tööriistast, seega on kõige parem proovida nii palju alltoodud võimalusi kui võimalik, et saada parimaid tulemusi.

    Väljavõtte tekst pildist või PDF-ist

    Lihtsaim ja kiireim viis alustada on proovida veebipõhist PDF-i teksti väljavõteteenust. Need on tavaliselt tasuta ja võivad anda teile täpselt seda, mida te otsite, ilma et arvutisse midagi installida. Siin on kaks, mida ma olen väga hea ja suurepäraste tulemustega kasutanud:

    ExtractPDF

    ExtractPDF on tasuta tööriist piltide, teksti ja fontide kopeerimiseks PDF-failist. Ainus piirang on see, et PDF-faili maksimaalne suurus on 10 MB. See on natuke väike; nii et kui teil on suurem fail, proovige mõnda muudest alltoodud meetoditest. Valige oma fail ja klõpsake nuppu Saada fail nuppu. Tulemused on tavaliselt väga kiireid ja teksti klõpsamisel peaksite näha teksti eelvaadet.

    Samuti on see tore lisaväärtus, et see ka PDF-failist väljavõtteid teeb, kui vajate neid! Üldiselt töötab võrgutööriist suurepäraselt, kuid mul on tekkinud paar PDF-dokumenti, mis annavad mulle naljakas väljundi. Tekst ekstraheeritakse täpselt, kuid mingil põhjusel tekib iga sõna järel rünnak! Lühike PDF-fail ei ole suur probleem, kuid kindlasti on tegemist paljude tekstidega failidega. Kui see juhtub, proovige järgmist tööriista.

    Online OCR

    Online OCR kipus tavaliselt töötama dokumentide puhul, mis ExtractPDF-iga korralikult ei konverteerinud, seega on hea mõte proovida mõlemat teenust, et näha, millised neist annavad parema väljundi. Online OCR-il on ka mõned ilusamad funktsioonid, mis võivad osutuda kasulikuks kõigile, kellel on suur PDF-fail, mis vajab ainult teksti muutmist vaid mõne lehekülje asemel kogu dokumendi jaoks.

    Esimene asi, mida sa tahad teha, on minna ja luua tasuta konto. See on natuke tüütu, kuid kui te ei loo tasuta kontot, teisendab see teie PDF-i ainult osaliselt kui kogu dokumendi. Samuti saate selle asemel, et ainult üles laadida ainult 5 MB dokumendi, üles laadida kuni 100 MB faili ühe kontoga.

    Esmalt vali keel ja seejärel valida väljundvormingute tüüp, mida soovite konverteeritud faili jaoks. Teil on paar võimalust ja kui soovite, saate valida rohkem kui ühe. Alla Mitme lehekülje dokument, saate valida Lehekülje numbrid seejärel vali ainult need leheküljed, mida soovite teisendada. Seejärel valite faili ja klõpsate Teisenda!

    Pärast konversiooni viiakse teid jaotisse Dokumendid (kui olete sisse logitud), kus saate näha, kui palju on vaba vaba lehekülgi ja lingid teisendatud failide allalaadimiseks. Tundub, et teil on ainult 25 lehekülge tasuta päevas, nii et kui teil on vaja rohkem, peate kas ootama natuke või ostma rohkem lehti.

    Online OCR tegi minu PDF-ide konverteerimisel suurepärase töö, sest ta suutis säilitada teksti tegeliku paigutuse. Minu testis võtsin sõna Word-dokumendi, mis kasutas täppe, erinevaid kirjasuurusi jne ja muundas selle PDF-failiks. Siis ma kasutasin Online OCR-i, et see Wordi vormingusse tagasi pöörata ja see oli umbes 95% sama kui originaal. See on minu jaoks muljetavaldav.

    Lisaks, kui soovid kujutist tekstiks teisendada, saab Online OCR seda teha sama lihtsalt kui teksti PDF-failidest väljavõtmine.

    Tasuta online OCR

    Kuna räägiti pildist, et teksti tekstisõnumite tekst, siis lubage mul mainida veel üht head veebisaiti, mis töötab piltidel hästi. Tasuta Online OCR oli väga hea ja väga täpne, kui testis pilte välja. Võtsin paar pilti oma iPhone'ist raamatute, brošüüride jms lehekülgedelt ja ma olin üllatunud, kui hästi ta sai teksti teisendada.

    Valige fail ja klõpsake nuppu Laadi üles. Järgmisel ekraanil on paar võimalust ja pildi eelvaade. Saate seda kärpida, kui te ei soovi kogu asja OCR-i näha. Seejärel klõpsa nupule OCR ja teie teisendatud tekst ilmub pildi eelvaate alla. Samuti ei ole sellel mingeid piiranguid, mis on tõesti kena.

    Lisaks võrguteenustele on kaks vabalt pakutavat PDF-muundurit, mida sooviksin mainida juhul, kui vajate konversioonide tegemiseks teie arvutis töötavat tarkvara. Interneti-teenuste puhul on teil alati vaja Interneti-ühendust ja see ei pruugi olla kõigi jaoks võimalik. Samas märkasin, et freeware programmidest saadud konversioonide kvaliteet oli oluliselt halvem kui veebisaitidel.

    PDF-i teksti väljavõtja

    PDF-i teksti väljavõtja on vabavara, mis teeb PDF-failidest teksti väljavõtmiseks üsna head tööd. Kui olete selle alla laadinud ja installinud, klõpsake PDF-faili valimiseks nuppu Ava. Seejärel klõpsake protsessi käivitamiseks nuppu Extract text.

    See küsib teilt teksti salvestusfaili salvestamiseks ja seejärel hakkab see kaevandama. Võite klõpsata ka Võimalus nupp, mis võimaldab valida ainult teatud lehekülgi, mida ekstraktida ja ekstraheerimise tüüp. Teine võimalus on huvitav, sest see eraldab teksti erinevates paigutustes ja tasub proovida kõiki kolme, et näha, millised neist annavad teile parima tulemuse.

    PDF2Text Pilot

    PDF2Text Pilot teeb teksti väljavõtte korralikult. Sellel pole suvandeid; lisate lihtsalt faile või kaustu, teisendate ja loote parimat. See toimis mõningate PDF-ide puhul hästi, kuid enamiku neist oli probleeme.

    Klõpsake lihtsalt nupul Lisa failid ja seejärel klõpsake nuppu Teisenda. Kui konversioon on lõpetatud, klõpsake faili avamiseks nuppu Sirvi. Teie läbisõit varieerub selle programmi abil, nii et ärge oodake palju.

    Samuti väärib märkimist, et kui olete ettevõttesiseses keskkonnas või saate oma käed Adobe Acrobati koopiast tööle, siis saad tõesti palju paremaid tulemusi. Acrobat ei ole ilmselgelt tasuta, kuid sellel on võimalusi PDF-i teisendamiseks Wordi, Exceli ja HTML-vormingusse. Samuti teeb see parima, et säilitada originaaldokumendi struktuur ja muuta keeruline tekst.