Koduleht » kuidas » PDF-faili teisendamine teisendatavaks tekstiks käsurea abil Linuxis

    PDF-faili teisendamine teisendatavaks tekstiks käsurea abil Linuxis

    PDF-faili teisendamiseks redigeeritavaks tekstiks on mitmeid põhjuseid. Võib-olla peate vana dokumendi läbi vaatama ja kõik, mis teil on, on selle PDF-versioon. PDF-failide teisendamine Windowsis on lihtne, kuid mis siis, kui kasutate Linuxi?

    Ära muretse. Näitame teile, kuidas PDF-faile redigeeritavaks tekstiks kergesti teisendada, kasutades käsurea tööriista pdftotext, mis on osa „poppler-utils” paketist. See tööriist võib olla juba installitud. Et kontrollida, kas pdftotext on teie arvutisse installitud, vajutage terminali akna avamiseks „Ctrl + Alt + T“. Sisestage käsule järgmine käsk ja vajutage „Enter“.

    dpkg -s poppler-utils

    MÄRKUS. Kui me ütleme, et kirjutame midagi sellesse artiklisse ja tekstis on tsitaate, ÄRGE tippige jutumärke, kui me ei täpsusta teisiti.

    Kui pdftotext ei ole installitud, tippige järgmine käsk ja vajutage "Enter".

    sudo apt-get installige poppler-utils

    Kui küsitakse, sisestage oma parool ja vajutage „Enter“.

    Poppler-utils paketis on mitmeid tööriistu, mis võimaldavad PDF-faile teisendada erinevatesse vormingutesse, manipuleerida PDF-failidega ja saada failidest teavet.

    Järgnev on põhifail PDF-faili teisendamiseks redigeeritavaks tekstifailiks. Terminali akna avamiseks vajutage „Ctrl + Alt + T”, tippige käsk käsklusele ja vajutage „Enter“.

    pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    Muutke iga faili asukohta, et see vastaks teie algse PDF-faili asukohale ja nimele ning kuhu soovite salvestatud tekstifaili salvestada. Samuti muutke failinimesid vastavalt failide nimedele.

    Tekstifail luuakse ja seda saab avada just siis, kui avaksite Linuxis mõne muu tekstifaili.

    Teisendatud tekstil võib olla rünnakud kohtades, mida te ei soovi. Reavahetused lisatakse PDF-faili iga teksti rea järel.

    Saate oma dokumendi paigutuse (päised, jalus, otsingu jne) säilitada muudetud PDF-faili algsest PDF-failist, kasutades „-layout” lipu.

    pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    Kui soovite konverteerida PDF-failis ainult erinevaid lehekülgi, kasutage “-f” ja “-l” (väiketähtedega L) lippe, et määrata esimese ja viimase lehekülje vahemik, mida soovite teisendada.

    pdftotext -f 5 -1 9 / home / lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    Omaniku parooliga kaitstud ja krüpteeritud PDF-faili teisendamiseks kasutage lippu „-opw” (lipu esimene märk on väiketäht „O”, mitte null).

    pdftotext -opw 'password' /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    Muuda “parool” teisendatava algse PDF-faili kaitsmiseks kasutatavale paroolile. Veenduge, et „parooli” ümber on üksikud jutumärgid, mitte kahekordsed.

    Kui PDF-fail on kasutaja parooliga kaitstud ja krüpteeritud, kasutage lipu „-opw” asemel “-ww” lippu. Ülejäänud käsk on sama.

    Samuti saate määrata teisendatud tekstile rakendatava rea ​​lõpp-märgi tüübi. See on eriti kasulik juhul, kui kavatsete faili juurde pääseda teises operatsioonisüsteemis nagu Windows või Mac. Selleks kasutage lippu „-eol“ (lipu keskmine märk on väiketäht „O”, mitte null), millele järgneb tühik ja rea ​​lõpp-märgi tüüp, mida soovite kasutada („ unix ”,“ dos ”või“ mac ”).

    MÄRKUS. Kui te ei määra tekstifailile failinime, kasutab pdftotext automaatselt PDF-failinime baasi ja lisab laienduse .txt. Näiteks teisendatakse “file.pdf” failiks “file.txt”. Kui tekstifail on määratud kui “-”, saadetakse teisendatud tekst stdout-le, mis tähendab, et tekst kuvatakse terminali aknas ja seda ei salvestata faili.

    Terminali akna sulgemiseks klõpsake üleval vasakus nurgas nuppu „X”.

    Pdftotexti käsu kohta lisateabe saamiseks sisestage terminali aknas käsku "man page pdftotext".