Tesseract.js Toob brauseritele kujutise OCR-tõlke

OCR-tõlge ei ole veel täiuslik, kuid viimastel aastatel on see oluliselt paranenud. Tee juhtimine on Tesseract tõlkemootor praegu avatud C++.

Kuigi see on uskumatu raamatukogu, piirdub see siiski ainult tarkvaraga. Õnneks tegi keegi Tesseracti sadama JavaScripti, mida nimetatakse Tesseract.js. See toetab kuni 60 keelt ja kuigi see pole kindlasti täiuslik, teeb see tööd hästi.

Paigaldamine ja seadistamine on imelihtne, kus saate sihtige mis tahes pildielementi lehel ja käivitage Tesseract.recognize () funktsiooni. See võib võtta mis tahes tüüpi pilte ja see automaatselt tihendada ja tõlkida otse brauseris.

Saad palju keerulisemaks, kuid ilu on kuidas saate OCR-i ühe koodirea abil käivitada.

Vaadake Tesseract.js'i sihtlehte, kui soovite näha live-demo. See toimib brauseris, kus saate automaatse OCR-tõlke saamiseks lohistage teksti skannitud pilt.

Selle näite saate alla laadida ka kohalikult GitHubi lehekülje kaudu või saate luua oma rakenduse, lisades Tesseract.jsi skripti otse CDN-ist.

Kõige lihtsam näide näeb välja järgmine myImage on otsene viide HTML-pildielemendile:

 Tesseract.recognize (myImage) .en (funktsioon (tulemus) console.log (tulemus));

Mõlemal juhul on see raamatukogu nii kasulik, et veebis OCR-iga liikuda. See pole kaugeltki täiuslik, kuid see on ka parim ressurss veebiarendajatele, kes soovivad lehekülje OCR funktsionaalsust.

Lisateabe saamiseks külastage veebilehte Tesseract.js GitHub, kus saate vaadata otseülekannet ja sirvida veebipõhist dokumentatsiooni.