Kuidas installida Tesseract Windowsi

Kuidas Installida Tesseract Windowsi



Tesseract on vabalt saadaval olev avatud lähtekoodiga tekstituvastustööriist, mida tuntakse ka kui OCR-i (optiline märgituvastus). Seda kasutatakse peamiselt teksti tuvastamiseks ja piltidelt eraldamiseks. See loeb pildiandmetest teksti ja kirjutab väljundi uude .txt-faili. Tesseract töötab ka Pythoni all, kuna seda kasutatakse peamiselt piltide käekirja äratundmiseks. See kasutab LSTR-i (pika lühiajalise mälu) mudelit. Tesseract töötab Apache 2.0 litsentsi all.

Selles ajaveebis käsitleme Tesseracti Windowsi installimise meetodit üksikasjalikumalt.







Niisiis, alustame!



Kuidas installida Tesseract Windowsi?

Tesseract on käsurea tööriist, mida kasutatakse piltidelt teksti eraldamiseks. Tesseracti installimiseks Windowsi peate järgima alltoodud juhiseid.



1. samm: laadige alla Tesseracti installer





Esiteks liikuge allolevale lingile ja laadige alla Tesseracti installer vastavalt oma süsteemi spetsifikatsioonidele:

https: // github.com / UB-Mannheim / tesserakt / nädal



2. samm: käivitage Tesseract Installer

Külastage ' Allalaadimised ” kataloog, kuhu Tesseracti installer alla laaditakse. Tesseracti installimiseks Windowsi käivitage Tesseracti installer, topeltklõpsates sellel:

3. samm: valige keel

Tesseracti installer toetab paljusid keeli. Installeri kasutajaliidesega suhtlemiseks valige ' Inglise ' oma keelena ja klõpsake ' Okei ”:

4. samm: installige Tesseact

Seda tehes ilmub ekraanile Tesseracti OCR-i häälestusviisard. Tesseracti installimise alustamiseks klõpsake nuppu ' Edasi ” nupp:

Et nõustuda ' Litsentsilepingu ”, klõpsake nuppu „ Ma nõustun ” nupp:

Valige ' Installige kõigile, kes seda arvutit kasutavad valikut ja vajutage nuppu Edasi ” nupp:

Kui soovite lisada skriptiandmeid või lisada mõnda muud keelt, märkige vastavad märkeruudud ja klõpsake nuppu ' Edasi ” nuppu. Kuna me ei soovi täiendavaid andmeskripte ega -keelt, jätkame vaikimisi valitud suvanditega:

Valige paigalduskoht ja klõpsake nuppu ' Edasi ” nupp:

Kui te ei soovi menüüs Start otseteed luua, märkige ' Ärge looge otseteid ' märkeruut ja vajutage ' Installige ” nupp:

Pärast seda algab Tesseracti installimine. Oodake, kuni installimine on lõpule viidud ja klõpsake nuppu ' Edasi ” nupp:

Lõpuks klõpsake nuppu ' Lõpetama ” nupp:

5. samm: määrake keskkonnamuutuja

Pärast installimist peate määrama Tesseracti keskkonnamuutuja. Selleks külastage esmalt kataloogi, kuhu olete Tesseracti installinud, ja kopeerige tee kataloogist ' Aadress 'riba:

Tehke otsing ' Keskkonnamuutujad ' jaotises ' Käivitamine ' menüü ja avage ' Muutke süsteemikeskkonna muutujaid ”:

Liikuge seadete sees jaotisesse ' Täiustatud ” seadistusmenüü ja klõpsake nuppu „ Keskkonnamuutujad ” nupp:

Vali ' Tee 'Muutuja alates ' Süsteemi muutujad ” paneeli ja vajuta „ Muuda ” nupp:

Pärast seda ' Redigeeri keskkonnamuutujat ” ilmub ekraanile aken. Vajutage ' Uus ” nuppu ja kleepige siia kopeeritud Tesseracti installikataloogi tee. Lõpuks klõpsake nuppu ' Okei ” nupp:

6. samm: kontrollige Tesseracti installimist

Tesseracti installimise kontrollimiseks avage Windowsi käsuviip, otsides ' Käsurida ' jaotises ' Käivitamine ” menüü:

Kontrollige Tesseracti versiooni, kasutades selleks ettenähtud käsku:

> tesserakt -- versioon

Allpool antud väljund näitab, et oleme Tesseracti versiooni edukalt installinud v5.2.0 ” Windowsis:

Liigume edasi, et kontrollida, kuidas Tesseracti Windowsis kasutada.

Kuidas Tesseracti Windowsis kasutada?

Tesseracti kasutatakse käsitsikirja lugemiseks või piltidelt teksti eraldamiseks. Vaatame, kuidas see töötab:

1. samm: valige Pilt

Valige pilt, millest soovite teksti eraldada. Nagu me oleme valinud ' 1.png ”:

2. samm: eraldage pildist tekst

Kui CMD on avatud. Kasutage ' cd ” käsk, et muuta kataloogi, kuhu pilt salvestatakse. Seejärel käivitage ' tesserakt ' käsk ja määrake pildifaili nimi, nagu oleme määranud ' 1.png ”. ' Tekst ” parameetrinäitajad tähistavad väljundfaili nime:

> cd C:\Users\anuma\OneDrive\Pictures\Saved Pictures
> tesserakt 1 .png 'tekst'

3. samm: kontrollige teksti ekstraheerimist

Teksti ekstraheerimise kontrollimiseks liikuge kataloogis, kus pildifail on olemas. Näete, et väljundfail ' Tekst ” on ka siia salvestatud. Topeltklõpsake väljundfaili, et kontrollida, kas tesserakt on pildilt teksti ekstraheerinud või mitte:

Näete, et oleme teksti edukalt ekstraheerinud, kasutades Tesseracti käsurea tööriista:

Oleme demonstreerinud Tesseracti installimise ja kasutamise tehnikat Windowsis.

Järeldus

Tesseracti installimiseks Windowsi on vaja alla laadida Tesseracti installer. Sel eesmärgil järgige selle artikli esimest seanssi. Järgmisena määrake Tesseracti kasutamiseks ja Windowsi käsurealt juurdepääsuks keskkonnamuutuja Path. Seejärel valige pildifail ja kasutage ' Tesseact ” käsk teksti tuvastamiseks ja pildist eraldamiseks. Siin olete õppinud installima ja kasutama ' Tesseact ” akendel.