Njohni tekstin në një skedar PDF në internet

Pin
Send
Share
Send


Farshtë larg nga gjithmonë e mundur të nxirret tekst nga një skedar PDF duke përdorur kopjimin e rregullt. Shpesh faqet e dokumenteve të tilla janë skanuar përmbajtje të versioneve të tyre të letrës. Për të kthyer skedarë të tillë në të dhëna teksti plotësisht të redaktueshme, përdoren programe speciale me funksionin Njohja e Karakterit Optik (OCR).

Vendime të tilla janë shumë të vështira për tu zbatuar dhe, për këtë arsye, kushtojnë shumë para. Nëse keni nevojë të njihni rregullisht tekstin nga PDF, është e këshillueshme që të blini programin e duhur. Për raste të rralla, do të jetë më logjike të përdorni një prej shërbimeve online në dispozicion me funksione të ngjashme.

Si ta njohim tekstin nga PDF në internet

Sigurisht, gamë e veçorive të shërbimeve në internet OCR, në krahasim me zgjidhjet e plotë të desktopit, është më e kufizuar. Por gjithashtu mund të punoni me burime të tilla ose falas ose me një tarifë nominale. Gjëja kryesore është që me detyrën e tyre kryesore, përkatësisht me njohjen e tekstit, aplikacionet përkatëse të uebit përballen gjithashtu.

Metoda 1: ABBYY FineReader Online

Kompania e zhvillimit të shërbimeve është një nga drejtuesit në fushën e njohjes së dokumentit optik. ABBYY FineReader për Windows dhe Mac është një zgjidhje e fuqishme për konvertimin e PDF-së në tekst dhe për të punuar më tej me të.

Analogu i bazuar në internet i programit, natyrisht, është inferior ndaj tij në funksionalitet. Sidoqoftë, shërbimi mund të njohë tekstin nga skanimet dhe fotot në më shumë se 190 gjuhë. Konvertoni skedarët PDF në dokumente Word, Excel, etj. Janë mbështetur.

Shërbimi Online në internet ABBYY FineReader

  1. Para se të filloni të punoni me mjetin, krijoni një llogari në faqe ose regjistrohuni duke përdorur llogarinë tuaj Facebook, Google ose Microsoft.

    Për të shkuar në dritaren e autorizimit, klikoni në butonin "Login" në shiritin e sipërm të menusë.
  2. Pas regjistrimit, importoni PDF-dokumentin e dëshiruar në FineReader duke përdorur butonin "Ngarko skedarët".

    Pastaj klikoni "Zgjidhni numrat e faqeve" dhe specifikoni intervalin e dëshiruar për njohjen e tekstit.
  3. Tjetra, zgjidhni gjuhët e pranishme në dokument, formatin e skedarit që rezulton dhe klikoni në butonin "Njohin".
  4. Pas përpunimit, kohëzgjatja e së cilës varet plotësisht nga vëllimi i dokumentit, ju mund të shkarkoni skedarin e përfunduar me të dhëna teksti thjesht duke klikuar në emrin e tij.

    Ose, eksportojeni atë në një nga shërbimet në dispozicion të cloud.

Shërbimi dallohet ndoshta nga algoritmet më të sakta të njohjes së tekstit në imazhe dhe skedarë PDF. Por, për fat të keq, përdorimi i tij i lirë është i kufizuar në pesë faqe të përpunuara në muaj. Për të punuar me dokumente më voluminoze, do të duhet të blini një pajtim vjetor.

Sidoqoftë, nëse OCR është e nevojshme rrallë, ABBYY FineReader Online është një mundësi e shkëlqyeshme për nxjerrjen e tekstit nga skedarët e vegjël PDF.

Metoda 2: OCR Falas Online

Shërbim i thjeshtë dhe i përshtatshëm për dixhitalizimin e tekstit. Pa regjistrim, burimi ju lejon të njihni 15 faqe të plota PDF në orë. Falas Online OCR punon plotësisht me dokumente në 46 gjuhë dhe pa autorizim mbështet tre formate të eksportit të tekstit - DOCX, XLSX dhe TXT.

Gjatë regjistrimit, përdoruesi merr mundësinë për të përpunuar dokumente me shumë faqe, por numri falas i këtyre faqeve të njëjta është i kufizuar në 50 njësi.

Shërbim Online falas OCR Online

  1. Për ta njohur tekstin nga PDF si "mysafir", pa autorizim në burim, përdorni formularin e duhur në faqen kryesore të faqes.

    Zgjidhni dokumentin e dëshiruar duke përdorur butonin "File", specifikoni gjuhën kryesore të tekstit, formatin e daljes, pastaj prisni që skedari të ngarkohet dhe klikoni "Convert".
  2. Në fund të procesit të digjitalizimit, klikoni "Shkarkoni skedarin e daljes" për të ruajtur dokumentin e përfunduar me tekst në kompjuter.

Për përdoruesit e autorizuar, sekuenca e veprimeve është disi e ndryshme.

  1. Përdorni butonin "Regjistrimi" ose "Login" në shiritin e sipërm të menusë, në përputhje me rrethanat, të krijoni një llogari OCR Falas Online ose të hyni në të.
  2. Pas autorizimit në panelin e njohjes, mbani shtypur butonin «CTRL», zgjedhni deri në dy gjuhë të dokumentit burimor nga lista e dhënë.
  3. Specifikoni opsione të mëtejshme për nxjerrjen e tekstit nga PDF dhe klikoni Zgjidhni skedarin për të ngarkuar një dokument në shërbim.

    Pastaj, për të filluar njohjen, klikoni "Convert".
  4. Në fund të përpunimit të dokumentit, klikoni në lidhjen me emrin e skedarit të daljes në kolonën përkatëse.

    Rezultati i njohjes do të ruhet menjëherë në kujtesën e kompjuterit tuaj.

Nëse keni nevojë të nxirrni tekst nga një dokument i vogël PDF, mund të drejtoheni me siguri në përdorimin e mjetit të mësipërm. Për të punuar me skedarë voluminoz, do të duhet të blini karaktere shtesë në OCR Falas Online ose të përdorni një zgjidhje tjetër.

Metoda 3: NewOCR

Shërbim plotësisht OCR falas që ju lejon të nxirrni tekst nga pothuajse çdo dokument grafik dhe elektronik si DjVu dhe PDF. Burimi nuk imponon kufizime në madhësinë dhe numrin e skedarëve të njohur, nuk kërkon regjistrim dhe ofron një gamë të gjerë funksionesh të lidhura.

NewOCR mbështet 106 gjuhë dhe mund të përpunojë saktë edhe skanimet e dokumenteve me cilësi të ulët. Possibleshtë e mundur të zgjidhni manualisht zonën për njohjen e tekstit në faqen e skedarit.

Shërbimi Online i NewOCR

  1. Pra, mund të filloni të punoni me një burim menjëherë, pa qenë e nevojshme të kryeni veprime të panevojshme.

    Në faqen kryesore ekziston një formë për të importuar një dokument në sit. Për të ngarkuar një skedar në NewOCR, përdorni butonin "Zgjidh skedarin" në pjesën "Zgjidhni skedarin tuaj". Pastaj në fushë "Gjuha (et) e njohjes" specifikoni një ose më shumë gjuhë të dokumentit burimor, pastaj klikoni "Ngarko + OCR".
  2. Vendosni cilësimet tuaja të preferuara të njohjes, zgjidhni faqen nga të cilën doni të nxirrni tekst dhe klikoni në butonin «OCR».
  3. Shkoni poshtë faqen pak dhe gjeni butonin «Shkarko».

    Klikoni mbi të dhe në listën rënëse zgjidhni formatin e kërkuar të dokumentit për shkarkim. Pas kësaj, skedari i përfunduar me tekstin e nxjerrë do të shkarkohet në kompjuterin tuaj.

Mjeti është i përshtatshëm dhe me cilësi mjaft të lartë i njeh të gjitha karakteret. Sidoqoftë, përpunimi i secilës faqe të dokumentit PDF të importuar duhet të fillohet në mënyrë të pavarur dhe të shfaqet në një skedar të veçantë. Ju, sigurisht, menjëherë mund të kopjoni rezultatet e njohjes në klipboard dhe t'i kombinoni ato me të tjerët.

Sidoqoftë, duke pasur parasysh nuancën e përshkruar më lart, është shumë e vështirë të nxirren sasi të mëdha teksti duke përdorur NewOCR. Me skedarë të vegjël, shërbimi përballet me një zhurmë.

Metoda 4: OCR.Space

Një burim i thjeshtë dhe i kuptueshëm për dixhitalizimin e tekstit, ju lejon të njihni dokumentet PDF dhe të dilni rezultatin në një skedar TXT. Nuk ofrohen kufizime në numrin e faqeve. Kufizimi i vetëm është që madhësia e dokumentit hyrës nuk duhet të kalojë 5 megabajt.

Shërbimi Online OCR.Space

  1. Regjistrohu për të punuar me mjet nuk është e nevojshme.

    Thjesht ndiqni lidhjen e mësipërme dhe ngarkoni dokumentin PDF në faqen e internetit nga kompjuteri duke përdorur butonin "Zgjidh skedarin" ose nga rrjeti - me referencë.
  2. Në listën rënëse "Zgjidhni gjuhën OCR" Zgjidhni gjuhën e dokumentit të importuar.

    Pastaj filloni procesin e njohjes së tekstit duke klikuar në butonin "Filloni OCR!".
  3. Në fund të përpunimit të skedarit, lexoni rezultatin në fushë Rezultati OCR'ed dhe klikoni «Shkarko»për të shkarkuar dokumentin e përfunduar TXT.

Nëse thjesht duhet të nxirrni tekstin nga PDF dhe në të njëjtën kohë formatimi i tij përfundimtar nuk është aspak i rëndësishëm, OCR.Space është një zgjedhje e mirë. E vetmja gjë është që dokumenti duhet të jetë “njëngjyrësh”, pasi njohja e dy ose më shumë gjuhëve në të njëjtën kohë nuk parashikohet në shërbim.

Shihni gjithashtu: Analoge falas të FineReader

Duke vlerësuar mjetet në internet të paraqitura në artikull, duhet të theksohet se FineReader Online nga ABBYY trajton funksionin OCR në mënyrë më të saktë dhe më efikase. Nëse saktësia maksimale e njohjes së tekstit është e rëndësishme për ju, është më mirë të merrni parasysh këtë mundësi në mënyrë specifike. Por ka shumë të ngjarë, ju gjithashtu do të duhet të paguani për të.

Nëse keni nevojë të digjitalizoni dokumentet e vogla dhe jeni gati të korrigjoni në mënyrë të pavarur gabimet në shërbim, këshillohet të përdorni NewOCR, OCR.Space ose OCR Falas Online.

Pin
Send
Share
Send