JirbarBlog: Google Docs: OCR nově i pro dokumenty v češtině

OCR v Google Docs
Využití OCR neboli Optical Character Recognition, česky optické rozpoznávání znaků se ve službě Google Docs poprvé objevilo v červnu 2010. Google tehdy představil možnost převedení textu z formátu PDF nebo souborů obrázků na dokumenty služby Dokumenty Google pro prvních 5 jazyků: angličtinu,francouzštinu, italštinu, němčinu a španělštinu.

Nyní, o pár měsíců později, již aktuální verze služby podporuje celkem 34 jazyků, včetně češtiny.

Jaké soubory lze převést pomocí OCR?
Zjednodušeně řečeno, převést lze obrázky obsahující text (soubory .jpg, .png, a .gif) nebo dokumenty ve formátu PDF (soubory .pdf). Je zřejmé, že výsledná kvalita převedeného dokumentu je přímo úměrná kvalitě vstupního souboru. Přečtěte si proto, prosím, jaké požadavky by měl převáděný soubor splňovat - viz Nápověda služby Dokumenty Google. Zároveň se zde dozvíte více o tom jak OCR v Dokumentech Google funguje.

Související odkazy
Původní článek na blogu Google Docs http://googledocs.blogspot.com/2011/02/optical-character-recognition-ocr-in-34.html
Nápověda Google Docs http://docs.google.com/support/bin/answer.py?answer=176692&hl=en

Stránky

neděle 20. března 2011

Google Docs: OCR nově i pro dokumenty v češtině