poniedziałek, 28 lutego 2011

Google Docs z OCR'em po polsku !

----
W zeszłym roku Google Docs wprowadziło funkcję rozpoznawania tekstu (OCR) w plikach graficznych (jpg, gif, png i pdf). W skrócie działa to w ten sposób, że podczas wgrywania mamy możliwość zaznaczenia opcja, która przekonwertuje wczytywany dokument do tekstu. Wygenerowany w ten sposób dokument tekstowy jest zapisywany w Google Docs.
Od dzisiaj Google dodało obsługę 29 nowych języków - w tym obsługę języka polskiego !





2 komentarze:

  1. Ciekawe kiedy to wejdzie do wyszukiwarki google tzn. kiedy będzie tak katalogowała strony (że rozpozna elementy jpg z pismem i je skataloguje tak jak zwykły tekst)...

    OdpowiedzUsuń
  2. Dawid - myślę że już niedługo. Jak pisałem tutaj google już wykorzystuje podobny silnik do przeszukiwania archiwalnych dokumentów Yad Vashem ...

    OdpowiedzUsuń