Arquitetura de Software

Conteúdo produzido pelas turmas de Arquitetura de Software - Computação @ UFCG

Autores

Este documento foi produzido por Flávio Roberto Pires Quirino Farias.

Descrição geral

O tesseract-ocr (github) é uma engine de reconhecimento ótico de caracteres a partir de um arquivo de imagem ou de mapa de bits. Tesseract tem suporte a unicode (UTF-8) e é capaz reconhecer mais de 100 idiomas. Também pode ser treinado para reconhecer outros idiomas.