Quando você digitaliza uma página de texto, salva o arquivo como jpg, bmp ou png por exemplo. Um OCR irá converter esta imagem fixa em um texto normal, que você pode editar e formatar. Veja como fazer isso online com o OCR do Google.
Quem usa scanner para digitalizar textos está acostumado ao o mecanismo que lê os caracteres de texto em uma imagem digitalizada e cria um documento de texto real, como um arquivo do Word, por exemplo.
O Google possui uma ferramenta de conversão de imagem para texto, totalmente baseada na Web e gratuita.
Acesse http://googlecodesamples.com/docs/php/ocr.php para enviar os arquivos digitalizados para sua conta do Google Docs. O Google irá converter o documento em um texto.