Нужно доработать скрипт который – сканирует документ и извлекает из него текст. Что имеем – скрипт который сканирует конкретно указанный файл, затем создает txt файл с отксанированным текстом. (Tesseract + Python) Что требуется – скрипт который сканирует все изображения из указанной папки, затем извлеченный текст забивает в excel файл (excel файл а также образцы документов, существующий скрипт приложены) Необходимо добиться максимально возможного корректного распознавания.

Похожие

Посмотрите другие вакансии

Вот самые похожие вакансии

Новый поиск