Распознавание документов

Продукт: Распознавание документов

История
В группе компаний «Роса» существовало решение для получения в систему учета сканы документов, подписанных клиентами. Система позволяла минимизировать затраты на поиск документов при спорных ситуациях, предоставлять при запросах от клиентов подписанные сканы документов, четко работать системе дебиторской задолженности.
Продукт был сделан в 2012 году на основе возможностей инструментов ABBYY FineReader. Уже с 2020 года предприятия не могли часть сканов разместить в систему в связи с ограничениями лицензирования.

Решение
Из двух вариантов решения проблемы остановились на собственной разработке, т.к. обновление ABBYY FineReader требовала значительно больше затрат, а на момент начала собственной разработки, ABBYY покинула российский рынок.

В итоге, новый продукт повторил возможности существовавшего решения, и дал возможность пользователям использовать настольный девайс. Сейчас наш продукт позволяет загружать изображения со сканера в настольной версии и с камеры в мобильных устройствах с помощью веб-браузера, валидировать качества изображений, распознавать ключевую информацию на документах, формировать PDF и загружать в ЕРП систему с учётом распознанных данных, формировать истории сканирования.

Компетенции в Data Science позволили создать сервис обработки и распознавания документов, разработанный взамен ABBYY FineReader, который включает в себя следующие последовательные этапы:

Определение наличия текста на документе.
Определение угла поворота документа и его разворот на необходимый угол.
Определение степени размытия текста. Если текст слишком размыт будет сформировано соответствуюшее сообщение.
Детекция и расшифровка штрих-кода на документе при его наличии.
Детекция ключевых регионов документа с помощью обученной нейронной сети.
Определение типа документа, распознавание номера документа, определение наличия печатей и подписей.

Для сервиса OCR возможны следующие зоны роста:

Добавление новых типов документов для расширения функционала.
Увеличение точности распознавания за счет оптимизации алгоритмов, дообучения используемых нейронных сетей или применения новых.
Добавление инструментов сравнения подписей и печатей клиентов с сохраненными в базе для определения качества оформления документа.

Особое внимание, по запросу пользователей, было уделено логированию работы пользователей в системе. Написанный для этого сервис Archivarius собирает данные о сканированиях (сотрудник, сессия, номер документа, штрих-код, тип документа, дата и время сканирования, ошибки).
Что позволяет настраивать:

фильтрацию по сотруднику
фильтрацию по дате сканирования
фильтрацию на успешные/неудачные распознавания
дашборд в реальном времени

В будущем, при отправке данных в корпоративную аналитику, предполагается получение расширенной статистики:
- Отчет по загрузке некорректных документов (отсутствие печати, подписи и т.п.)
- Отчет по кол-ву загруженных документов (сотрудник, кол-во загруженных документов)
- Фильтрация по клиенту