Перевод бумажных документов в электронный вид — это первый и очень важный шаг при создании электронного архива документов, электронного документооборота. Этот процесс включает в себя сканирование, распознавание, верификацию документов, коррекцию, а также экспорт данных. Каждая из этих стадий очень важна и определяет качество конечного результата.
Что такое верификация документов
Это многоэтапный процесс, задача которого заключается в сравнении получившегося после сканирования и распознавания документа с начальным вариантом, в поиске возможных ошибок в документах. Верификация данных позволяет специалисту выявить, насколько точно и грамотно была проанализирована страница, проверить неуверенно распознанные при сканировании символы.
Верификация данных включает в себя несколько этапов:
• проверка документов на нераспознанные (или неуверенно распознанные) символы;
• проверка информации, полученной от сканирования, на ожидаемые типы данных;
• проверка информации, полученной от сканирования, на присутствие значений;
• редактирование распознанного текста;
• создание учетных карточек документов;
• автоматическое или ручное заполнение атрибутов карточек отсканированных документов.
• Если при проведении верификации документов обнаруживаются ошибки, какие-либо неточности, эти «проблемные места» помечаются специальными маркировками: на следующей стадии, коррекции, эти места будут исправлены. Если возникает необходимость верификация данных может быть проведена повторно.
После того, как верификация документов окончена, все обнаруженные ошибки устранены, страница подвергается дальнейшей обработке. Если на следующем этапе специалист отмечает неудовлетворительные результаты распознавания, документ может быть отправлен на повторную верификацию данных.