SmartCapture — это распределенная система, которая состоит из шести станций, каждая из которых спроектирована для решения определенных задач в процессе работы с потоками документов.
Весь процесс ввода документов, т.е. перевода данных, содержащихся в информационных полях заполненных документов, в электронный вид, состоит из следующих основных этапов:
- сканирование документа, либо получение документа из иных источников;
- анализ типа и структуры документа (разбиение потока документов на отдельные страницы);
- получение (захват) данных из документа;
- проверка данных. Верификация — одна из функций, позволяющая системе показывать высокие результаты по извлечению данных. Групповая верификация предполагает ситуацию, когда неуверенно распознанные символы с одинаковым значением из разных документов объединяются в группы, которые подтверждаются оператором. Это повышает эффективность проверки неуверенно распознанных символов при больших объемах данных. Контекстная верификация предполагает, что при низком качестве документа, понять и подтвердить, что означает тот или иной символ можно только исходя из контекста;
- корректировка ошибок. После проверки правил и верификации документы, содержащие ошибки поступают на станцию корректировки, где ошибки устраняются оператором, а затем проверенные документы отправляются на повторную проверку;
- контроль качества. Станция контроля качества осуществляет мониторинг процессов, происходящих в системе, и позволяет устранять логические ошибки, например в структуре документа;
- экспорт данных в информационную систему. Как уже отмечалось, система обладает развитыми экспортными функциями, широким диапазоном форматов и возможностью интеграции с ведущими системами документооборота и межплатформенного ПО;
Как правило, процесс считается завершённым, когда все заполненные документы обработаны, а все данные введены, проверены и экспортированы в формат используемой информационной системы. При этом требуется обеспечить высокое качество данных и скорость обработки. Функции логического распознавания, верификации, контроля качества и др. позволяют SmartCapture гарантировать высокие результаты.
В зависимости от особенностей построения схемы комплекса или порядка прохождения банковских документов заказчика возможны и иные реализации технологического процесса. В качестве примеров могут служить решения, разработанные нами и применяемые у наших клиентов.
Вариант А. Реализация системы с единым республиканским центром обработки документов и станциями сканирования, размещенными в удаленных отделениях.
В этом случае документы, отсканированные в отделениях, передаются в республиканский центр обработки, где после процесса распознавания полученные данные проходят корректировку в отдельном подразделении.
Вариант B. Реализация системы с разделенными областными центрами обработки документов и станциями сканирования, размещенными в удаленных отделениях.
Такая реализация позволяет сократить нагрузку на каналы связи, т.е. предъявлять к ним упрощенные требования и, как следствие, увеличить количество обрабатываемых документов. Кроме того, такая организация процесса позволяет учитывать особенности информационных систем областных управлений, при их существенных отличиях между собой. В этом случае данные, полученные на этапе сканирования, передаются по каналам связи в центры обработки, расположенные в областных управлениях, где соответствующие структурные подразделения будут заниматься их корректировкой.
Вариант C. Реализация системы с единым республиканским центром распознавания документов и станциями сканирования и корректировки, размещенными в удаленных отделениях.
При такой организации процесса нет необходимости формировать структурные подразделения, занимающиеся корректировкой. Станции сканирования и корректировки могут быть размещены на одном компьютере, для обработки поступаемых документов достаточно обучить необходимое число операторов. Все это позволяет в итоге снизить затраты на персонал и материально-техническое оснащение. Вместе с тем, в отличие от предыдущего варианта, при увеличении количества станций распознавания увеличивается производительность системы в целом, а не отдельных ее участков.
Вариант D. Реализация системы с единым республиканским центром распознавания документов, станциями корректировки, размещенными в областных центрах обработки и станциями сканирования, размещенными в удаленных отделениях.
Данное решение сочетает в себе гибкость предыдущих вариантов технического процесса. Так оно позволяет увеличивать производительность всей системы в целом, за счет увеличения количества станций распознавания в республиканском центре; равномерно распределять нагрузку за счет существования региональных подразделений, ответственных за корректировку документов. Вместе с тем, нет необходимости в использовании нескольких станций администратора для работы в регионах. Кроме того, вступает в силу т.н. принцип мануфактуры – человек может выполнять работу эффективнее, выполняя одну задачу, а, не тратя силы на несколько.