Как работает интеллектуальное распознавание документов | Онлайн бухгалтерия Небо

Как работает интеллектуальное распознавание документов

Как работает интеллектуальное распознавание документов

Большинство людей уже слышало про автоматическое распознавание документов: компьютер может прочитать данные из паспорта или даже счетов-фактур, а потом автоматически занести в их систему. Как же это работает? Рассказывает компания Dbrain — разработчик сервиса для автоматического распознавания документов. 

Зачем нужна интеллектуальная обработка

Интеллектуальная обработка документов (IDP) — это технология, которая основывается на искусственном интеллекте и машинном обучении. Она помогает компаниям автоматизировать извлечение данных из документов и преобразовывать их в полезную информацию. 

Сложность в том, что несмотря на единую структуру большинства документов, информация будет разной. Например, в паспорте гражданина России у всех отличается фамилия, имя, отчетство, номер и серия, дата и место выдачи и так далее. 

А еще много документов, которые содержат рукописный текст, например, сочинения школьников, европротоколы, заявления об увольнении. 

Представьте, что есть страховая компания, которой постоянно приходится обрабатывать входящие документы. Например, когда человек попал в ДТП, ему нужно предоставить паспорт, страховой полис, водительское удостоверение, извещение о ДТП и многое другое. Есть два варианта оцифровать информацию для дальнейшей работы: сделать это руками или отправить нейросети. В среднем автоматическая обработка (извлечение и проверка информации) занимает 5 секунд, а точность распознавания — до 99%. При этом исключается человеческий фактор и ошибки, сделанные из-за невнимательности. Что происходит после того, как документ отправляется на распознавание?

Классификация документа

Сначала искусственный интеллект удаляет ненужный фон, преобразует изображение в вертикальный формат, выравнивает его и вырезает документ. Затем алгоритм машинного обучения определяют, что перед ним находится: паспорт, водительское удостоверение или фото кота. Если все хорошо, то дальше, а далее начинается процесс извлечения информации из документов. 

Извлечение данных 

Алгоритм, который разработали в Dbrain, разделяет изображение документа на отдельные части. Если рассматривать паспорт, то это имя, фамилия, дата и место рождения, серия, номер, место и дата выдачи. После этого нейросеть пытается предсказать, что написано внутри каждого поля: она сравнивается насколько то или иное слово похоже на ту, что уже когда-то видела. Если алгоритм сомневается в результатах, то поле отправляется на проверку человеку. За счет такого подхода получается достигнуть максимальной точности распознавания документов. 

Проверка данных

Нейросеть автоматически обрабатывает в среднем 85% полей документы. Но бывают сложные ситуации, с которыми нейросеть не справляется. Например, распознавание европротокола, так как он содержит много полей, заполняемых рукописным текстом и чаще всего не очень аккуратно. Но даже в такой ситуации используются алгоритмы: они проверяют ответы от нескольких людей и сравнивают, насколько их тексты похожи друг на друга. В конце концов нейросеть принимает решение, какой вариант считать правильным в зависимости от похожести одного ответа на остальные. А потом на полученном результате нейросеть дообучается и становится еще лучше. Так с каждым разом точность распознавания алгоритмов повышается и все реже человек участвует в проверке данных. 

Кроме того, для верификации данных может использоваться информация из общедоступных баз. Например, с помощью сервиса МВД России легко проверить действительность паспорта по его серии и номеру. А регистрацию по месту жительства можно соотнести с данными из Федеральной информационной адресной системы. 

Еще нейросеть может исправлять орфографические ошибки и проверять правильность заполнения. Например, если договор требует двух подписантов, то алгоритмы обратят внимание на отсутствие одной из подписей. 

Когда все данные извлечены и проверены, они собираются и передаются в базу данных или бизнес-процесс через API. 

Где можно использовать IDP (я бы ещё раз дал определение IDP) 

Интеллектуальная обработка переводит документы в цифровой формат, что очень помогает в их дальнейшем использовании. Наибольшая польза от внедрения будет в тех компаниях, которым постоянно приходится обрабатывать большой поток документов. Например, можно освободить бухгалтеров и финансистов от постоянной структуризации входящих документов за счет автоматизации. Кроме того, можно автоматически извлекать информацию из квитанций, счет-фактур или заявлений. А микрофинансовые организации могут автоматизировать процесс одобрения заявок на микрозаймы. 

С IDP можно автоматизировать оформление договоров: с помощью нейросетей извлекать данные из документов клиента и подставлять их в шаблон. В ретейле — автоматически извлекать информацию производителя из карточки товара и переносить ее в CRM-систему, а также использовать для описания на маркетплейсах. 

Обработку каких документов можно автоматизировать:

  • Личные: паспорт, ИНН, СНИЛС, страховой полис
  • Водительские: водительское удостоверение, свидетельство о регистрации транспортного средства (СТС), паспорт транспортного средства (ПТС), полисы ОСАГО и КАСКО
  • Юридические: различные договора и контракты, судебные решения, претензии, заявления
  • Бухгалетрские: счета на оплату, счет-фактуры, акты выполненных работ или оказанных услуг, кассовые чеки, товарные накладные
  • Кадровые: трудовая книжка, заявления и приказы, акты, уведомления, дополнительное соглашение

В целом автоматические распознаванию поддаются любые документы. При этом внедрение IDP не всегда означает сокращение штата сотрудников. Экономия может проявляться в уменьшении количества ошибок, допущенных при работе с документами, а также в концентрации команды на более полезных задачах, так как IDP освободит рабочее время от рутины. 

Новые статьи на почту?


Имя *
E-mail *
Поделиться Вконтакте
Отправить

Добавить комментарий

Ваш адрес email не будет опубликован.