"ЕВФРАТ-Документооборот" — первая в России СЭД, в которой реализованы принципы понимания документов. Система может сама, без участия человека, разбирать содержание документа и понимать его — выделять смысловые части. Понятая таким образом информация автоматически заносится в регистрационную карточку документа для дальнейшей работы с ним в СЭД. Подсистема понимания документов — новый уровень работы с содержанием, который позволяет качественно сократить объем рутинной работы с документами, традиционно выполняемойчеловеком.
В основу подсистемы "Понимание документов" легли результаты научных исследований компании в области анализа информации (синтаксический разбор, структурная модель представления знаний о языке, описание структурных связей). Кроме этого был учтен опыт, полученный в ходе создания информационных систем с модулями понимания документов для Пенсионного фонда РФ и ОАО "ММК".Специалистами Cognitive Technologies создано XML-представление делового документа, на базе которого осуществляется обучение системы "пониманию". Подсистема "Понимание документов" может обрабатывать поступившие в электронном виде документы текстового и графического (после распознавания) форматов или документы, поступившие в бумажном виде (после сканирования и распознавания). В настоящее время система обучена пониманию тех видов документов, потребность в массовой регистрации и учете которых в организациях наиболеевостребована: входящая корреспонденция и договоры по различным видам деятельности.Для договоров подсистема "Понимание документов" автоматически заполняет в "ЕВФРАТ-Документооборот" следующие реквизиты: дату заключения, названия компаний, заключающих соглашение, предмет договора, срок действия договора, количество страниц договора, кроме этого она автоматически определяет наличие приложений и дополнительных соглашений, прикрепляя соответствующие файлы к карточке документа. Для входящей корреспонденции система заносит в карточку дату, информацию о корреспонденте (название учреждения, ФИО, должность),адресата (название учреждения, ФИО, должность), краткое содержание, количество страниц.Подсистема "Понимание документов" доступна в рамках проектного решения при условии использования системы "ЕВФРАТ-Документооборот". Комплекс работ по внедрению включает:1. изучение вида и структуры документа;2. определение информация для "понимания";3. создания XML-модели документа;4. обучение системы "ЕВФРАТ-Документооборот" пониманию.
Время обучения подсистемы "Понимание документов" для одного вида документов составляет около одной недели."В первую очередь, потенциальными потребителями продукта станут организации, придерживающиеся в своей работе ГОСТов или имеющие четкие внутренние регламенты по виду и типу используемых документов", — комментирует выпуск подсистемы "Понимание документов" руководитель направления электронного документооборота Cognitive Technologies Михаил Потапенко.
По словам вице-президента по маркетингу и общественным коммуникациям Cognitive Technologies Н. Никольского: "Сегодня развитие СЭД, как и других ИС, невозможно без активного внедрения новых технологий работы с содержанием (контентом). Ведь, несмотря на мощность современных ПК, они до сих пор не могут решать огромное количество задач, связанных с интеллектуальной обработкой информации, интуитивно понятных человеку. Понимание документов в СЭД "ЕВФРАТ-Документооборот" — первый, но очень важный шаг на пути массовогораспространения технологий контентного документооборота".
В планах по развитию возможностей понимания документов в СЭД "ЕВФРАТ-Документооборот" стоит обеспечение более глубокой интеграции технологий понимания в систему для организации процессов движения документов и контроля исполнения, внедрение самообучающихся алгоритмов понимания, подключение нового аппарата морфологического разбора и анализатора структурных связей, разрабатываемых в лабораториях компании.