Ученые корпорации Xerox изобрели программное обеспечение, которое обладает искусственным интеллектом для прочтения электронных документов. Программа самостоятельно в автоматическом режиме осуществляет тематическую классификацию материалов с последующей их маршрутизацией на нужные адреса электронной почты или в онлайновые документарные системы.
Инструменты по категоризации электронных документов, предлагаемые сегодня на рынке, осуществляют автономное архивирование по каждой теме в отдельности, на основе так называемого линейного принципа. Например, такие понятия как <биохимия> и <биофизика> с человеческой точки зрения являются смежными темами, однако система линейной категоризации не выявляет между ними никакого сходства. В отличие от уже существующих систем, новая разработка Xerox строится на иерархической модели классификации, позволяющей устанавливать логическую связь между двумя тематическими категориями и тем самым классифицировать документ более разумно с информационной точки зрения. С ее помощью легко трансформировать беспорядочный массив электронной информации в четко структурированный архив документов по нужной тематике. Данная система способна к самообучению и усвоению совершенно новых категорий без всякого вмешательства оператора. Механизм категоризации самостоятельно идентифицирует новые или прогнозируемые тематические разделы и в рабочем порядке предлагает выявленные новые категории на усмотрение пользователя.
Система категоризации электронных документов, предложенная компанией Xerox способна обрабатывать документы на 20 иностранных языках и ее можно настроить для выполнения конкретных задач пользователя. ПО осуществляет интеллектуальную переадресацию документов нужному абоненту с помощью индивидуально заданной конфигурации.
Технология разработана учеными Европейского научно-исследовательского центра Xerox на основе знаний и опыта в области лингвистического анализа и методов машинного обучения. Программа создана на платформе Java и совместима с различными операционными системами включая UNIX, Linux и Windows.
Компания Xerox планирует лицензирование данной технологии для поставщиков программного обеспечения или корпораций желающих интегрировать ее в существующие системы документооборота для оптимизации клиентского сервиса, архивирования информации и управления данными.
Обозрение "Terra & Comp".