На конференции «ИТ на службе оборонно-промышленного комплекса», которая проходит в эти дни в городе Иннополисе, Объединенная приборостроительная корпорация объявила о старте масштабного исследовательского проекта в области искусственного интеллекта и семантического анализа данных с участием более 30 российских компаний, образовательных и научных организаций.
Участники проекта получили бесплатный доступ к уникальной разработке – недавно анонсированному лингвистическому процессору Ontosminer. С его помощью исследователи будут развивать технологии интеллектуального анализа текстов в самых различных сферах – от мониторинга СМИ до обработки научных данных и бизнес-аналитики.
Наряду с корпорацией организатором проекта выступает российская компания-разработчик интеллектуального программного обеспечения «Авикомп Сервисез». Проект реализуется при поддержке компании «Т-Платформы», которая предоставила для размещения лингвистического процессора высокопроизводительный сервер, позволяющий работать с большими объемами информации.
По словам директора департамента инновационного развития Объединенной приборостроительной корпорации Александра Калинина, создание искусственного интеллекта является одним из основных трендов развития ИТ-технологий во всем мире. «Неоднократно высказывалось мнение, что технологии искусственного интеллекта гораздо опаснее, чем существующие виды вооружений. Главные конкуренты России в этой области на государственном уровне – США и Китай, на корпоративном – Google, Facebook, Apple и Baidu, осуществляющие масштабное инвестирование подобных проектов. В США это направление финансируется из бюджетов DARPA, IARPA, In-Q-Tel и еще около двадцати специализированных венчурных фондов. В нашей стране эти технологии только начинают развиваться, но процесс их развития набирает обороты», – пояснил Александр Калинин.
Российская система семантического анализа данных базируется на последних достижениях в области машинного обучения и технологий Big Data. Обрабатывая массивы данных, компьютер учится понимать морфологию, синтаксис языка, семантику слов и целых текстов. На основе этих «знаний» вычислительная машина осуществляет поиск необходимых пользователю новостей, статей, документов в интернет-источниках и различных информационных хранилищах. В отличие от традиционных поисковых систем, Ontosminer находит нужные сведения не по отдельным ключевым словам, а по смыслу целого документа, заданного в качестве запроса. Изучив весь объем данных и сформировав необходимую подборку, лингвистический процессор способен автоматически составить краткий аналитический отчет с описанием сути вопроса или события.
«Это умная система, способная без участия человека решать самые серьезные аналитические и прикладные задачи в разных сферах деятельности – в бизнесе, госуправлении, силовых ведомствах, здравоохранении, образовании, науке и т.д.», – комментирует Александр Калинин.
Среди участников проекта – Высшая школа экономики, Вычислительный центр РАН, Научно-исследовательский и испытательный центр биометрической техники МГТУ им. Баумана, Научно-техническое общество нефтяников и газовиков имени И.М. Губкина, Тихоокеанский госуниверситет, Ярославский государственный университет, Волгоградский государственный технический университет, Центральный НИИ экономики, информатики и систем управления, редакции нескольких федеральных СМИ, ряд других организаций, государственных и частных компаний, работающих в сфере информационных услуг, разработки ПО, энергетики, юриспруденции.
«Сейчас через лингвистический процессор пропущены десятки миллионов документов – в основном, публикаций СМИ. Цифра выглядит внушительно, но пока это достаточно скромная база «знаний». Этот показатель должен постоянно и кратно расти за счет ввода в систему новых данных из различных областей, что позволит дальше наращивать и совершенствовать ее аналитические способности. Именно эту задачу призван решить наш проект при участии многочисленных партнеров, которым открыт доступ к нашей системе», – комментирует Александр Калинин.
Источник: Ростех