Метод и алгоритмы интеллектуальной обработки информации в корпоративных хранилищах

  • Автор:
  • Специальность ВАК РФ: 05.13.01
  • Научная степень: Кандидатская
  • Год защиты: 2012
  • Место защиты: Владимир
  • Количество страниц: 143 с. : ил.
  • бесплатно скачать автореферат
  • Стоимость: 250 руб.
Титульный лист Метод и алгоритмы интеллектуальной обработки информации в корпоративных хранилищах
Оглавление Метод и алгоритмы интеллектуальной обработки информации в корпоративных хранилищах
Содержание Метод и алгоритмы интеллектуальной обработки информации в корпоративных хранилищах
Оглавление
Введение
1. Автоматический семантический анализ в текстовых информационных хранилищах
1.1 Подходы к поиску текстовой информации в сфере компьютерных технологий
1.2 Исследовательские системы семантического поиска информации
1.2.1 Система поиска и обработки информации Webcompass
1.2.2 Система MARRI
1.2.3 Система OntoSeek
1.3 Методы семантической обработки информации
Выводы по главе
2. Метод и алгоритмы интеллектуальной обработки информации на основе интенсиональной логики
2.1. Язык интенсиональной логики
2.2 Перевод естественно-языковых выражений на язык интенсиональной логики
2.3 Метод автоматической семантической обработки информации на основе формальной семантики
2.3.1 Алгоритм формализации естественно-языковой фразы на основе формальной семантики
2.3.2 Построение функции интерпретации формулы интенсиональной логики для БЗ
2.3.3 Алгоритм заполнения БЗ на основе анализа ЕЯ текстов средствами логики Монтегю ..62 Выводы по главе
3. Разработка мультиагентной системы интеллектуального поиска информации на промышленном предприятии
3.1. Фоновые знания как необходимый элемент процесса семантического поиска
3.2 Алгоритмы интеллектуального поиска текстовой информации
3.2.1 Алгоритм расширения поискового запроса пользователя на основе БЗ
3.2.2 Алгоритм поиска на основе интерпретации формулы логики Монтегю на БЗ
3.3 Концепция системы мультиагентной системы поиска информации масштаба предприятия
3.3.1 Концептуальная модель МАСПИ
3.3.2 Логическая модель МАСПИ
3.3.3 Алгоритмы функционирования МАСПИ
Выводы по главе
4. Реализация прототипа маспи

4.1. Реализация атомарных функций алгоритмов семантической обработки
4.2 Программная реализация поисковых систем на предприятиях ОАО «Соколстром» и ОАО «Сокольский целлюлозно-бумажный комбинат»
4.3 Результаты внедрения программных средств интеллектуального поиска
Выводы по главе
Список источников
Приложения
Введение
Актуальность темы. Эффективность работы современного промышленного предприятия в информационном обществе зависит от скорости и качества удовлетворения потребностей в служебной информации каждого из сотрудников. Информационные хранилища корпоративных информационных систем (КИС) могут достигать огромных размеров, что сильно затрудняет поиск. Часто необходимая информация распределена по различным информационным системам внутри предприятия. Основные причины этого: различие используемой терминологии и специфическая структура хранимой информации. Возникает парадоксальная ситуация, когда пользователь имеет доступ к информации, но не может ее получить. Стала актуальной проблема теоретического рассмотрения и практической реализации механизмов и средств автоматизации поиска информации в КИС.
Интеллектуальная обработка текстовой информации охватывает широкий круг проблем, таких как формализация текстовых данных, способы извлечения знаний из данных, методы отображения предметной области, которым посвящены работы Э. Баха, Т. А. Гавриловой, Т. Р. Груббера, Г. С. Осипова, Н. Хомского, В. Ф. Хорошевского.
Важной частью изучения семантики является изучение языковых средств передачи смысла. В области изучения синтаксиса и семантики русского языка следует выделить работы Ю. Д. Апресяна, Н. Д. Арутюновой, Г. А. Золотовой, А. А. Леонтьева, Е. В. Падучевой, Н. Ю. Шведовой.
Для моделирования и информационной поддержки распределенных процессов автор использует технологию мультиагентных систем (MAC), исследования в области которых проводились такими учеными, как М. Вулдридж, В.И. Городецкий, Н. Дженнингс, A.B. Костров, X. С. Ивана, Д.А. Поспелов, В.Б. Тарасов, А. Н. Швецов.
Общие вопросы управления промышленным предприятием освещены в работах Д.В. Александрова, В.В. Кульбы, Р.И. Макарова, А.Г. Мамиконова, Б.Я. Советова, В.Д. Чертовского и др.
Целью диссертационного исследования является упрощение процессов информационного поиска для конечного пользователя и повышение эффективности удовлетворения его поисковых потребностей.
Для достижения поставленной цели в работе были поставлены и решены следующие задачи:
1. Исследование существующих принципов интеллектуальной обработки информации на промышленных предприятиях.

Видим, что такое представление объединяет оба описанных выше направления в изучении семантики, т. к. с одной стороны использует ментальные представления, а с другой говорит о необходимости учитывать знания О и П. Такой подход позволяет говорить о возможности создания технической системы, производящей поиск информации на основе формализованных представлений пользователя о необходимом смысле разыскиваемого текста.
В качестве формального описания используем аппарат интенсиональной логики Р. Монтегю. Обладая всеми достоинствами подхода Хомского (строгая формализация и однозначность), используемый Монтегю подход отделяет интерпретацию в отдельный логический слой. Тем самым единый текст может по разному интерпретироваться в разных картинах мира разных пользователей [53, 54, 55].
Поисковая машина на основе логики смысла будет осуществлять обратный логический вывод определенного правила или заданного условия. Идея обратного логического вывода заключается в проверке справедливости (выводимости) гипотезы (некоторого факта или суждения), которая выдвигается пользователем в качестве запроса и проверяется компьютером в процессе вывода [6]. При этом стоит отменить, что для задачи семантического поиска мало применима двоичная логика, т. к. достаточно редко мы можем обнаружить текст, удовлетворяющий полностью поисковому запросу. Кроме того, при использовании двоичной логики становится неразрешимой дилемма сортировки результатов запроса относительно их релевантности.
Необходимо расширение двоичной логики до к-значной [13] или континуальной. У обоих этих видов логик есть свои преимущества и недостатки, к-значные логики проще реализуются, легко задаются. Кроме того, целочисленные операции менее ресурсоемки, чем операции с плавающей точкой. Однако континуальные логики более естественно отражают принадлежность текста нечетким критериям, которые может выразить пользователь в словесной форме. В качестве континуальной логики логично использовать нечеткую логику Л. Заде [16].
При таком подходе большое внимание следует уделять процессу формализации текстов (фактический, это процесс извлечения знаний из текстов) для дальнейшего вывода на этих данных. В зависимости от выбранного метода представления знаний будет подобран и конкретный алгоритм логического вывода [9].
Выводы по главе
В первой главе рассмотрены существующие системы семантического поиска, производится их классификация и рассматриваются различные перспективные поисковые

Рекомендуемые диссертации данного раздела