Модели и алгоритмы эффективной обработки и поиска информации в иерархических базах знаний с динамически управляемой структурой

  • Автор:
  • Специальность ВАК РФ: 05.13.01
  • Научная степень: Кандидатская
  • Год защиты: 2008
  • Место защиты: Москва
  • Количество страниц: 173 с.
  • бесплатно скачать автореферат
  • Стоимость: 250 руб.
Титульный лист Модели и алгоритмы эффективной обработки и поиска информации в иерархических базах знаний с динамически управляемой структурой
Оглавление Модели и алгоритмы эффективной обработки и поиска информации в иерархических базах знаний с динамически управляемой структурой
Содержание Модели и алгоритмы эффективной обработки и поиска информации в иерархических базах знаний с динамически управляемой структурой
Оглавление
Введение
Глава 1. Анализ моделей и систем поиска и обработки информации в базах знаний
1.1 Основные модели представления и обработки знаний
1.2 Анализ информационных моделей гипертекстовой информации
1.3 Классификация, основные характеристики и критерии эффективности информационно-поисковых систем
1.4 Обзор функциональных возможностей современных информационно-поисковых систем
1.5 Анализ моделей поиска информации в БЗ
1.6 Постановка целей и задач диссертационного исследования
Выводы по главе
Глава 2. Разработка моделей обработки и расширенного поиска информации в иерархических базах знаний
2.1 Разработка модели предварительной обработки документов по критерию тематической близости
2.2 Создание модели автоматизированного анализа текста документа в иерархических базах знаний
2.3 Формализация задачи поиска информации в иерархических БЗ
2.4 Разработка фреймовой модели шаблона полнотекстового документа
2.5 Разработка модели поискового образа документа
Выводы по главе
Глава 3. Алгоритмическая реализация моделей поиска и обработки информации в иерархических базах знаний
3.1 Разработка алгоритма построения поискового образа документа
3.2 Разработка алгоритма построения расширенного поискового запроса

3.3 Разработка архитектуры полнотекстовой информационнопоисковой системы
3.4 Моделирование экспертной системы поиска документированной информации в БЗ
Выводы по главе
Глава 4. Разработка иерархической базы знаний с динамически управляемой структурой и результаты экспериментальных исследований механизмов поиска в ней
4.1 Особенности моделирования иерархических баз знаний на основе теории графов
4.2 Разработка графовой модели иерархической базы знаний с динамически управляемой структурой
4.3 Моделирование процесса обучения на основе иерархической базы знаний с динамически управляемой структурой
4.4 Имитационное моделирование и результаты экспериментальных исследований эффективности предложенных механизмов поиска информации в иерархических базах знаний
Выводы по главе
Заключение
Список литературы
Приложение 1. Акт внедрения результатов диссертационной работы
Приложение 2. Фрагмент программной реализации графовой модели иерархической базы знаний
Приложение 3. Фрагмент программного сценария процесса обучения на основе иерархической базы знаний

Глава 1. Анализ моделей и систем поиска и обработки информации в базах знаний.
1.1 Основные модели представления и обработки знаний
В настоящее время существует устойчивая тенденция интеллектуализации компьютеров и их программного обеспечения (ПО), связанная с решением задач все в большей степени невычислительного характера, в том числе логический вывод, управление базами знаний (БЗ), обеспечение интеллектуальных интерфейсов и др. При этом одной из определяющих задач, связанных с реализацией современных интеллектуальных систем, является функция представления и обработки знаний о некоторой предметной области [15].
В данной трактовке знания представляют собой совокупность сведений об объектах этой ПрО, их существенных свойствах и связывающих их отношениях, процессах, протекающих в данной ПрО, а также методах анализа возникающих в ней ситуаций и способах разрешения ассоциируемых с ними проблем.
Создание БЗ и в теории, и в практике ИИ сегодня является проблемой такой же важности, как в свое время в информационных технологиях проблема создания БД [15, 16].
Под базой знаний понимается семантическая модель, предназначенная для представления в ЭВМ знаний, накопленных человеком в определенной ПрО. На технологическом уровне БЗ рассматривается как хранилище (репозиторий) сложно структурированных информационных единиц (знаний).
Говоря о БЗ, мы всегда будем соотносить ее со знаниями о некоторой ПрО (одной или нескольких). При этом под ПрО может пониматься и некоторый класс решаемых задач.
По аналогии с технологией БД будем различать собственно информационное хранилище знаний (БЗ) и систему управления БЗ (СУБЗ), обеспечивающую набор типовых функций хранения и манипулирования знаниями [15].

ный логический запрос, учитывающий и структуру, и смысловое содержание документа.
Все запросы могут быть сохранены в базе данных для последующего редактирования и повторного использования. На их основе может быть построен рубрикатор. Результаты поиска отображаются в виде списка найденных документов. По умолчанию список отсортирован по релевантности, однако, может быть задан любой другой критерий сортировки (по значению атрибутов, по времени добавления в индекс и т. п.) — в том числе и составной. Отчет может быть иерархически сгруппирован по атрибутам документов (соответственно, при группировке отчета по атрибуту «Источник» отчет представляет собой дерево, первый уровень которого содержит список всех источников, к которым принадлежат найденные документы, а второй — сами документы). Если за сутки в архив добавляется значительное количество документов, пользователю может быть нелегко отслеживать изменения в интересующей его области. Решению этой задачи призван помочь сервер рубрикации. По мере поступления документов он распределяет их по тематическим рубрикам (категориям) в соответствии с ранее введенными запросами. При этом один документ может входить в несколько рубрик. В дальнейшем рубрики могут использоваться для ограничения зоны действия поискового запроса, формируя тем самым логическую структуру хранилища документов.
К недостаткам данной системы следует отнести то, что она основана на использовании заранее предопределенных семантических сетей, построенных на лингвистических особенностях конкретного языка с применением весовых коэффициентов слов. Адаптация таких технологий на работу с другими языками достаточно сложна и требует значительных усилий в области лингвистических исследований. Это приводит к тому, что упомянутые технологии поддерживают ограниченное количество языков.
Таким образом, практически все современные информационно-поисковые системы обладают следующими ключевыми недостатками: низкое качество поиска при неоднозначности описании предмета поиска (что присуще болынин-

Рекомендуемые диссертации данного раздела