Подсистема поиска и индексирования документов в базе данных
дипломные работы, Информатика, программирование Объем работы: 137 стр. Год сдачи: 2012 Стоимость: 2000 руб. Просмотров: 776 | | |
Оглавление
Заключение
Заказать работу
1 ИССЛЕДОВАНИЕ СПОСОБОВ ПОИСКА И ИНДЕКСИРОВАНИЯ ДОКУМЕНТОВ В БАЗАХ ДАННЫХ
1.1 Способы поиска информации
1.1.1 Последовательный поиск
1.1.2 Поиск в упорядоченном файле
1.1.3 Бинарный поиск
1.1.4 Поиск Фиббоначи
1.1.5 Интерполяционный поиск
1.2. Алгоритм индексации
1.3. Заключение
2 ПРОЕКТИРОВАНИЕ ПОДСИСТЕМЫ ИНДЕКСАЦИИ И ПОИСКА ДОКУМЕНТОВ В БАЗЕ ДАННЫХ
2.1. Выбор средств проектирования и способа организации данных
2.1.1. Обоснование выбора средств проектирования
2.1.2. Обоснование выбора способов организации данных
2.2. Разработка структурной схемы поискового модуля
2.2.1. Функциональный состав поискового модуля
2.2.2. Структуры данных организующие входную информацию модуля
2.2.3. Структуры данных организующие выходную информацию модуля
2.2.4. Структуры хранения данных на внешнем носителе
2.2.5. Построение структурной схемы модуля поиска документов
2.3 Разработка иерархии классов поискового модуля
2.3.1. Разработка служебных классов
2.3.2. Разработка иерархии классов модуля индексации
2.3.3. Разработка иерархии классов модуля поиска
2.4 Математическое моделирование модуля поиска и индексации
3 РАЗРАБОТКА МЕТОДИКИ ТЕСТИРОВАНИЯ МОДУЛЯ
3.1. Определение подхода к тестированию разрабатываемой системы
3.2. Определение этапов обработки информации
3.3. Формулирование критериев достоверности
3.4. Разработка последовательности тестирования
3.5. Разработка алгоритма проведения тестирования
3.6 Практическое исследование эффективности алгоритмов
4 ОРГАНИЗАЦИОННО-ЭКОНОМИЧЕСКАЯ ЧАСТЬ
4.1. Перечень основных работ
4.2. Таблица взаимосвязей событий и работ
4.3. Диаграмма Гантта для предлагаемого плана разработки
4.4. Определение себестоимости разработки
4.4.1. Основная заработная плата персонала
4.4.2. Отчисления по заработной плате
4.4.3. Расходные материалы
4.4.4. Оборудование
4.4.5. Затраты на амортизацию оборудования
4.4.6. Накладные расходы
4.4.7. Дополнительная заработная плата
4.4.8. Аренда...
Результатом проделанной работы является модуль поиска и индексации для информационной системы, использующий исследованные методы поиска данных и индексирования текстовой информации.
1. В реализации модуля используются следующие механизмы поиска при решении частных подзадач.
в индексном файле для поиска документов применяются B-деревья
для доступа к элементам стоп - словаря и словаря окончаний выбраны деревья, реализующие бинарный поиск
в механизме индексации текстов документов используется случайное бинарное дерево для группировки слов
при организации пересечения списков найденных документов так же используются случайные бинарные деревья
ряд задач, таких как нахождение наибольшего элемента списка, решается методом последовательного поиска
Выбор того или иного метода осуществлялся в соответствии с выводами, заключенными после анализа существующих методов поиска по одиночному ключу (раздел «Способы организации поисковых структур» ).
2. В реализации потекстового поиска документов использован один из рассмотренных критериев определения значимости терминов поискового запроса (критерий максимума дисперсии частоты встречаемости). Выбор критерия осуществлялся в соответствии с вы-водами, заключенными после анализа существующих методов взвешивания терминов (раздел «Механизмы поиска текстовых документов»).
3. Разработаны и реализованы методы расширения поискового запроса. Предложен алгоритм хеширования по сигнатуре слов для организации нечеткого поиска.
4. При проектировании модуля поиска документов были разработаны:
алгоритмы индексирования и поиска документов;
функциональная и структурная схемы модуля;
иерархия классов языка C++, реализующая функциональную схему;
программная реализация методов разработанных классов;
интерфейс модуля, обеспечивающий его включение в проект информационной системы.
5. В соответствии с назначением разработанного модуля были...
После офорления заказа Вам будут доступны содержание, введение, список литературы*
*- если автор дал согласие и выложил это описание.