НазадСодержаниеВперёд

Заключение

В ходе выполнения дипломной работы, был проведён анализ различных подходов поиска и структурирования информации в существующих поисковых системах. В ходе анализа был выявлен ряд недостатков, например таких, как:

  • Неконтролируемое качество добавляемой информации;
  • Большое количество "информационного шума".

Однако, главным недостатком, который является следствием перечисленных, является низкое качество выдаваемых результатов.

В связи с этим были рассмотрены вопросы создания новой ИПС, так называемой, распределённой системы поиска.

Основной акцент при построении распределённой системы был сделан на повышение эффективности откликов системы на запрос пользователя. В предлагаемой ИПС это достигается путём осуществления контроля за качеством добавляемой информации.

На этом этапе происходит разбиение индекса по тематикам с автоматической классификацией документов по тематикам. Вместе с тем, при классификации документов, происходит "грубый отсев" документов, не соответствующих тематике. Этим достигается уменьшение "информационного шума" в тематике, а следовательно и во всём индексе.

Далее для понижения нагрузки на сеть и повышения эффективности операции поиска происходит выбор подмножества тематик, которые наиболее соответствуют данному запросу. То есть операция поиска выполняется не во всех коллекциях, а только в некотором подмножестве, что даёт сокращение времени поиска по индексу. Кроме того, выбор числа документов из каждой коллекции (тематики) осуществляется пропорционально вычисленным оценкам релевантности каждой тематики.

Анализ предлагаемой новой информационно-поисковой показал, что применение распределённой системы поиска является наиболее эффективным способом осуществления информационного поиска. Теоретические расчёты, произведенные для упрощенных случаев с априорным заданием вероятностей, меры неопределённости системы и эффективности поиска, соответственно равны 7 бит и 0,99, доказывают состоятельность проведённых суждений.

В соответствии с заданием на выпускную дипломную работу проведён анализ технического и программного обеспечения для реализации предлагаемой ИПС. Также был разработан и протестирован фрагмент программного комплекса для локального сервера. Результаты тестирования подтверждают полученные теоретические результаты.

НазадСодержаниеВперёд
Используются технологии uCoz