| |||
ЗаключениеВ ходе выполнения дипломной работы, был проведён анализ различных подходов поиска и структурирования информации в существующих поисковых системах. В ходе анализа был выявлен ряд недостатков, например таких, как:
Однако, главным недостатком, который является следствием перечисленных, является низкое качество выдаваемых результатов. В связи с этим были рассмотрены вопросы создания новой ИПС, так называемой, распределённой системы поиска. Основной акцент при построении распределённой системы был сделан на повышение эффективности откликов системы на запрос пользователя. В предлагаемой ИПС это достигается путём осуществления контроля за качеством добавляемой информации. На этом этапе происходит разбиение индекса по тематикам с автоматической классификацией документов по тематикам. Вместе с тем, при классификации документов, происходит "грубый отсев" документов, не соответствующих тематике. Этим достигается уменьшение "информационного шума" в тематике, а следовательно и во всём индексе. Далее для понижения нагрузки на сеть и повышения эффективности операции поиска происходит выбор подмножества тематик, которые наиболее соответствуют данному запросу. То есть операция поиска выполняется не во всех коллекциях, а только в некотором подмножестве, что даёт сокращение времени поиска по индексу. Кроме того, выбор числа документов из каждой коллекции (тематики) осуществляется пропорционально вычисленным оценкам релевантности каждой тематики. Анализ предлагаемой новой информационно-поисковой показал, что применение распределённой системы поиска является наиболее эффективным способом осуществления информационного поиска. Теоретические расчёты, произведенные для упрощенных случаев с априорным заданием вероятностей, меры неопределённости системы и эффективности поиска, соответственно равны 7 бит и 0,99, доказывают состоятельность проведённых суждений. В соответствии с заданием на выпускную дипломную работу проведён анализ технического и программного обеспечения для реализации предлагаемой ИПС. Также был разработан и протестирован фрагмент программного комплекса для локального сервера. Результаты тестирования подтверждают полученные теоретические результаты. | |||
|