Наверх   Информация   Содержание   Плакаты  

6. Экспериментальная часть

6.1. Отладка

Отладка системы производилась локально, то есть программное обеспечение клиента и сервера было установлено на одном компьютере, функционирующем под управлением Microsoft Windows 2000 Professional.

Для отладки системы использован компьютер следующей конфигурации:

  • Процессор Intel Pentium® с тактовой частотой 200 MHz,
  • Объём оперативной памяти – 160 мегабайт,
  • Тип оперативной памяти – SDRAM (Synchronous Dynamic Random Access Memory – синхронная динамическая память с произвольным доступом),
  • Конструктив оперативной памяти – DIMM (Dual In-line Memory Module),
  • Жёсткие диски (HDD):
  • Quantum Fireball Ex 3.2A Ultra DMA Mode-2 – 3.2 гигабайта,
  • Quantum Fireball – 20 гигабайт.
  • Тип файловой системы – FAT 16, FAT 32, NTFS.
  • Видеокарта – S3 ViRGE/DX,
  • Объём видеопамяти – 4 мегабайта.

Для обеспечения локального http-взаимодействия браузера и WWW-сервера в условиях отсутствия сетевой карты с помощью апплета Network Панели управления (Control Panel) на вкладке Adapters с помощью кнопки Add... был добавлен MS Loopback Adapter.

6.2. Тестовый пример

Для комплексного тестирования системы составлен тестовый пример.

6.2.1. Словарь ключевых слов рубрик

Таблица 6.1

Позиция Ключевое слово
1 Акци
2 Власт
3 Реклам
4 Кокил
5 Генетическ
6 Инженери
7 Клетк
8 Азот
9 Плазм
10 Моцарт
11 Звезд
12 Цен
13 Облигаци
14 Вол
15 Бог
16 Температур

6.2.2. Ключевые слова рубрик

Таблица 6.2

Название Ключевые слова
Биология Клетк, Плазм, Генетическ, Инженери
Химия Плазм, Температур, Азот
Физика Плазм, Инженери, Звезд, Температур, Кокил
Неточные науки Акци, Облигаци, Цен, Власт, Вол, Бог, Реклам, Моцарт

6.2.3. Двоичные вектора рубрик

Таблица 6.3

Название Вектор
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Биология 0 0 0 0 1 1 1 0 1 0 0 0 0 0 0 0
Химия 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 1
Физика 0 0 0 1 0 1 0 0 1 0 1 0 0 0 0 1
Неточные науки 1 1 1 0 0 0 0 0 0 1 0 1 1 1 1 0

6.2.4. Ключевые слова документов

Таблица 6.4

Название Ключевые слова
Генетическая инженерия Генетическ, Инженери
Клетка Клетк
Плазма Плазм, Температур
Азот Азот
Литьё в кокиль Кокил
Звёзды Звезд
Содержание Кокил
Акция Акци, Облигаци, Предприяти, Цен
Власть Власт, Вол, Бог
Сущность и виды рекламы Реклам
Моцарт Моцарт

6.2.5. Двоичные вектора документов

Таблица 6.5

Название Вектор
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Генетическая инженерия 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0
Клетка 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
Плазма 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1
Азот 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
Литьё в кокиль 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
Звёзды 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0
Содержание 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
Акция 1 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0
Власть 0 1 0 0 0 0 0 0 0 0 0 0 0 1 1 0
Сущность и виды рекламы 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
Моцарт 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0

6.2.6. Мера близости - расстояние Хэмминга

Расстояние Хэмминга – число отличающихся битов в двух бинарных векторах.

Таблица 6.6

Рубрика Биология Химия Физика Неточные науки
Документ
Генетическая инженерия 2* 5 5 10
Клетка 3* 4 6 9
Плазма 4 1* 3 10
Азот 5 2* 6 9
Литьё в кокиль 5 4* 5 9
Звёзды 5 4 5 4
Содержание 5 4 4 9
Акция 7 6 8 5*
Власть 7 6 8 5*
Сущность и виды рекламы 5 4* 6 7
Моцарт 5 4* 7 7

(*) Звёздочкой в таблице помечены веса, которые однозначно определяют рубрику документа.

Для документов «Звёзды» и «Содержание» однозначно определить рубрику не удаётся.

6.2.7. Мера близости - количество несовпадений единиц

Таблица 6.7

Рубрика Биология Химия Физика Неточные науки
Документ
Генетическая инженерия 14* 16 15 16
Клетка 15* 16 16 16
Плазма 15 14 14 16
Азот 16 15* 16 16
Литьё в кокиль 16 16 15* 16
Звёзды 16 16 15* 16
Содержание 16 16 15* 16
Акция 16 16 16 13*
Власть 16 16 16 13*
Сущность и виды рекламы 16 16 16 15*
Моцарт 16 16 16 15*

(*) Звёздочкой в таблице помечены веса, которые однозначно определяют рубрику документа.

Для документа «Плазма» определить единственную рубрику не удаётся, т.к. с одинаковым успехом может быть выбрана либо рубрика «Химия», либо рубрика «Физика».

6.2.8. Автоматическая классификация документов

В табл. 6.8 приводятся результаты моделирования, полученные рабочей версией системы, в качестве меры близости векторов документов и рубрик используется количество совпадений единиц.
Таблица 6.8

Документ Рубрика Количество итераций нейронной сети
Генетическая инженерия Биология 10
Клетка Биология 8
Плазма Не определена 100*
Азот Химия 8
Литьё в кокиль Физика 8
Звёзды Физика 8
Содержание Физика 8
Акция Неточные науки 6
Власть Неточные науки 6
Сущность и виды рекламы Неточные науки 8
Моцарт Неточные науки 8

(*) Если сеть не выдаёт единственную рубрику после 100 итераций, процесс классификации останавливается с неопределённым результатом. Это сделано с той целью, чтобы не допустить зацикливание процесса классификации.

Анализируя результаты моделирования, можно сделать вывод, что для предоставленных документов сеть подобрала рубрику после 6-10 итераций.

  Наверх   Информация   Содержание   Плакаты  
Для писем: kes@narod.ru
 
Используются технологии uCoz