Отладка системы производилась локально, то есть программное
обеспечение клиента и сервера было установлено на одном компьютере,
функционирующем под управлением Microsoft Windows 2000 Professional.
Для отладки системы использован компьютер следующей конфигурации:
- Процессор Intel Pentium® с тактовой частотой 200 MHz,
- Объём оперативной памяти – 160 мегабайт,
- Тип оперативной памяти – SDRAM (Synchronous Dynamic Random Access
Memory – синхронная динамическая память с произвольным доступом),
- Конструктив оперативной памяти – DIMM (Dual In-line Memory Module),
- Жёсткие диски (HDD):
- Quantum Fireball Ex 3.2A Ultra DMA Mode-2 – 3.2 гигабайта,
- Quantum Fireball – 20 гигабайт.
- Тип файловой системы – FAT 16, FAT 32, NTFS.
- Видеокарта – S3 ViRGE/DX,
- Объём видеопамяти – 4 мегабайта.
Для обеспечения локального http-взаимодействия браузера и WWW-сервера
в условиях отсутствия сетевой карты с помощью апплета Network Панели
управления (Control Panel) на вкладке Adapters с помощью кнопки Add... был
добавлен MS Loopback Adapter.
Для комплексного тестирования системы составлен тестовый пример.
Позиция |
Ключевое слово |
1 |
Акци |
2 |
Власт |
3 |
Реклам |
4 |
Кокил |
5 |
Генетическ |
6 |
Инженери |
7 |
Клетк |
8 |
Азот |
9 |
Плазм |
10 |
Моцарт |
11 |
Звезд |
12 |
Цен |
13 |
Облигаци |
14 |
Вол |
15 |
Бог |
16 |
Температур |
Название |
Ключевые слова |
Биология |
Клетк, Плазм, Генетическ, Инженери |
Химия |
Плазм, Температур, Азот |
Физика |
Плазм, Инженери, Звезд, Температур, Кокил |
Неточные науки |
Акци, Облигаци, Цен, Власт, Вол, Бог, Реклам, Моцарт |
Название |
Вектор |
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 |
Биология |
0
0
0
0
1
1
1
0
1
0
0
0
0
0
0
0 |
Химия |
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
1 |
Физика |
0
0
0
1
0
1
0
0
1
0
1
0
0
0
0
1 |
Неточные науки |
1
1
1
0
0
0
0
0
0
1
0
1
1
1
1
0 |
Название |
Ключевые слова |
Генетическая инженерия |
Генетическ, Инженери |
Клетка |
Клетк |
Плазма |
Плазм, Температур |
Азот |
Азот |
Литьё в кокиль |
Кокил |
Звёзды |
Звезд |
Содержание |
Кокил |
Акция |
Акци, Облигаци, Предприяти, Цен |
Власть |
Власт, Вол, Бог |
Сущность и виды рекламы |
Реклам |
Моцарт |
Моцарт |
Название |
Вектор |
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 |
Генетическая инженерия |
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0 |
Клетка |
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0 |
Плазма |
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1 |
Азот |
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0 |
Литьё в кокиль |
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0 |
Звёзды |
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0 |
Содержание |
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0 |
Акция |
1
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0 |
Власть |
0
1
0
0
0
0
0
0
0
0
0
0
0
1
1
0 |
Сущность и виды рекламы |
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0 |
Моцарт |
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0 |
Расстояние Хэмминга – число отличающихся битов в двух бинарных
векторах.
Рубрика |
Биология |
Химия |
Физика |
Неточные науки |
Документ |
Генетическая инженерия |
2* |
5 |
5 |
10 |
Клетка |
3* |
4 |
6 |
9 |
Плазма |
4 |
1* |
3 |
10 |
Азот |
5 |
2* |
6 |
9 |
Литьё в кокиль |
5 |
4* |
5 |
9 |
Звёзды |
5 |
4 |
5 |
4 |
Содержание |
5 |
4 |
4 |
9 |
Акция |
7 |
6 |
8 |
5* |
Власть |
7 |
6 |
8 |
5* |
Сущность и виды рекламы |
5 |
4* |
6 |
7 |
Моцарт |
5 |
4* |
7 |
7 |
(*) Звёздочкой в таблице помечены веса, которые однозначно определяют
рубрику документа.
Для документов «Звёзды» и «Содержание» однозначно определить рубрику
не удаётся.
Рубрика |
Биология |
Химия |
Физика |
Неточные науки |
Документ |
Генетическая инженерия |
14* |
16 |
15 |
16 |
Клетка |
15* |
16 |
16 |
16 |
Плазма |
15 |
14 |
14 |
16 |
Азот |
16 |
15* |
16 |
16 |
Литьё в кокиль |
16 |
16 |
15* |
16 |
Звёзды |
16 |
16 |
15* |
16 |
Содержание |
16 |
16 |
15* |
16 |
Акция |
16 |
16 |
16 |
13* |
Власть |
16 |
16 |
16 |
13* |
Сущность и виды рекламы |
16 |
16 |
16 |
15* |
Моцарт |
16 |
16 |
16 |
15* |
(*) Звёздочкой в таблице помечены веса, которые однозначно определяют
рубрику документа.
Для документа «Плазма» определить единственную рубрику не удаётся, т.к.
с одинаковым успехом может быть выбрана либо рубрика «Химия», либо рубрика
«Физика».
В табл. 6.8 приводятся результаты моделирования, полученные рабочей
версией системы, в качестве меры близости векторов документов и рубрик
используется количество совпадений единиц.
Документ |
Рубрика |
Количество итераций нейронной сети |
Генетическая инженерия |
Биология |
10 |
Клетка |
Биология |
8 |
Плазма |
Не определена |
100* |
Азот |
Химия |
8 |
Литьё в кокиль |
Физика |
8 |
Звёзды |
Физика |
8 |
Содержание |
Физика |
8 |
Акция |
Неточные науки |
6 |
Власть |
Неточные науки |
6 |
Сущность и виды рекламы |
Неточные науки |
8 |
Моцарт |
Неточные науки |
8 |
(*) Если сеть не выдаёт единственную рубрику после 100 итераций, процесс
классификации останавливается с неопределённым результатом. Это сделано с той
целью, чтобы не допустить зацикливание процесса классификации.
Анализируя результаты моделирования, можно сделать вывод, что для
предоставленных документов сеть подобрала рубрику после 6-10 итераций.
|