Видове невронни мрежи

от Администрация и управление
Направо към: навигация, търсене

Основните типове модели на невронни мрежи са няколко.

Според типологията на мрежата

Най-често срещани са невронните мрежи, съставени от няколко обособени (последователни) слоя от елементи, при които елементите от най-ниския слой играят ролята на входни устройства на мрежата (те възприемат сигнали от външната среда), а елементите от най-горния слой играят ролята на изходни устройства на мрежата (те извеждат резултата от работата на мрежата, който се получава на базата на входните сигнали и теглата на връзките между елементите). Обикновено при тези НМ връзките са еднопосочни и свързват елементите от един слой с елементи на слоя, разположен непосредствено над него. В зависимост от броя на слоевете в мрежата се говори за двуслойни невронни мрежи (при тях има само един входен и един изходен слой и липсват т. нар. вътрешни или скрити слоеве) и многослойни невронни мрежи (при тях има поне един скрит слой).

Според параметрите на елементите

Фиг. 1 Архитектура на невронните мрежи с право разпространение

Тук от значение са посоката и теглата на връзките, видът на активационната функция и др. Както беше посочено, при повечето НМ връзките са еднопосочни и са ориентирани от елементите от даден слой към елементите от слоя, разположен непосредствено над него (това са т. нар. прави мрежи). Съществуват обаче и т. нар. рекурентни мрежи (такива са например мрежите на Хопфийлд), при които всеки елемент е свързан с двупосочни връзки с всички свои съседи. При тези мрежи понятието слой до голяма степен губи своя смисъл. По отношение на теглата на връзките се говори за т. нар. възбуждащи връзки (връзки с положителни тегла) и подтискащи връзки (връзки с отрицателни тегла). Най-често срещаните типове активационни функции са стъпаловидна функция (при персептрона) и сигмоид (при НМ с обратно разпространение на грешката).

Според типа на входните и изходните стойности

Входните стойности на мрежата (т.е. сигналите, които получават елементите от входния слой) могат да бъдат двоични (0 или 1) или аналогови (реални числа). Същото се отнася и за изходните стойности на мрежата (стойностите/сигналите, които елементите от изходния слой извеждат към “околната среда”). В случай, че изходните стойности на мрежата трябва да бъдат двоични, се налагат допълнителни изисквания към вида на активационната функция.

Според обучаващото правило

Най-често невронните мрежи се използват за решаване на задачи, свързани с разпознаване (класификация). При това създаването на невронна мрежа, предназначена за решаване на дадена конкретна задача, обикновено се извършва по следната обща схема. Най-напред се определя топологията на мрежата, т.е. броят на слоевете и броят на елементите във всеки слой. Броят на елементите от входния слой се определя от размерността на входните данни, а броят на елементите от изходния слой – от броя на разпознаваните класове. Броят и размерите на скритите слоеве се определят итеративно в зависимост от предметната област и конкретната задача. След определянето на топологията на мрежата се преминава към нейното обучаване, т.е. към определянето на подходящи стойности на теглата на връзките между елементите. За целта най-често отначало се задават случайни стойности на търсените тегла, след което те итеративно се променят (уточняват) по такъв начин, че на следващата стъпка новият изход на мрежата да бъде по-добър от стария. Правилото, по което се променят теглата на връзките, се нарича обучаващо правило (обучаващ алгоритъм) на мрежата. Примери за по-известни обучаващи правила: правило за обучение на персептрона (алгоритъм за обучение с фиксирано нарастване), алгоритъм за обучение с обратно разпространение на грешката, правило на състезателното обучение.

Според метода на обучение

Съществуват два основни типа обучение на невронните мрежи – обучение с учител и обучение без учител. При обучението с учител се следи разликата между получения и очаквания изход на мрежата (учителят задава очаквания изход на мрежата) и итеративно се извършват корекции на теглата на връзките съгласно избраното обучаващо правило. При обучението без учител липсват данни за правилния изход на мрежата. Теглата на връзките се настройват така, че представянето на данните в мрежата да е най-добро съгласно използвания (зададения) критерий за качеството на представянето.

Вижте още

Източници

  • (en) Portogal, M ., “Neural network versus time series methods: a forecasting exercise”, 14 th International symposium on forecasting, Stockholm, Sweden, 1995. – Използване на невронните мрежи за прогнозиране
  • (en) Remus, W., O`Connor, M., “Neural network time-series forecasting”, in Armstrong, J . (Ed.) “Principles of forecasting: a handbook for researchers and practitioners”, Kluwer Academic Publishers , 2001, pp. 245-256. – Невронни мрежи и принципи на прогнозиране
  • (en) Thiesing, F., Vornberger, O., “Sales forecasting using neural networks”, IEEE (eds.), ICNN 1997, Houston, Texas, 9-12 June 1997, Vol. 4, pp. 2125-2128. – Използване на невронни мрежи при прогнозиране на продажбите
  • (en) Van Wezel, M., Baets W. , “ Predicting market responses with a neural network: the case of fast moving consumer goods ”, Marketing Intelligence & Planning , Vol. 13 , No.7, 1995, pp. 23-30. – Използване на невронни мрежи при изучаване на динамиката на пазарите на потребителски стоки
  • Kaastra, I., Boyd, M., “Designing a neural network for forecasting financial and economic time series”, Neurocomputing , No. 10, 1996, pp. pp. 218.
  • Zhang, G., Patuwo, B., Hu, M., “Forecasting with neural networks: the state of art” International journal of forecasting , Vol.14, 1998, pp.44.

Външни препратки