Нейрокомпьютерные системы

       

Сигмоидальный нейрон


Нейрон сигмоидального типа имеет структуру, подобную модели МакКаллока-Питса, с той разницей, что функция активации является непрерывной и может быть выражена в виде сигмоидальной униполярной или биполярной функции. Униполярная функция, как правило, представляется формулой (рис.2)

Сигмоидальный нейрон

Сигмоидальный нейрон

Рис. 2.  Униполярная функция (? =1)

тогда как биполярная функция задается в виде (рис.3)

Сигмоидальный нейрон

Сигмоидальный нейрон

Рис. 3.  Биполярная функция (?=1)

Параметр

Сигмоидальный нейрон
влияет на крутизну графика функции
Сигмоидальный нейрон
. При
Сигмоидальный нейрон
сигмоидальная функция превращается в функцию ступенчатого типа, идентичную функции активации персептрона. На практике чаще всего используется значение
Сигмоидальный нейрон
.

Важным свойством сигмоидальной функции является ее дифференцируемость. Для униполярной функции имеем

Сигмоидальный нейрон

тогда как для биполярной функции

Сигмоидальный нейрон

Применение непрерывной функции активации позволяет использовать при обучении градиентные методы оптимизации. Проще всего реализовать метод наискорейшего спуска, в соответствии с которым уточнение вектора весов

Сигмоидальный нейрон

проводится в направлении отрицательного градиента целевой функции

Сигмоидальный нейрон
, где

Сигмоидальный нейрон

Компонента градиента имеет вид

Сигмоидальный нейрон

где

Сигмоидальный нейрон
означает разницу между фактическим и ожидаемым значением выходного сигнала нейрона. Если ввести обозначение
Сигмоидальный нейрон
, то можно получить выражение, определяющее
Сигмоидальный нейрон
-ю составляющую градиента в виде

Сигмоидальный нейрон

Значения весовых коэффициентов уточняются по формуле

Сигмоидальный нейрон

где

Сигмоидальный нейрон
.

Применение градиентного метода для обучения нейрона гарантирует достижение только локального минимума. Для выхода из окрестности локального минимума результативным может оказаться обучение с моментом. В этом методе процесс уточнения весов определяется не только информацией о градиенте функции, но и предыдущим изменением весов. Подобный способ может быть задан выражением

Сигмоидальный нейрон

в котором первый член соответствует обычному методу наискорейшего спуска, тогда как второй член, называемый моментом, отражает последнее изменение весов и не зависит от фактического значения градиента. Значение

Сигмоидальный нейрон

выбирается из интервала (0,1).



Содержание раздела