Сигмоидальный нейрон

Нейрон сигмоидального типа имеет структуру, подобную модели МакКаллока-Питса, с той разницей, что функция активации является непрерывной и может быть выражена в виде сигмоидальной униполярной или биполярной функции. Униполярная функция, как правило, представляется формулой (рис.2)

$Сигмоидальный нейрон$

Рис. 2. Униполярная функция (? =1)

тогда как биполярная функция задается в виде (рис.3)

$Сигмоидальный нейрон$

Рис. 3. Биполярная функция (?=1)

Параметр

$Сигмоидальный нейрон$

влияет на крутизну графика функции

$Сигмоидальный нейрон$

. При

$Сигмоидальный нейрон$

сигмоидальная функция превращается в функцию ступенчатого типа, идентичную функции активации персептрона. На практике чаще всего используется значение

$Сигмоидальный нейрон$

Важным свойством сигмоидальной функции является ее дифференцируемость. Для униполярной функции имеем

$Сигмоидальный нейрон$

тогда как для биполярной функции

$Сигмоидальный нейрон$

Применение непрерывной функции активации позволяет использовать при обучении градиентные методы оптимизации. Проще всего реализовать метод наискорейшего спуска, в соответствии с которым уточнение вектора весов

$Сигмоидальный нейрон$

проводится в направлении отрицательного градиента целевой функции

$Сигмоидальный нейрон$

, где

$Сигмоидальный нейрон$

Компонента градиента имеет вид

$Сигмоидальный нейрон$

где

$Сигмоидальный нейрон$

означает разницу между фактическим и ожидаемым значением выходного сигнала нейрона. Если ввести обозначение

$Сигмоидальный нейрон$

, то можно получить выражение, определяющее

$Сигмоидальный нейрон$

-ю составляющую градиента в виде

$Сигмоидальный нейрон$

Значения весовых коэффициентов уточняются по формуле

$Сигмоидальный нейрон$

где

$Сигмоидальный нейрон$

Применение градиентного метода для обучения нейрона гарантирует достижение только локального минимума. Для выхода из окрестности локального минимума результативным может оказаться обучение с моментом. В этом методе процесс уточнения весов определяется не только информацией о градиенте функции, но и предыдущим изменением весов. Подобный способ может быть задан выражением

$Сигмоидальный нейрон$

в котором первый член соответствует обычному методу наискорейшего спуска, тогда как второй член, называемый моментом, отражает последнее изменение весов и не зависит от фактического значения градиента. Значение

$Сигмоидальный нейрон$

выбирается из интервала (0,1).

Содержание раздела