Нейрокомпьютерные системы

       

Партан-методы


Для исправления недостатков наискорейшего спуска разработаны итерационный и модифицированный партан-методы.

Итерационный партан-метод (

Партан-методы
-партан) строится следующим образом. В начальной точке
Партан-методы
вычисляется градиент оценки
Партан-методы
и делается шаг наискорейшего спуска - для этого используется одномерная оптимизация. Далее снова вычисляется градиент
Партан-методы
и выполняется спуск (т.е. перемещение в направлении антиградиента), и описанный процесс повторяется
Партан-методы

раз. После

Партан-методы
шагов наискорейшего спуска получаем точку
Партан-методы
и проводим одномерную оптимизацию из
Партан-методы
в направлении
Партан-методы
с начальным шагом
Партан-методы
. После этого цикл повторяется.

Модифицированный партан-метод требует запоминания дополнительных параметров. Он строится следующим образом. Из

Партан-методы
делается два шага наискорейшего спуска. Получаем
Партан-методы
и
Партан-методы
. Далее выполняем одномерную оптимизацию в направлении
Партан-методы
. Получаем
Партан-методы
. Далее выполняется наискорейший спуск из
Партан-методы
. Получаем
Партан-методы
. Выполняем одномерную оптимизацию из
Партан-методы
в направлении
Партан-методы
. Получаем
Партан-методы
и~т.д. Таким образом, четные
Партан-методы
получаем наискорейшим спуском из
Партан-методы
, нечетные
Партан-методы
- одномерной оптимизацией из
Партан-методы
в направлении
Партан-методы
(начальный шаг
Партан-методы
). Как показала практика, модифицированный партан-метод в задачах обучения работает лучше, чем
Партан-методы
-партан.



Содержание раздела