Партан-методы

Для исправления недостатков наискорейшего спуска разработаны итерационный и модифицированный партан-методы.

Итерационный партан-метод (

$Партан-методы$

-партан) строится следующим образом. В начальной точке

$Партан-методы$

вычисляется градиент оценки

$Партан-методы$

и делается шаг наискорейшего спуска - для этого используется одномерная оптимизация. Далее снова вычисляется градиент

$Партан-методы$

и выполняется спуск (т.е. перемещение в направлении антиградиента), и описанный процесс повторяется

$Партан-методы$

раз. После

$Партан-методы$

шагов наискорейшего спуска получаем точку

$Партан-методы$

и проводим одномерную оптимизацию из

$Партан-методы$

в направлении

$Партан-методы$

с начальным шагом

$Партан-методы$

. После этого цикл повторяется.

Модифицированный партан-метод требует запоминания дополнительных параметров. Он строится следующим образом. Из

$Партан-методы$

делается два шага наискорейшего спуска. Получаем

$Партан-методы$

. Далее выполняем одномерную оптимизацию в направлении

$Партан-методы$

. Получаем

$Партан-методы$

. Далее выполняется наискорейший спуск из

$Партан-методы$

. Получаем

$Партан-методы$

. Выполняем одномерную оптимизацию из

$Партан-методы$

в направлении

$Партан-методы$

. Получаем

$Партан-методы$

и~т.д. Таким образом, четные

$Партан-методы$

получаем наискорейшим спуском из

$Партан-методы$

, нечетные

$Партан-методы$

- одномерной оптимизацией из

$Партан-методы$

в направлении

$Партан-методы$

(начальный шаг

$Партан-методы$

). Как показала практика, модифицированный партан-метод в задачах обучения работает лучше, чем

$Партан-методы$

-партан.

Содержание раздела