• Sonuç bulunamadı

4- Paklitaksel+Oksitosin+Progesteron (Ptx+Oxy+Pg): Bu gruptaki toplam 8 hayvana paklitaksel oksitosin progesteron önceki gruplardaki uygulama şekilleriyle verildi

5.2. Birleşik Kas Aksiyon Potansiyeli ve Sinir İletim Hızı

2. (Crit´erio de parada formal) Se 0 ∈ ∂εf (xk), pare.

3. (Descida) Encontre uma dire¸c˜ao de ε-descida dk de f em xk.

4. (Busca linear) Encontre um tamanho de passo tk> 0 tal que

f (xk+ tkdk) < f (xk) − ε.

5. (Pr´oximo iterado) Defina xk+1= x. k+ tkdk.

6. (Loop) Tome k = k + 1 e v´a para o passo 2.

Nesse algoritmo, f (xk) → −∞ ou o algoritmo termina numa itera¸c˜ao k∗

tal que xk∗´e ε-´otimo. Esse ´e o algoritmo de ε-descida mais simples. Existem

variantes do m´etodo que permitem escolhas de ε = εk a cada itera¸c˜ao.

Por fim, note que o ε-subdiferencial tamb´em n˜ao ´e usualmente conhecido por inteiro, ou seja, o m´etodo de ε-descida que descrevemos ainda n˜ao ´e implement´avel. Nas pr´oximas se¸c˜oes, veremos outros algoritmos que tentam contornar essa quest˜ao.

3.3

M´etodo de Subgradientes

Usualmente, a obten¸c˜ao de um subdiferencial ∂f (x) por inteiro ´e excessiva ou at´e imposs´ıvel do ponto de vista computacional. Uma maneira de con- tornar esse problema ´e simplesmente requerermos menos, ou seja, pedirmos o cˆomputo de apenas um ´unico subgradiente. Tal cˆomputo est´a associado a uma caixa preta (tamb´em denominado or´aculo ), que ´e utilizada como base em diversos algoritmos para problemas n˜ao diferenci´aveis.

Dado xk ∈ Rn, a caixa preta ´e respons´avel por gerar um subgradiente vk ∈ ∂f (xk), juntamente com f (xk), o valor da fun¸c˜ao objetivo1. Veremos,

no entanto, que nem sempre ser´a poss´ıvel obter dire¸c˜oes reais de descida. A performance de um algoritmo depende, portanto, da sua capacidade de gerar e reconhecer candidatos a dire¸c˜oes de descida “suficientemente bons”. Nesta se¸c˜ao, estudaremos a primeira dessas metodologias, denominada m´etodo de subgradientes.

A id´eia do m´etodo de subgradientes procede do m´etodo de Cauchy para otimiza¸c˜ao diferenci´avel, no qual se toma a dire¸c˜ao oposta ao gradiente ∇f (x). No nosso caso, tomaremos ent˜ao o vetor oposto ao subgradiente v fornecido pela caixa preta. Por´em, tal dire¸c˜ao n˜ao ser´a necessariamente de

1Observe que gerar uma seq¨uˆencia de iterados {xk} independe da maneira na qual se

calcula os valores f (xk) e vk. Em outras palavras, n˜ao ´e necess´ario saber como se computa

3.3. M´etodo de Subgradientes 29

descida. Conforme pode ser observado na figura 3.3.1, que mostra curvas de n´ıvel para fun¸c˜oes minimizadas em 0 ∈ R2, dire¸c˜oes de descida (representa- das pela parte hachurada clara) devem fazer produto escalar negativo com o subdiferencial ∂f (x) inteiro, e n˜ao apenas com um ´unico subgradiente v.

0 0 ∂f (x) ∇f (x) −v −v v

Figura 3.3.1: Dire¸c˜oes de descida: caso diferenci´avel e n˜ao diferenci´avel. A figura da direita (caso n˜ao diferenci´avel), mostra um exemplo em que a dire¸c˜ao v, fornecida pela caixa preta, ´e um vetor extremo do cone associado a ∂f (x). Em tal exemplo, a dire¸c˜ao oposta −v claramente n˜ao ´e de des- cida. Apesar desse algoritmo n˜ao assegurar necessariamente o decr´escimo da fun¸c˜ao objetivo a cada itera¸c˜ao, escolhas adequadas dos tamanhos de passo podem garantir a convergˆencia do m´etodo. Por ora, observemos a seguir o algoritmo correspondente ao m´etodo de subgradientes.

Algoritmo 3.7. M´etodo de Subgradientes 1. Tome x1 ∈ Rn e seja k = 1.

2. (Caixa preta) Compute vk e f (xk).

3. (Crit´erio de parada) Se 0 ∈ ∂f (xk) [i.e., vk= 0], pare. 4. (Busca linear) Tome um passo tk> 0 adequado.

5. (Pr´oximo iterado) Defina xk+1= x. k− tkvk.

6. (Loop) Tome k = k + 1 e v´a para o passo 2.

Para compreender o passo 4 do algoritmo acima, defina primeiro X∗ como o conjunto de solu¸c˜oes ´otimas e f∗ como o valor ´otimo da fun¸c˜ao

objetivo, ou seja, f∗ = f (x∗) para todo x∗ ∈ X∗. Em nossa an´alise, necessi-

3.3. M´etodo de Subgradientes 30

Hip´otese 3.8. A seq¨uˆencia {vk} ´e limitada por uma constante M .

Hip´otese 3.9. O problema (3.2) possui solu¸c˜ao ´otima, i.e., X∗ 6= ∅.

Com isso, veremos no teorema 3.11 algumas condi¸c˜oes para o tamanho do passo que garantem a convergˆencia do m´etodo. Para isso, o lema abaixo ´e essencial.

Lema 3.10. Considere o algoritmo 3.7. Ent˜ao para qualquer y ∈ Rn e

itera¸c˜ao k, vale a seguinte desigualdade:

kxk+1− yk2 ≤ kxk− yk2+ tk2kvkk2− 2tk(f (xk) − f (y)).

Demonstra¸c˜ao. Pela defini¸c˜ao de xk+1 dada no algoritmo, temos:

kxk+1− yk2 = xk− tkvk− y 2 = kxk− yk2+ t2 kkvkk2− 2tkhvk, xk− yi ≤ kxk− yk2+ t2 kkvkk2− 2tk(f (xk) − f (y)),

sendo que a ´ultima desigualdade vem da defini¸c˜ao de vk ∈ ∂f (xk).

Teorema 3.11. Considere o algoritmo 3.7 sob as hip´oteses 3.8 e 3.9, com os tamanhos de passo escolhidos por alguma das seguintes formas:

(a) ∞ X k=1 tk= +∞ e ∞ X k=1 t2k < +∞, (b) tk= β. k f (xk) − f∗

kvkk2 com 0 < β ≤ βk ≤ β < 2 para todo k.

Ent˜ao, o ´unico ponto de acumula¸c˜ao de {xk} pertence a X.

Demonstra¸c˜ao.

(a) Utilizando o lema 3.10 para y= x. ∗∈ X∗ arbitr´ario,

kxk+1− x∗k2 ≤ kxk− x∗k2+ t2kkvkk2− 2tk f (xk) − f∗. (3.5)

Aplicando essa desigualdade de maneira recursiva, temos: kxk+1− x∗k2 ≤ kx1− x∗k2+ k X i=1 t2ikvik2− 2 k X i=1 ti(f (xi) − f∗). (3.6)

3.3. M´etodo de Subgradientes 31

Como f∗ ≤ f (xi) e ti > 0 para todo i, temos:

kxk+1− x∗k2 ≤ kx1− x∗k2+

k

X

i=1

t2ikvik2.

Assim, da limita¸c˜ao de kvik para todo i e deP∞

i=1t2i < +∞, temos que {xk}

´e limitada e que kxk− xk2 converge [Pol87, se¸c˜ao 2.2].

Defina agora ˆfkj = min. j≤i≤kf (xi) e mostremos que para todo j, ˆfkj → f∗

quando k → ∞. Tome um j arbitr´ario. De maneira an´aloga a (3.6), obte- mos, aplicando recursivamente a desigualdade (3.5):

kxk+1− x∗k2 ≤ kxj− x∗k2+ k X i=j t2ikvik2− 2 k X i=j ti(f (xi) − f∗).

Como kxk+1− xk2 ≥ 0, podemos escrever:

kxj− xk2+Pk i=jt2ikvik2 ≥ 2 Pk i=jti(f (xi) − f∗) ≥ 2Pk i=jti  mini=j,...,k(f (xi) − f∗).

Al´em disso, como kvik ≤ M para todo i,

ˆ fkj− f∗≤ kxj− x∗k2+Pk i=jt2ikvik2 2Pk i=jti ≤ kx j− xk2+ M2Pk i=jt2i 2Pk i=jti . Logo, como x∗ ´e arbitr´ario, podemos escrever

ˆ fkj − f∗≤ dist(xj, X∗) + M2Pk i=jt2i 2Pk i=jti

e com isso, temos que ˆfkj − f∗ → 0 quando k → ∞, pois dist(xj, X∗) +

M2P∞

i=jt2i ´e limitado e

P∞

i=jti = +∞.

Finalmente, mostremos que um ponto de acumula¸c˜ao ¯x de {xk} pertence

a X∗. Sabemos que para todo j, ˆ fkj = min. j≤i≤kf (x i) ≥ inf i≥jf (x i) ≥ f ∗. (3.7)

Como f ´e semi-cont´ınua inferior, f (¯x) ≤ lim inf i→∞ f (x i) = lim j→∞infi≥jf (x i) ≤ lim j→∞ ˆ fkj,

3.3. M´etodo de Subgradientes 32

onde a ´ultima desigualdade ´e dada por (3.7). Ademais, ˆfkj → f∗, ent˜ao

f (¯x) ≤ f∗, ou mais precisamente, f (¯x) = f∗. Logo, qualquer ponto de acu-

mula¸c˜ao dessa seq¨uˆencia (limitada) {xk} est´a em X∗, conforme quer´ıamos. Para provar a unicidade de tal ponto de acumula¸c˜ao, suponha que existam ¯

x e ˜x distintos tais que xk → ¯x e xk → ˜x. Ent˜ao, k¯x − x∗k = k˜x − x∗k, o que ´e poss´ıvel somente se ¯x = ˜x.

(b) Utilizando o lema 3.10 para y= x. ∗∈ X∗ e a defini¸c˜ao de t

k, temos: kxk+1− x∗k2 ≤ kxk− xk2+ t2 kkvkk2− 2tk(f (xk) − f∗) = kxk− xk2− β k(2 − βk) (f (xk) − f∗)2 kvkk2 (3.8) Assim, como βk∈]0, 2[, kxk+1− x∗k2≤ kxk− x∗k2

e isso implica que {xk} ´e limitada. Mostremos agora que f (xk) → f∗.

Suponha, por contradi¸c˜ao, que {xk} → ¯x e que f (¯x) > f

∗. Ent˜ao, existem

δ > 0 e uma seq¨uˆencia infinita de ´ındices k1 < k2 < ... tais que f (xki)−f∗> δ

para todo i = 1, 2, .... Pela hip´otese 3.8, kvkk ´e limitado. Al´em disso, como 0 < β ≤ βk≤ β < 2 para todo k, temos, por (3.8), que

kxki+1− xk2 ≤ kxki− xk2− ε, i = 1, 2, ...

onde ε > 0. Logo, kxki+1−x∗k2≤ kxk1−xk2−iε. Como kxki+1−x∗k2 ≥ 0,

temos kxk1 − xk2 − iε ≥ 0. Assim, tomando i → ∞, chegamos a uma

contradi¸c˜ao. Com isso, para qualquer ponto de acumula¸c˜ao ¯x, temos ¯x ∈ X∗.

Ademais, como {kxk− x∗k} ´e decrescente, ela converge para k¯x − xk para

todo x∗ ∈ X∗. Para verificar a unicidade do ponto de acumula¸c˜ao de {xk}, suponha que existam ¯x e ˜x distintos tais que {xk} → ¯x e {xk} → ˜x. Ent˜ao,

¯

x, ˜x ∈ X∗ e k¯x − x∗k = k˜x − x∗k para todo x∗ ∈ X. Mas isso ´e poss´ıvel

somente se ¯x = ˜x, o que nos leva novamente a uma contradi¸c˜ao.

Naturalmente, outras condi¸c˜oes de tamanho de passo s˜ao poss´ıveis de modo a estabelecer convergˆencia do m´etodo. De fato, o caso (b) do teo- rema 3.11 pode ser generalizado da seguinte forma:

tk= β. k

f (xk) − LB

kvkk2 , (3.9)

onde LB ´e um limitante inferior do valor ´otimo f∗. A utiliza¸c˜ao de (3.9)

3.3. M´etodo de Subgradientes 33

Referimo-nos a [Pol69] para a demonstra¸c˜ao de convergˆencia nesse caso. Por sua vez, esse limitante inferior LB pode ser atualizado a cada itera¸c˜ao k. Veremos detalhes disso na se¸c˜ao 6.3.

Vale ressaltar que embora o m´etodo de subgradientes seja considerado base para diversos algoritmos de otimiza¸c˜ao, sua teoria de convergˆencia n˜ao est´a ainda completa. Isso significa que algumas vers˜oes do algoritmo mostra- das na teoria s˜ao lentas do ponto de vista computacional, enquanto que para muitas vers˜oes implement´aveis do algoritmo n˜ao foram obtidas provas reais de convergˆencia. Finalizamos o assunto listando duas varia¸c˜oes do m´etodo de subgradientes.

Suponha primeiro que queremos resolver o problema restrito (3.1) e que o conjunto vi´avel X ´e simples, no sentido de que ´e f´acil projetar um ponto em X. Ent˜ao, o m´etodo de subgradientes projetados ´e baseado na seguinte atualiza¸c˜ao de iterados:

xk+1= P. X xk− tkvk. (3.10)

Observe que a proje¸c˜ao PX(·) garante que, a cada passo, os iterados xk

sejam vi´aveis.

Com ou sem proje¸c˜oes, ´e poss´ıvel que ocorra zigzags no m´etodo de sub- gradientes. Para ilustrar isso, considere o seguinte exemplo:

minimizar f (x)= x. 1+ 2x2− 1

sujeito a x ∈ X=. (x1, x2)T ∈ R2: x1+ x2 = 1; x1, x2 ≥ 0 .

Nesse caso, a solu¸c˜ao ´otima ´e x∗ = (1, 0)T com f (x∗) = f∗ = 0. Suponha

que a cada passo βk = 1. Considerando x0= (0, 1). T, ter´ıamos tk= f (xk)/5,

xk= 1 − 9 10 k , 9 10 k!T e f (xk) = 9 10 k

para todo k. Assim, com essa instˆancia, o algoritmo claramente converge para a solu¸c˜ao ´otima muito lentamente. Conforme [CFM75], o m´etodo de subgradientes com desvios, caracterizado por:

xk+1= P. X xk− tkdk onde



d1 = v. 1,

dk = v. k+ αkdk−1, (αk ≥ 0), ∀k > 1,

tenta diminuir a ocorrˆencia de tal fenˆomeno considerando uma combina¸c˜ao entre o subgradiente vke a dire¸c˜ao anterior dk−1. No cap´ıtulo 5 utilizaremos todas essas varia¸c˜oes, bem como adapta¸c˜oes das mesmas.

Benzer Belgeler