KUVVET SPORLARI İÇİN ÖZEL UZMANLIK ROLLERİ (Ağırlık kaldırma)
2.4 Yurt İçi ve Yurt Dışında Spor Eğitimi Modeli ile İlgili Yapılan Araştırmalar Bu bölümde, Spor Eğitimi Modeli (SEM) ile ilgili yurt içinde ve yurt dışında
Atualmente, a reprodução da cooperação entre agentes econômicos é baseado na teoria dos jogos53, uma teoria sobre tomadas de decisão, na qual se busca desenvolver formulações que
proporcionem a escolha da estratégia de um jogador (agente econômico) mais adequada em determinado momento. Uma estratégia é um plano de ação completo que descreve o que um jogador deve fazer tendo em vista as circunstâncias envolvidas. Como as estratégias de cada envolvido repercutem nos ganhos ou perdas individuais, elas precisam levar em conta o que cada jogador fez ou fará, isto é, a interação estratégica entre jogadores.
O jogo mais conhecido que formula a decisão sobre cooperação é o chamado „Dilema dos Prisioneiros‟54, cuja matriz de payoff básica e mais popular é apresentada abaixo, em que C
responde pela estratégia „cooperação‟ e D indica a estratégia „defecção‟. Formalmente, numa versão com dois participantes e uma rodada, cada um opta em toda rodada por cooperar (C) ou não-cooperar (D). O jogador ganha X no caso de ambos jogarem C, e Y no caso de ambos jogarem D. Por outro lado, no caso de um jogador escolher C e o outro D, o jogador que cooperou recebe Z e o que não cooperou recebe W, no qual W > X > Y > Z e X > ½ (W + Z). Isto significa que um agente tem um incentivo muito grande para a defecção, com a perspectiva de ganhar W. Mas o resultado coletivo seria maior se ambos cooperassem, pois 2X > W + Z.
Quadro 4.1 – Matriz de Pay-Off do Dilema dos Prisioneiros
C D
C X; X Z; W
D W; Z Y;Y
Fonte: Elaboração própria
Como bem se sabe, o „Dilema dos Prisioneiros‟ tem uma solução bem determinada: como para cada um dos jogadores a defecção é a estratégia dominante, o equilíbrio do jogo, de
53 Sobre o assunto ver Friedman, 1971 e 1977, e Gibbons, 1992. 54
O dilema do prisioneiro foi elaborado por volta de 1950 por Merrill Flood e Melvin Dresher e formalizado pouco tempo depois por A.W. Tucker. Veja o excelente livro de Axelrod (1984).
Nash, se dá na combinação de estratégias (D; D). Este resultado é ineficiente, já que um movimento simultâneo para (C; C) traz um ganho para ambos (um ótimo, no sentido de Pareto).
É este o dilema entre o conflito e a cooperação, que ocorre basicamente devido ao jogo possuir apenas uma rodada, pois se for repetido infinitamente, entretanto, existe uma possibilidade para que os agentes estabeleçam mecanismos que suportem a cooperação mútua e ambos ganharem X. Com a interação repetida entre os agentes, a confiança no rival pode ser estabelecida com o tempo, criando a possibilidade de coordenação de ações. Este jogo em que as interações entre os dois agentes são repetidas no tempo é chamado, por Robert Axelrod, de “Dilema dos Prisioneiros Iterativo” (AXELROD, 1997).
Anteriormente foi visto que não há possibilidade da cooperação (solução C;C) emergir de uma situação de interação simultânea entre dois agentes. O equilíbrio ocorre quando ambos os agentes não cooperam (solução D;D), mesmo sendo este um resultado subótimo. Entretanto, existe uma possibilidade para que os agentes estabeleçam mecanismos que suportem a cooperação mútua e ambos ganhem mais: repetir a interação entre os agentes um número indeterminado de vezes para que o resultado advindo da confiança mútua sobreponha o beneficio unilateral, o chamado “Dilema dos Prisioneiros Iterativo” (AXELROD, 1984).
O Dilema dos Prisioneiros Iterativo (DPI) é uma variação do jogo descrito no quadro 4.1 em que dois agentes jogam repetidamente o Dilema dos Prisioneiros (DP), cuja estratégia dominante de não cooperar é decorrente do fato de o jogo ter apenas uma única rodada. A chave do DPI é que os dois jogadores podem jogar entre si várias vezes, o que permite a ambos desenvolverem estratégias baseadas em suas interações prévias. Assim, um movimento hoje de um dos jogadores afeta o comportamento de amanhã de seu oponente e todo o resultado esperado do jogo. Isto remove a estratégia dominante de não cooperar e permite o uso de estratégias mais complexas, de acordo com a história do jogo e buscando a maximização do retorno acumulado. Desta forma, sob certas circunstâncias, a cooperação pode emergir. Este é o nosso objetivo: desvendar sob quais circunstâncias a cooperação emerge como uma escolha plausível de agentes econômicos.
Uma tentativa para desvendar a emergência da cooperação foi feita em 1984, quando Robert Axelrod apresentou no livro The Evolution of Cooperation uma descrição da maneira pela
qual o DP foi repetido por várias rodadas. O autor organizou um experimento no qual realizou dois torneios para se jogar o DP: no primeiro, 14 estratégias para solucionar o dilema foram escritas por especialistas em teoria dos jogos, e no segundo, 62 estratégias. As estratégias eram as mais diversas, mas a vencedora foi uma muito simples, a Tit for Tat (TfT), em que a cooperação é atingida com base na reciprocidade, já que cada jogador coopera no primeiro movimento e nos seguintes repete o movimento anterior da estratégia com a qual estiver emparelhada (a estratégia do rival).
A razão pelo sucesso da TfT pode ser explicada pelo paradigma CDP: contém as condições de necessidade da cooperação. Como visto anteriormente, um conluio tácito bem sucedido está baseado em três pilares: i) consenso entre as empresas participantes da colusão; ii) fácil detecção de condutas de desrespeito ao acordo (desvio); e iii) punição em caso de desvio crível. As características que fizeram de TfT a estratégia vencedora foram: i) iniciar a partida com um movimento de cooperação (estabelecer um ponto focal); ii) deixar de cooperar imediatamente após um ato não-cooperativo da outra estratégia (retaliação instantânea); iii) voltar a cooperar após a cooperação por outra estratégia (perdão imediato). A TfT é uma mistura bem sucedida entre consenso, detecção e punição e que permite a ocorrência da cooperação.
A proximidade entre indivíduos, ainda que egoístas, e as interações repetidas, permitem tanto o estabelecimento de um ponto focal quanto o surgimento da reciprocidade num segundo momento, pós traição, desde que os agentes sejam dotados de certa racionalidade, que levem eles a adotarem rotinas reconhecíveis pelos rivais, o que estabelece confiança mútua. Assim, é possível discriminar, no instante seguinte a um desvio ou a uma cooperação, aqueles que antes cooperaram ou não. Desta forma, a estratégia vencedora evita conflitos desnecessários, enquanto todos agem de modo recíproco, respondendo de imediato às deserções não motivadas, mas logo esquecendo as provocações passadas após o retorno à cooperação. A transparência das intenções e, por conseguinte, a facilidade de identificação do padrão de conduta dos agentes, estimula o cumprimento dos compromissos assumidos, assim, tacitamente, pelo consenso implícito.
Pode-se dizer, então, que „a emergência da cooperação‟ baseia-se na investigação de como indivíduos que visam à satisfação de seus próprios interesses podem cooperar entre si, sem mecanismos de incentivos ou punição externos ao ambiente em que interagem, apoiada
fortemente na reciprocidade. Robert Axelrod evidenciou que a cooperação é possível como resultado da repetida interação estratégica entre agentes (AXELROD, 1984). A emergência da cooperação decorre de um histórico de comportamentos estratégicos dos agentes que consiga reproduzir o paradigma CDP: estar disposto a estabelecer um acordo, detectar desvios e punir os agentes traidores. O interessante da emergência da cooperação é que ela não deriva de apenas uma estratégia determinada ex-ante pelo agente econômico, mas de um comportamento, dentre infinitos, capaz de refletir o paradigma CDP num determinado ambiente e tempo de interação entre agentes.
Com esta idéia em mente, o mesmo Robert Axelrod, em um artigo posterior, utilizou um instrumento de seleção de melhores alternativas chamado de Algoritmo Genético - AG55, para
verificar a robustez da obtenção de uma estratégia cooperativa (que reflita o paradigma CDP) em seus torneios (AXELROD, 1997). A escolha de um AG para captar a emergência da cooperação recai no fato de este ser um mecanismo eficiente de busca da melhor resposta em ambientes complexos, isto é, ele é capaz de selecionar a melhor estratégia dentro de um rol de estratégias diversas capazes de refletir um determinado comportamento (HOLLAND, 1975), que no caso é a cooperação. E mais, o AG consegue simular um processo evolucionário no qual a adaptação e o aprendizado são capazes de ocorrer (MILLER, 1986 e 1994).
O autor empregou o AG para selecionar a melhor estratégia dentro de um rol imensurável de alternativas que os agentes podem adotar em uma situação de DPI. Este mecanismo de seleção utiliza o resultado médio das rodadas do DP como critério de avaliação das estratégias, mas incorpora o elemento inovação no mecanismo de aprendizado dos agentes. O AG levou à formação de um conjunto de estratégias vencedoras muito adaptadas e com um resultado em termos de pay-off muito próximo ao ótimo possível de ser obtido. Na maioria das simulações, as estratégias selecionadas possuíam o mesmo mecanismo de reciprocidade da estratégia TfT, vencedora do experimento concreto (AXELROD, 1984:21).