3. ĠBN ÂġÛR’A GÖRE ĠġKÂL SEBEPLERĠ
3.4. Arap Dilinin Özelliklerine Aykırılıktan Kaynaklanan Sebepler
3.4.3. Harf-i Cerlerin Birbirlerinin Yerine Kullanılması
O aprendizado de m´aquina ´e um conjunto de t´ecnicas aplicadas a programas compu- tacionais que os tornam capazes de aprender com as experiˆencias que eles v˜ao adquirindo ao longo de seu funcionamento. Segundo Mitchell (MITCHELL, 1997), pode-se dizer que um m´aquina aprendeu atrav´es de uma experiˆencia E em rela¸c˜ao a uma classe de tarefas T e medida de performance P, se a sua performance nas tarefas em T, medida por P, me- lhorou com a experiˆencia E. Segundo Nilsson (NILSSON, 1998), de forma geral, pode-se dizer que uma m´aquina aprende sempre que ela muda sua estrutura, programa ou dados, baseando-se em suas entradas ou em respostas a informa¸c˜oes externas, de tal forma que sua expectativa ´e aumentar sua performance.
Como exemplo, pode-se citar os programas de gerenciamento de m´usica que ao longo do tempo v˜ao verificando as m´usicas mais escutadas pelo usu´ario e passam a sugerir listas autom´aticas baseadas nas m´usicas mais ouvidas, como m´usicas do mesmo gˆenero mais ouvido pelo usu´ario, podendo tamb´em recomendar, atrav´es da internet, m´usicas fora da biblioteca do usu´ario que est˜ao sendo ouvidas por outros usu´arios.
Segundo Nilsson (NILSSON, 1998), ´e importante que m´aquinas tenham a capacidade de aprender pelas seguintes raz˜oes:
• Algumas tarefas n˜ao podem ser bem definidas a n˜ao ser por exemplos, ou seja, ´e poss´ıvel especificar os pares de entradas e sa´ıdas, mas n˜ao uma rela¸c˜ao concisa entre as entradas e as sa´ıdas desejadas. Dessa forma, ´e desej´avel obter uma m´aquina que seja capaz de ajustar a sua estrutura interna para produzir sa´ıdas corretas para um
3.1 Metodologia 68 grande n´umero de exemplos de entradas e, adequadamente, formar sua fun¸c˜ao entre entrada e sa´ıda para aproximar a rela¸c˜ao impl´ıcita nos exemplos.
• ´E poss´ıvel que, escondidos entre grandes quantidades de dados, estejam importan- tes relacionamentos e correla¸c˜oes. M´etodos de aprendizagem de m´aquina podem frequentemente ser utilizados para extrair esses relacionamentos, o que ´e conhecido como minera¸c˜ao de dados (data mining).
• Projetistas humanos muitas vezes produzem m´aquinas que n˜ao trabalham t˜ao bem como o desejado nos ambientes em que elas s˜ao usadas. Na verdade, certas caracte- r´ısticas do ambiente de trabalho podem n˜ao ser completamente conhecidas durante o tempo de projeto. M´etodos de aprendizagem de m´aquina podem ser usados para a melhoria in loco dos projetos de m´aquinas existentes.
• A quantidade de conhecimento dispon´ıvel sobre certas tarefas pode ser muito grande para serem processados explicitamente por humanos. M´aquinas que adquiram esse conhecimento gradualmente podem ser capazes de extrair mais informa¸c˜oes dele que os humanos.
• Ambientes que mudam o tempo todo. As m´aquinas que podem se adaptar a uma mudan¸ca de ambiente poderiam reduzir a necessidade de constantes reformula¸c˜oes. • Novos conhecimentos sobre tarefas s˜ao constantemente descobertos por humanos. O vocabul´ario muda. H´a um constante fluxo de novos eventos no mundo. A cont´ınua reformula¸c˜ao de sistemas de inteligˆencia artificial para incorporar novos conheci- mentos ´e impratic´avel, mas m´etodos de aprendizagem de m´aquina podem ser aptos a acompanhar isso.
O estudo do aprendizado de m´aquina envolve uma s´erie de outras disciplinas, devido `a complexidade e abrangˆencia desse t´opico. Dentre as principais disciplinas que contri- buem para o desenvolvimento dessas m´aquinas, pode-se citar a estat´ıstica, os modelos cerebrais, a teoria de controle adaptativo, os modelos psicol´ogicos, a inteligˆencia artifi- cial e os modelos evolucion´arios (NILSSON, 1998). Devido a esta grande interface com diferentes ´areas de conhecimento, diferentes m´etodos baseados em diferentes paradigmas s˜ao utilizados para realizar o aprendizado de m´aquina, sendo alguns mais indicados para certas finalidades do que outros.
1. O que vai ser aprendido? 2. De onde vai ser aprendido? 3. Como vai ser aprendido?
4. Como o conhecimento vai ser representado?
5. Como vai ser medida a performance do aprendizado?
Definir o que vai ser aprendido pela m´aquina ´e primeira coisa que deve ser feita para iniciar o projeto dela, pois dessa defini¸c˜ao depender˜ao todas as outras. ´E neste momento que se define se a m´aquina deve encontrar a rela¸c˜ao entre os dados de entrada e sa´ıda, se ela ir´a classificar os dados ou se ir´a buscar padr˜oes entre os dados, etc.
A segunda etapa ´e definir a fonte de conhecimento para a m´aquina. Esta escolha deve ser feita com cuidado, pois pode definir o sucesso ou o fracasso do aprendizado (MITCHELL, 1997). ´E importante verificar a representatividade dos exemplos que se- r˜ao utilizados para treinar a m´aquina. Um conjunto n˜ao representativo pode gerar um conhecimento pobre da m´aquina, afetando negativamente a sua performance.
Definido o que e de onde a m´aquina vai aprender, vem a quest˜ao de como aprender. A forma como um conhecimento ser´a adquirido est´a diretamente ligada com as experiˆencias que ser˜ao passadas a ela. Um sistema pode ser treinado atrav´es de exemplos diretos, ou a informa¸c˜ao pode ser obtida de forma indireta. Como exemplo, pode-se citar uma m´aquina desenvolvida para aprender a jogar xadrez. Ela pode aprender apresentando-se a ela estados do tabuleiro de jogo (pe¸cas e suas respectivas posi¸c˜oes) e o correto movimento para cada um desses estados, o que seria a forma direta. Uma outra forma seria fornecer a ela a sequˆencia de movimentos de v´arios jogos e o resultado final de cada um deles, assim a informa¸c˜ao sobre a corre¸c˜ao de movimentos espec´ıficos do jogo pode ser inferida indiretamente do fato do jogo ter sido ganho ou n˜ao. Geralmente, treinar m´aquinas de forma direta ´e mais f´acil do que de forma indireta, pois a obten¸c˜ao da corre¸c˜ao de um certo conhecimento inferido indiretamente de um resultado final pode ser um problema particularmente dif´ıcil (MITCHELL, 1997).
Aqui cabe entrar no m´erito do aprendizado indutivo e dedutivo. O aprendizado in- dutivo busca encontrar uma regra geral para o conceito a ser aprendido a partir de um dado conjunto de exemplos (NICOLETTI, 1994), representando de certa forma o apren- dizado de forma direta. O aprendizado dedutivo busca, a partir de um conhecimento mais geral, uma conclus˜ao em particular, representando de certa forma o aprendizado de
3.1 Metodologia 70 forma indireta. De maneira geral, o processo indutivo se concentra nas conclus˜oes para generalizar e o processo dedutivo se concentra nas rela¸c˜oes para concluir. H´a ainda o aprendizado transdutivo, que ´e uma alternativa ao aprendizado indutivo. Nele, a ten- tativa de generaliza¸c˜ao do conceito atrav´es de uma regra geral ´e deixada de lado, sendo que as predi¸c˜oes para o conceito s˜ao realizadas pela rela¸c˜ao direta dele com os padr˜oes anteriormente observados (SILVA, 2008).
Al´em disso, deve ser observada a quest˜ao do controle dos exemplos que ser˜ao fornecidos `a m´aquina quanto `as respostas obtidas por ela para cada um deles, ou seja, o paradigma de aprendizagem. Se h´a controle dos exemplos, se diz que o aprendizado ´e supervisionado, pois existe uma entidade (supervisor) que dir´a a m´aquina se a resposta obtida por ela est´a correta ou n˜ao. Neste tipo de aprendizado, j´a se conhece de antem˜ao as respostas esperadas para as experiˆencias que ser˜ao passadas para a m´aquina. Se n˜ao h´a controle dos exemplos, se diz que o aprendizado ´e n˜ao-supervisionado, pois a m´aquina por si s´o deve determinar as sa´ıdas para as experiˆencias apresentadas a ela, j´a que, para essas experiˆencias, n˜ao s˜ao conhecidas previamente as respostas esperadas. H´a ainda o caso no qual parte dos exemplos ´e controlado e parte n˜ao ´e, ou seja, se conhece a resposta esperada da m´aquina para parte dos exemplos dispon´ıveis e n˜ao se conhece para outra. Para este caso, se diz que o aprendizado ´e semi-supervisionado, pois a m´aquina ir´a atribuir respostas para os exemplos em que elas n˜ao s˜ao conhecidas a partir do conhecimento obtido atrav´es dos exemplos em que as respostas s˜ao conhecidas. A ´ultima forma de controle dos exemplos ´e caracterizada pela rea¸c˜ao que o ambiente d´a `a resposta obtida pela m´aquina. Nela, as respostas esperadas para as experiˆencias n˜ao s˜ao conhecidas previamente, assim, a m´aquina, por si s´o, define as respostas para as experiˆencias passadas a ela e recebe a rea¸c˜ao do ambiente como realimenta¸c˜ao (RIBEIRO, 1999). Se a resposta do ambiente for favor´avel, h´a um refor¸co da resposta que foi obtida por ela, contribuindo para que essa resposta permane¸ca inalterada em uma pr´oxima apari¸c˜ao do exemplo, mas se a resposta do ambiente for negativa, a resposta obtida por ela sofre um dem´erito, sofrendo uma altera¸c˜ao em uma pr´oxima apari¸c˜ao desse exemplo.
A forma como os exemplos s˜ao apresentados `a m´aquina tamb´em ´e importante. Eles podem ser apresentados de forma incremental ou n˜ao. Na forma incremental, um exemplo ´e apresentado por vez `a m´aquina, e ela se ajusta a esse exemplo (NILSSON, 1998). O processo vai seguindo at´e que todos os exemplos tenham sido apresentados. Na forma n˜ao-incremental, o conjunto de entradas ´e todo apresentado e utilizado de uma s´o vez para ajustar a m´aquina, mas, alternativamente, o conjunto pode ser apresentado v´arias vezes `a m´aquina at´e que esta atinja um desempenho aceit´avel (NILSSON, 1998). O que
´e importante observar ´e que, na forma incremental, a ordem em que os dados s˜ao apre- sentados `a m´aquina ´e de suma importˆancia, pois podem lev´a-la a apresentar tendˆencias em favor de um certo subconjunto de dados. J´a na forma n˜ao-incremental, como os dados s˜ao todos utilizados de uma s´o vez, a ordem de apresenta¸c˜ao n˜ao importa.
Passando `a quest˜ao da forma como o conhecimento ser´a representado, ela depender´a de todas as defini¸c˜oes anteriores. Se o objetivo ´e definir a rela¸c˜ao entre a entrada e a sa´ıda de um sistema, talvez a melhor escolha seja representar o conhecimento atrav´es um con- junto de fun¸c˜oes. Se quer-se conhecer a estrutura de um certo conjunto de dados do qual se tˆem poucas informa¸c˜oes, talvez deva ser analisada a utiliza¸c˜ao de alguma representa¸c˜ao estat´ıstica, como m´edia e desvio padr˜ao, ou alguma outra medida de dispers˜ao, por exem- plo, limites m´aximos e m´ınimos. Se o problema ´e de reconhecimento de padr˜oes, talvez a melhor representa¸c˜ao seja uma matriz. Ainda h´a outras formas de representar o conhe- cimento como fun¸c˜oes l´ogicas, sistemas fuzzy, etc., cada uma apresentando vantagens em certas aplica¸c˜oes.
Para finalizar, depois de treinar a m´aquina, ´e importante medir a sua performance, que indicar´a o qu˜ao bem ela assimilou um certo conhecimento. A avalia¸c˜ao pode ser feita em duas fases: uma com o pr´oprio conjunto de exemplos utilizado para treinar a m´aquina e uma com um conjunto de valida¸c˜ao. Na primeira fase, avalia-se o comportamento da m´aquina em rela¸c˜ao ao treinamento ao qual ela foi submetido, ou seja, o qu˜ao pr´oximo ela conseguiu chegar das respostas esperadas para cada um dos exemplos de treinamento apresentados a ela. Na segunda fase, a m´aquina ´e submetida a uma valida¸c˜ao do seu treinamento, exemplos n˜ao contidos no conjunto de treinamento s˜ao apresentados a ela, e ent˜ao, ela ´e avaliada quanto `a resposta esperada para esses exemplos, simulando assim o ambiente no qual a m´aquina ir´a operar.
A m´aquina pode apresentar um ´otimo desempenho na avalia¸c˜ao do treinamento e ter um p´essimo desempenho na valida¸c˜ao. Isso pode ser reflexo de uma m´a escolha do conjunto de teste, que pode ter privilegiado um certo aspecto do conceito a ser aprendido em detrimento de outros. O contr´ario tamb´em pode ocorrer, um p´essimo desempenho no conjunto de treinamento e um ´otimo desempenho no conjunto de valida¸c˜ao, que, da mesma forma, pode representar uma m´a escolha do conjunto de valida¸c˜ao. Tanto o conjunto de exemplos para o treinamento da m´aquina quanto o para valida¸c˜ao, devem ser cuidadosamente escolhidos, de forma que eles sejam representativos e abranjam todo o universo dentro do qual a m´aquina dever´a trabalhar.
3.1 Metodologia 72 aprendizado de m´aquina ser´a aplicado. No caso de m´aquinas que trabalhar˜ao com proble- mas de regress˜ao, uma medida de desempenho comumente utilizada ´e o erro quadr´atico m´edio. Para m´aquinas que trabalhar˜ao com problemas de classifica¸c˜ao, geralmente se utiliza a taxa de acertos ou de erros de classifica¸c˜ao como medida de performance. Para clusteriza¸c˜ao de dados, geralmente se avalia a coes˜ao e a separa¸c˜ao dos clusters formados. Para outros tipos de problemas, outras medidas s˜ao utilizadas.