<?xml version="1.0"?>
<rss version="2.0">
   <channel>
      <title>Aprendizado por Reforço com Super Mario by José Henrique Luckmann</title>
      <link>https://padlet.com/josehluckmann/bpue6421ftomcb2h</link>
      <description></description>
      <language>en-us</language>
      <pubDate>2023-08-16 23:35:34 UTC</pubDate>
      <lastBuildDate>2023-08-17 00:19:37 UTC</lastBuildDate>
      <webMaster>hello@padlet.com</webMaster>
      <image>
         <url></url>
      </image>
      <item>
         <title>Aprendizado por Reforço</title>
         <author>josehluckmann</author>
         <link>https://padlet.com/josehluckmann/bpue6421ftomcb2h/wish/2663907816</link>
         <description><![CDATA[<div>Em aprendizagem por reforço, o agente aprende a partir de uma série de reforços recompensas ou punições.<br><br>Por exemplo imagine que queremos ensinar um agente a jogar super mario, primeiramente definimos todas as ações possíveis como andar, pular, virar e etc.<br><br>Colocamos ele para jogar inúmeras fazes e cada vez que ele cair em um buraco, encostar em um inimigo ou algo ruim, damos uma punição para ele.<br>Todas as vezes que ele chegar ao final da fase, damos uma recompensa para ele.<br><br>Com isto o agente vai aprendendo os padrões que levam ele ao sucesso.&nbsp;</div>]]></description>
         <enclosure url="https://padlet-uploads.storage.googleapis.com/2109114571/5881b0b4daf78083aa46bdb9b0b114f1/Captura_de_tela_2023_08_16_211615.png" />
         <pubDate>2023-08-16 23:41:03 UTC</pubDate>
         <guid>https://padlet.com/josehluckmann/bpue6421ftomcb2h/wish/2663907816</guid>
      </item>
      <item>
         <title>Exemplo</title>
         <author>josehluckmann</author>
         <link>https://padlet.com/josehluckmann/bpue6421ftomcb2h/wish/2663911308</link>
         <description><![CDATA[<div>Super Mario passando de fases impossíveis graças a uma inteligência artificial treinada por meio de reforço </div>]]></description>
         <enclosure url="https://www.youtube.com/watch?v=9kJeNg62JJk" />
         <pubDate>2023-08-16 23:48:05 UTC</pubDate>
         <guid>https://padlet.com/josehluckmann/bpue6421ftomcb2h/wish/2663911308</guid>
      </item>
      <item>
         <title>Aprendizagem Supervisionada</title>
         <author>josehluckmann</author>
         <link>https://padlet.com/josehluckmann/bpue6421ftomcb2h/wish/2663916673</link>
         <description><![CDATA[<div>Na aprendizagem supervisionada, observamos alguns pares de entrada e criamos uma função que nos leve da entrada até o resultado esperado.<br><br>Imagine que queremos classificar as fases do Mario entre fáceis e difíceis.<br><br>Nossos dados de entrada poderiam ser:<br>- tamanho<br>- quantidade de inimigos<br>- quantidade de buracos<br><br>Previamente classificaríamos as fases entre fáceis e difícil de acordo com a nossa experiencia. Com estes dados o algoritmo criaria uma função que quando informássemos os parâmetros nos diria se a fase é fácil ou difícil </div>]]></description>
         <enclosure url="https://s2-techtudo.glbimg.com/JkiwHTYFeioCpHrc_3ldg-V-l4s=/0x0:695x390/1000x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2020/E/p/y68LFGRNiQflca56juZQ/super-mario-world-snes-nintendo-dicas-saidas-secretas.jpg" />
         <pubDate>2023-08-16 23:57:52 UTC</pubDate>
         <guid>https://padlet.com/josehluckmann/bpue6421ftomcb2h/wish/2663916673</guid>
      </item>
      <item>
         <title>Aprendizado Não Supervisionado</title>
         <author>josehluckmann</author>
         <link>https://padlet.com/josehluckmann/bpue6421ftomcb2h/wish/2663920964</link>
         <description><![CDATA[<div>Na aprendizagem não supervisionada, o agente aprende padrões na entrada, embora não seja fornecido nenhum feedback explícito. A tarefa mais comum de aprendizagem não supervisionada é o agrupamento.<br><br>Imagine um cenário onde gostaríamos de agrupar os tipos de inimigos do Mário, para isto extraímos uma série de características de cada um como tamanho, cor, movimentação e etc.<br>O algoritmo criar grupos de acordo com cada característica, deve isolar o alguns devido ao tamanho, diferenciar goombas e koppas por causa da cor e assim por diante</div>]]></description>
         <enclosure url="https://thumbs.dreamstime.com/z/conjunto-de-personagens-inimigos-da-ilustra%C3%A7%C3%A3o-vetorial-design-pixel-jogos-cl%C3%A1ssicos-super-mario-fevereiro-supermario-world-%C3%A9-239217756.jpg" />
         <pubDate>2023-08-17 00:04:06 UTC</pubDate>
         <guid>https://padlet.com/josehluckmann/bpue6421ftomcb2h/wish/2663920964</guid>
      </item>
      <item>
         <title></title>
         <author>josehluckmann</author>
         <link>https://padlet.com/josehluckmann/bpue6421ftomcb2h/wish/2663924448</link>
         <description><![CDATA[<div>Então podemos entender que os principais elementos do modelo de aprendizado por reforço são as recompensas e punições</div>]]></description>
         <enclosure url="https://miro.medium.com/v2/resize:fit:720/format:webp/1*83qMkjkWaGP7HWfGiImyqw.png" />
         <pubDate>2023-08-17 00:09:20 UTC</pubDate>
         <guid>https://padlet.com/josehluckmann/bpue6421ftomcb2h/wish/2663924448</guid>
      </item>
      <item>
         <title>Referencias</title>
         <author>josehluckmann</author>
         <link>https://padlet.com/josehluckmann/bpue6421ftomcb2h/wish/2663925228</link>
         <description><![CDATA[<div>Super Mario com DeepLearning</div>]]></description>
         <enclosure url="https://paulovasconcellos.com.br/explicando-deep-reinforcement-learning-com-super-mario-ao-inv%C3%A9s-de-matem%C3%A1tica-4c77392cc733" />
         <pubDate>2023-08-17 00:10:20 UTC</pubDate>
         <guid>https://padlet.com/josehluckmann/bpue6421ftomcb2h/wish/2663925228</guid>
      </item>
      <item>
         <title></title>
         <author>josehluckmann</author>
         <link>https://padlet.com/josehluckmann/bpue6421ftomcb2h/wish/2663925651</link>
         <description><![CDATA[<div>Livro Stuart Russel</div>]]></description>
         <enclosure url="https://www.cin.ufpe.br/~gtsa/Periodo/PDF/4P/SI.pdf" />
         <pubDate>2023-08-17 00:10:50 UTC</pubDate>
         <guid>https://padlet.com/josehluckmann/bpue6421ftomcb2h/wish/2663925651</guid>
      </item>
   </channel>
</rss>
