<?xml version="1.0"?>
<rss version="2.0">
   <channel>
      <title>Introducción a la Extracción de Información desde la Web by JOSUE MANUEL GAMBOA URBINA</title>
      <link>https://padlet.com/200028201/5q0mcyvlhmsgkamk</link>
      <description>Alumno: Gamboa Urbina, Josué Manuel
Curso: Computación Aplicada a las Comunicaciones II
Ciclo: IV</description>
      <language>en-us</language>
      <pubDate>2022-05-23 01:16:49 UTC</pubDate>
      <lastBuildDate>2022-05-23 02:44:15 UTC</lastBuildDate>
      <webMaster>hello@padlet.com</webMaster>
      <image>
         <url></url>
      </image>
      <item>
         <title>INTRODUCCIÓN A LA EXTRACCIÓN DE INFORMACIÓN DESDE LA WEB</title>
         <author>200028201</author>
         <link>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2194973705</link>
         <description><![CDATA[]]></description>
         <enclosure url="https://images.unsplash.com/photo-1487058792275-0ad4aaf24ca7?crop=entropy&amp;cs=tinysrgb&amp;fm=jpg&amp;ixid=Mnw3ODI2fDB8MXxzZWFyY2h8NXx8d2ViJTIwc2NyYXBpbmd8ZW58MXx8fHwxNjUzMjcxOTk1&amp;ixlib=rb-1.2.1&amp;q=80" />
         <pubDate>2022-05-23 01:18:41 UTC</pubDate>
         <guid>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2194973705</guid>
      </item>
      <item>
         <title>CONCEPTO</title>
         <author>200028201</author>
         <link>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2194986108</link>
         <description><![CDATA[<div>En la extracción de datos de la web, o <em>web scraping,</em> se extraen y almacenan datos de páginas web para analizarlos o utilizarlos en otra parte.</div>]]></description>
         <enclosure url="" />
         <pubDate>2022-05-23 01:27:56 UTC</pubDate>
         <guid>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2194986108</guid>
      </item>
      <item>
         <title>ANTECEDENTES</title>
         <author>200028201</author>
         <link>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2194992144</link>
         <description><![CDATA[<div>Los motores de búsqueda utilizan desde hace tiempo los denominados rastreadores web&nbsp; que exploran Internet en busca de términos definidos por el usuario. El primer rastreador web se creó ya en 1993.</div>]]></description>
         <enclosure url="" />
         <pubDate>2022-05-23 01:32:46 UTC</pubDate>
         <guid>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2194992144</guid>
      </item>
      <item>
         <title>ALMACENA</title>
         <author>200028201</author>
         <link>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2195000326</link>
         <description><![CDATA[<ul><li>Datos de contacto (Direcciones de correo electrónico, números de teléfono)</li><li>Términos de búsqueda.</li><li>URLs.&nbsp;</li></ul>]]></description>
         <enclosure url="" />
         <pubDate>2022-05-23 01:39:33 UTC</pubDate>
         <guid>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2195000326</guid>
      </item>
      <item>
         <title>FUNCIONAMIENTO</title>
         <author>200028201</author>
         <link>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2195006757</link>
         <description><![CDATA[]]></description>
         <enclosure url="" />
         <pubDate>2022-05-23 01:44:29 UTC</pubDate>
         <guid>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2195006757</guid>
      </item>
      <item>
         <title>AUTOMÁTICO</title>
         <author>200028201</author>
         <link>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2195008460</link>
         <description><![CDATA[<div>Se recurre a un <em>software</em> o un algoritmo que analiza diferentes páginas web para extraer información. Se utiliza <em>software</em> especializado según el tipo de página web y el contenido.</div>]]></description>
         <enclosure url="" />
         <pubDate>2022-05-23 01:45:48 UTC</pubDate>
         <guid>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2195008460</guid>
      </item>
      <item>
         <title>MANUAL</title>
         <author>200028201</author>
         <link>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2195008606</link>
         <description><![CDATA[<div>Copiado y pegado manual de información y datos. Raras veces se aplica a grandes cantidades de datos.&nbsp;</div>]]></description>
         <enclosure url="" />
         <pubDate>2022-05-23 01:45:55 UTC</pubDate>
         <guid>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2195008606</guid>
      </item>
      <item>
         <title>TIPOS</title>
         <author>200028201</author>
         <link>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2195016717</link>
         <description><![CDATA[]]></description>
         <enclosure url="" />
         <pubDate>2022-05-23 01:52:14 UTC</pubDate>
         <guid>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2195016717</guid>
      </item>
      <item>
         <title>Analizador Sintáctico</title>
         <author>200028201</author>
         <link>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2195018490</link>
         <description><![CDATA[<div>Los analizadores sintácticos (o <em>parsers</em>) se utilizan para convertir un texto en una nueva estructura. Por ejemplo, en los análisis de HTML, el <em>software</em> lee un documento HTML y almacena la información. </div>]]></description>
         <enclosure url="" />
         <pubDate>2022-05-23 01:53:29 UTC</pubDate>
         <guid>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2195018490</guid>
      </item>
      <item>
         <title>Bots</title>
         <author>200028201</author>
         <link>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2195018693</link>
         <description><![CDATA[<div>Es un <em>software</em> dedicado a realizar determinadas tareas y automatizarlas. En el caso del <em>web harvesting</em>, los <em>bots</em> se utilizan para examinar páginas web automáticamente y recopilar datos.</div>]]></description>
         <enclosure url="" />
         <pubDate>2022-05-23 01:53:39 UTC</pubDate>
         <guid>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2195018693</guid>
      </item>
      <item>
         <title>Texto</title>
         <author>200028201</author>
         <link>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2195018968</link>
         <description><![CDATA[<div>Con la función grep de Unix se puede buscar en la web determinados términos en Python o Perl. Este es un método&nbsp;sencillo para extraer datos, aunque requiere más trabajo que la utilización de un <em>software</em>.</div>]]></description>
         <enclosure url="" />
         <pubDate>2022-05-23 01:53:52 UTC</pubDate>
         <guid>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2195018968</guid>
      </item>
      <item>
         <title>SE UTILIZA PARA</title>
         <author>200028201</author>
         <link>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2195029469</link>
         <description><![CDATA[<ul><li>Recopilar datos de contacto o información especial con gran rapidez.&nbsp;</li><li>Obtener ventajas respecto a la competencia, en el ámbito profesional&nbsp;</li><li>Analizar datos financieros.</li></ul>]]></description>
         <enclosure url="" />
         <pubDate>2022-05-23 02:02:03 UTC</pubDate>
         <guid>https://padlet.com/200028201/5q0mcyvlhmsgkamk/wish/2195029469</guid>
      </item>
   </channel>
</rss>
