<?xml version="1.0"?>
<rss version="2.0">
   <channel>
      <title>Apache Spark by RAMOS BENITES, SERGIO RAUL</title>
      <link>https://padlet.com/1438240/3k407yscjo3nu45u</link>
      <description></description>
      <language>en-us</language>
      <pubDate>2024-04-27 13:09:50 UTC</pubDate>
      <lastBuildDate>2024-04-27 14:12:09 UTC</lastBuildDate>
      <webMaster>hello@padlet.com</webMaster>
      <image>
         <url></url>
      </image>
      <item>
         <title>¿Para qué sirve APACHE SPARK?</title>
         <author>971148_1</author>
         <link>https://padlet.com/1438240/3k407yscjo3nu45u/wish/2971974339</link>
         <description><![CDATA[<p>Sirve para procesar grandes conjuntos de datos. En este framework, los programadores pueden trabajar sin preocuparse por la <strong>distribución del trabajo y la tolerancia a fallos.</strong>&nbsp;</p><p><strong>Está Diseñado para cubrir una amplia gama de cargas de trabajo</strong> que previamente requerían sistemas distribuidos diferentes.</p><p>Incluyen procesamiento batch, algoritmos iterativos, queries interactivas, procesamiento streaming… a menudo empleados todos ellos en un pipeline típico de análisis de datos.</p><p>Spark es flexible en su utilización, y es que <strong>ofrece una serie de APIs que permiten a usuarios con diferentes backgrounds poder utilizarlo</strong>. Incluye APIs de Python, Java, Scala, SQL y R.</p><p><br/></p><p>Fuente:</p><p><br/></p><p><a rel="noopener noreferrer nofollow" href="https://www.tokioschool.com/noticias/introduccion-apache-spark/">https://www.tokioschool.com/noticias/introduccion-apache-spark/</a></p><p><br/></p><p><a rel="noopener noreferrer nofollow" href="https://www.esic.edu/rethink/tecnologia/apache-spark-introduccion-que-es-y-como-funciona">https://www.esic.edu/rethink/tecnologia/apache-spark-introduccion-que-es-y-como-funciona</a></p><p><br/></p><p>Sergio Ramos</p>]]></description>
         <enclosure url="https://padlet-uploads.storage.googleapis.com/2449846079/0d7edde11e6cb9b3d1c421321bdda410/1_3GKp9NXXfLGfxGs64pFiAA.png" />
         <pubDate>2024-04-27 13:13:41 UTC</pubDate>
         <guid>https://padlet.com/1438240/3k407yscjo3nu45u/wish/2971974339</guid>
      </item>
      <item>
         <title>¿Que es APACHE SPARK?</title>
         <author>971148_1</author>
         <link>https://padlet.com/1438240/3k407yscjo3nu45u/wish/2971975037</link>
         <description><![CDATA[<p>Apache Spark es una plataforma de código abierto ampliamente utilizada para el procesamiento de datos a gran escala. Es preferida por su velocidad, escalabilidad y facilidad de uso, ideal para operar con grandes conjuntos de datos en entornos distribuidos en su papel de la ingeniería de datos, su arquitectura y componentes principales son muy buenos, así como los diversos enfoques de implementación y casos de uso comunes en este campo.</p><p><br></p><p><br></p><p>Fuente:</p><p><a rel="noopener noreferrer nofollow" href="https://medium.com/@DataEngineeer/introduction-to-apache-spark-for-data-engineering-d2060166165a"><em><mark>https://medium.com/@DataEngineeer/introduction-to-apache-spark-for-data-engineering-d2060166165a</mark></em></a></p><p><br></p><p>Danfer Moriano</p><p><br></p>]]></description>
         <enclosure url="https://padlet-uploads.storage.googleapis.com/2450506843/12cacf08860562cfb4be759df3ce0e32/9b7e1b03_spark_0.png" />
         <pubDate>2024-04-27 13:15:11 UTC</pubDate>
         <guid>https://padlet.com/1438240/3k407yscjo3nu45u/wish/2971975037</guid>
      </item>
      <item>
         <title>¿Cuál es la historia de Apache Spark?</title>
         <author>moiseslobo08</author>
         <link>https://padlet.com/1438240/3k407yscjo3nu45u/wish/2971976640</link>
         <description><![CDATA[<p>Apache Spark se originó en 2009 dentro de un proyecto de investigación en el Amplab de la Universidad de California en Berkeley. Este proyecto era una colaboración entre estudiantes, investigadores y profesores, y se enfocaba en aplicaciones que requerían un manejo extensivo de datos.</p><p><br></p><p> La meta de Spark era desarrollar un nuevo framework diseñado para procesamiento iterativo rápido, como el aprendizaje automático y el análisis interactivo de datos, manteniendo al mismo tiempo la capacidad de escalabilidad y tolerancia a fallos de Hadoop MapReduce.</p><p><br></p><p>El primer artículo descriptivo, denominado "Spark: Cluster Computing with Working Sets" (Spark: Computación en clúster con conjuntos de trabajo), fue publicado en junio de 2010, y el proyecto fue liberado como código abierto bajo una licencia BSD. Spark puede operar de manera autónoma, en Apache Mesos o, más comúnmente, en Apache Hadoop.</p><p><br></p><p><br></p><p><br></p><p><em><mark>Fuente: </mark></em></p><p><br></p><p><a rel="noopener noreferrer nofollow" href="https://www.bigdata.uma.es/apache-spark-un-poco-de-historia/"><em><mark>https://www.bigdata.uma.es/apache-spark-un-poco-de-historia/</mark></em></a></p><p><br></p><p><a rel="noopener noreferrer nofollow" href="https://es.wikipedia.org/wiki/Apache_Spark">https://es.wikipedia.org/wiki/Apache_Spark</a></p><p><br></p><p>Yohangel lobo</p><p><br></p>]]></description>
         <enclosure url="https://padlet-uploads.storage.googleapis.com/2415234047/dd3373a5d0875088905b36cf21091c82/Franklin__Mike_web_1.jpg" />
         <pubDate>2024-04-27 13:18:51 UTC</pubDate>
         <guid>https://padlet.com/1438240/3k407yscjo3nu45u/wish/2971976640</guid>
      </item>
      <item>
         <title>¿Cuáles son los casos de uso de Apache Spark?</title>
         <author>1443863_1</author>
         <link>https://padlet.com/1438240/3k407yscjo3nu45u/wish/2971980482</link>
         <description><![CDATA[<p>1. <strong>Servicios financieros</strong>:</p><p>En la banca, Spark se utiliza para predecir la pérdida de clientes y recomendar nuevos productos financieros.</p><p>En la banca de inversión, ayuda en el análisis de precios de acciones y predicción de tendencias futuras.</p><p>2. <strong>Atención sanitaria</strong>:</p><p>Se utiliza para proporcionar una atención integral al paciente, poniendo datos a disposición de los trabajadores de salud para cada interacción con el paciente.</p><p>También puede utilizarse para predecir o recomendar tratamientos.</p><p>3. <strong>Fabricación</strong>:</p><p>En la fabricación, Spark se emplea para reducir el tiempo de inactividad de los equipos conectados a Internet, recomendando cuándo realizar mantenimiento preventivo.</p><p>4. <strong>Comercio minorista</strong>:</p><p>Se usa para atraer y retener clientes mediante ofertas y servicios personalizados.</p><p><br></p><p>fuentes:</p><p><a rel="noopener noreferrer nofollow" href="https://aws.amazon.com/es/what-is/apache-spark/">https://aws.amazon.com/es/what-is/apache-spark/</a></p><p><br></p><p><a rel="noopener noreferrer nofollow" href="https://docs.netapp.com/es-es/netapp-solutions/data-analytics/apache-spark-use-cases-summary.html#transmisi%C3%B3n-de-datos">https://docs.netapp.com/es-es/netapp-solutions/data-analytics/apache-spark-use-cases-summary.html#transmisi%C3%B3n-de-datos</a></p><p><br></p><p>Marliz Cerron</p>]]></description>
         <enclosure url="https://padlet-uploads.storage.googleapis.com/2450511966/8809f0933fef811753bffe5c59ff3e75/image.png" />
         <pubDate>2024-04-27 13:26:46 UTC</pubDate>
         <guid>https://padlet.com/1438240/3k407yscjo3nu45u/wish/2971980482</guid>
      </item>
      <item>
         <title>¿Qué Empresas grandes utilizan Apache Spark?</title>
         <author>1438240</author>
         <link>https://padlet.com/1438240/3k407yscjo3nu45u/wish/2971981019</link>
         <description><![CDATA[<ul><li><p><strong>Facebook: </strong>Utiliza Spark para generar miles de millones de datos de usuarios, desde publicaciones y comentarios hasta interacciones y métricas de rendimiento. <br><mark>(</mark><a rel="noopener noreferrer nofollow" href="https://www.facebook.com/databricksinc/"><mark>https://www.facebook.com/databricksinc/</mark></a><mark>)</mark></p></li><li><p><strong>Netflix:</strong> Analiza datos de visualización para comprender las preferencias de los usuarios y ofrecer recomendaciones personalizadas. Spark también los ayuda a optimizar la entrega de contenido y gestionar el ancho de banda. <mark>(</mark><a rel="noopener noreferrer nofollow" href="https://www.databricks.com/dataaisummit/session/stranger-triumphs-automating-spark-upgrades-migrations-netflix"><mark>https://www.databricks.com/dataaisummit/session/stranger-triumphs-automating-spark-upgrades-migrations-netflix</mark></a><mark>)</mark></p></li><li><p><strong>Amazon:</strong> Emplea Spark para procesar grandes conjuntos de datos de productos, pedidos y actividades de los clientes. Esto les permite mejorar la búsqueda de productos, optimizar las recomendaciones y gestionar el inventario de manera eficiente. <mark>(</mark><a rel="noopener noreferrer nofollow" href="https://www.amazon.com/databricks/s?k=databricks"><mark>https://www.amazon.com/databricks/s?k=databricks</mark></a><mark>)</mark></p></li></ul>]]></description>
         <enclosure url="https://metro.co.uk/wp-content/uploads/2021/06/topimage-28ca.gif?quality=90&amp;strip=all&amp;zoom=1&amp;resize=644%2C357" />
         <pubDate>2024-04-27 13:28:06 UTC</pubDate>
         <guid>https://padlet.com/1438240/3k407yscjo3nu45u/wish/2971981019</guid>
      </item>
      <item>
         <title>¿Cómo funciona Apache Spark?</title>
         <author></author>
         <link>https://padlet.com/1438240/3k407yscjo3nu45u/wish/2971981498</link>
         <description><![CDATA[<p>Apache Spark es un&nbsp;motor de procesamiento distribuido que se encarga de orquestar, distribuir y monitorizar aplicaciones que contienen  múltiples tareas de procesamiento de datos sobre varias máquinas de trabajo, que forman un cluster.</p><p><br/></p><p>A pesar de ello,<strong>&nbsp;</strong>Spark no almacena datos en sí mismo, sino que tiene el foco puesto en el procesamiento.</p><p><br/></p><p>Es importante hablar de la velocidad de procesamiento:&nbsp;la clave es la posibilidad que ofrece Spark para realizar el procesamiento en memoria a velocidades sorprendentes. </p><p><br/></p><p>Jasiel Lozada</p><p><br/></p><p>Fuentes: </p><p><br/></p><p><a rel="noopener noreferrer nofollow" href="https://www.bigdata.uma.es/apache-spark-introduccion-que-es-y-como-funciona/"><em><mark>https://www.bigdata.uma.es/apache-spark-introduccion-que-es-y-como-funciona/</mark></em></a></p><p><br/></p><p><a rel="noopener noreferrer nofollow" href="https://aws.amazon.com/es/what-is/apache-spark/"><em><mark>https://aws.amazon.com/es/what-is/apache-spark/</mark></em></a></p><p><br/></p>]]></description>
         <enclosure url="https://padlet-uploads.storage.googleapis.com/2450512298/b702b3ba6656f83e90ab87c5a210330d/pasted_image_0.png" />
         <pubDate>2024-04-27 13:29:02 UTC</pubDate>
         <guid>https://padlet.com/1438240/3k407yscjo3nu45u/wish/2971981498</guid>
      </item>
      <item>
         <title>¿Cuáles son las diferentes herramientas de Spark?
</title>
         <author>1438240</author>
         <link>https://padlet.com/1438240/3k407yscjo3nu45u/wish/2971984949</link>
         <description><![CDATA[<p>Spark es un marco informático de clúster de código abierto que proporciona un conjunto de herramientas para el procesamiento de datos distribuidos.Algunas de las herramientas y componentes principales de Apache Spark son:</p><p><br/></p><p><strong>Spark Core:</strong> es el núcleo del proyecto Spark y proporciona la funcionalidad principal para el procesamiento de datos, incluida la API RDD (Resilient Distributed Dataset), que es una colección distribuida inmutable de objetos. </p><p><br><strong>Spark SQL:</strong> le permite ejecutar consultas SQL en datos estructurados, integrando el procesamiento de SQL con el código Spark existente.</p><p><br/></p><p><strong>Spark Streaming:</strong> Puede integrarse con varias fuentes de datos como Kafka, Flume, Kinesis, etc., y realizar análisis de los datos en tiempo real.</p><p><br/></p><p><strong>MLlib (Machine Learning Library):</strong> Se trata de una biblioteca de aprendizaje automático escalable que ofrece algoritmos y herramientas para realizar análisis predictivos y modelado de datos a gran escala. <br></p><p><strong>Spark GraphX:</strong> es una biblioteca de procesamiento de gráficos distribuido que forma parte de Apache Spark, un marco de código abierto para el procesamiento distribuido de grandes conjuntos de datos.</p><p><br/></p><p><br/></p><p><a rel="noopener noreferrer nofollow" href="https://www.bigdata.uma.es/que-es-spark-y-como-revoluciona-al-big-data-y-al-machine-learning/"><mark>https://www.bigdata.uma.es/que-es-spark-y-como-revoluciona-al-big-data-y-al-machine-learning/</mark></a></p><p><br/></p><p><a rel="noopener noreferrer nofollow" href="https://spark.apache.org/"><mark>https://spark.apache.org/</mark></a></p>]]></description>
         <enclosure url="https://miro.medium.com/v2/resize:fit:720/format:webp/1*JyR1tXPK4G3uhSfCbMK-1g.gif" />
         <pubDate>2024-04-27 13:36:03 UTC</pubDate>
         <guid>https://padlet.com/1438240/3k407yscjo3nu45u/wish/2971984949</guid>
      </item>
      <item>
         <title>¿Cuáles son los beneficios de Apache Spark?
</title>
         <author></author>
         <link>https://padlet.com/1438240/3k407yscjo3nu45u/wish/2971989244</link>
         <description><![CDATA[<p>Apache Spark tiene muchas ventajas que lo convierten en uno de los proyectos más activos de Hadoop. </p><p>Entre ellas se incluyen:</p><p><strong><mark>Rápido</mark></strong></p><p>Mediante el almacenamiento en memoria caché y una ejecución de consultas optimizada puede ejecutar consultas de análisis rápidas en datos de cualquier tamaño.</p><p><strong><mark>Idóneo para desarrolladores</mark></strong></p><p>Apache Spark dispone de compatibilidad nativa con Java, Scala, R y Python, con lo que dispone de diversos lenguajes para crear sus aplicaciones. Estas API facilitan las cosas a sus desarrolladores, ya que ocultan la complejidad del procesamiento distribuido detrás de operadores simples y de alto nivel, lo que reduce drásticamente la cantidad de código requerida.</p><p><strong><mark>Varias cargas de trabajo</mark></strong></p><p>Apache Spark ofrece la capacidad de ejecutar varias cargas de trabajo, incluidas consultas interactivas, el análisis en tiempo real, machine learning y el procesamiento de gráficos. Una aplicación puede combinar varias cargas de trabajo sin problemas.</p><p><br/></p><p>Fuentes:</p><p><a rel="noopener noreferrer nofollow" href="https://www.bbvaapimarket.com/es/mundo-api/apache-spark-las-ventajas-de-usar-al-nuevo-rey-de-big-data/"><mark>https://www.bbvaapimarket.com/es/mundo-api/apache-spark-las-ventajas-de-usar-al-nuevo-rey-de-big-data/</mark></a></p><p><br/></p><p>Ariana Yupanqui</p>]]></description>
         <enclosure url="https://padlet-uploads.storage.googleapis.com/2450512594/b45733f9721f091418721b5abe04d440/apache_spark_image1.png" />
         <pubDate>2024-04-27 13:45:10 UTC</pubDate>
         <guid>https://padlet.com/1438240/3k407yscjo3nu45u/wish/2971989244</guid>
      </item>
   </channel>
</rss>
