<?xml version="1.0"?>
<rss version="2.0">
   <channel>
      <title>Aprendizaje no supervisado by Damian Dapueto</title>
      <link>https://padlet.com/ddapueto/crd1lt5zxleld8ay</link>
      <description>DataScience</description>
      <language>en-us</language>
      <pubDate>2022-04-13 22:03:12 UTC</pubDate>
      <lastBuildDate>2025-12-23 05:35:49 UTC</lastBuildDate>
      <webMaster>hello@padlet.com</webMaster>
      <image>
         <url></url>
      </image>
      <item>
         <title>Aprendizaje No Supervisado</title>
         <author></author>
         <link>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143190039</link>
         <description><![CDATA[<div>Un ejemplo de aprendizaje no supervisado sería la de segmentar los pacientes que han sido atendidos en urgencias en grupos homogéneos pero sin un conocimiento previo de los grupos que&nbsp; queremos obtener; lo haríamos a partir de estructuras no evidentes subyacentes en los datos.</div>]]></description>
         <enclosure url="" />
         <pubDate>2022-04-14 01:02:08 UTC</pubDate>
         <guid>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143190039</guid>
      </item>
      <item>
         <title>Algoritmo KMeans – Formas para encontrar el número K de iteración:</title>
         <author></author>
         <link>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143191054</link>
         <description><![CDATA[]]></description>
         <enclosure url="https://padlet-uploads.storage.googleapis.com/1659100420/b1a0f9e492fe3408fc85023407ee96f0/image.png" />
         <pubDate>2022-04-14 01:03:07 UTC</pubDate>
         <guid>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143191054</guid>
      </item>
      <item>
         <title>Algoritmo PCA</title>
         <author></author>
         <link>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143192385</link>
         <description><![CDATA[<div><br>l análisis de componentes principales (<em>Principal Component Analysis PCA</em>) es un método de reducción de dimensionalidad que permite simplificar la complejidad de espacios con múltiples dimensiones a la vez que conserva su información.<br><br></div><div><br>Supóngase que existe una muestra con&nbsp;<br>nn individuos cada uno con&nbsp;<br>pp variables (<br><br>X<br>1X1,&nbsp;<br><br>X<br>2X2, ...,&nbsp;<br><br>X<br>pXp), es decir, el espacio muestral tiene&nbsp;<br>pp dimensiones. PCA permite encontrar un número de factores subyacentes&nbsp;<br>(z&lt;p)(z&lt;p) que explican aproximadamente lo mismo que las&nbsp;<br>pp variables originales. Donde antes se necesitaban&nbsp;<br>pp valores para caracterizar a cada individuo, ahora bastan&nbsp;<br>zz valores. Cada una de estas&nbsp;<br>zz nuevas variables recibe el nombre de componente principal.<br><br></div><div><br></div><div>El método de PCA permite por lo tanto "condensar" la información aportada por múltiples variables en solo unas pocas componentes. Aun así, no hay que olvidar que sigue siendo necesario disponer del valor de las variables originales para calcular las componentes. Dos de las principales aplicaciones del PCA son la visualización y el preprocesado de predictores previo ajuste de modelos supervisados.<br><br></div><div><br>La librería <a href="https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html"><strong>scikitlearn</strong></a> contiene la clase sklearn.decomposition.PCA que implementa la mayoría de las funcionalidades necesarias para crear y utilizar modelos PCA. Para visualizaciones, <a href="https://www.scikit-yb.org/en/latest/api/features/pca.html"><strong>Yellowbrick</strong></a> ofrece funcionalidades extra.<br><br></div>]]></description>
         <enclosure url="" />
         <pubDate>2022-04-14 01:04:23 UTC</pubDate>
         <guid>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143192385</guid>
      </item>
      <item>
         <title>Aprendisaje No Supervisado -  Algoritmos</title>
         <author>boletindharmaprema</author>
         <link>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143194486</link>
         <description><![CDATA[<div>USOS COMUNES:<br>MKT - BIOLOGIA - SEGUROS - DESASTRES NATURALES<br><br>Parametricos / No Parametricos<br><br>Jerarquicos<br><br>Cluster -&nbsp; Agrupamientos<br>&nbsp;EJemplo de algoritmo de agrupamiento.<br>Agrupación K-Meedias<br>El algoritmo K-Means tiene como objetivo encontrar y agrupar en clases los puntos de datos que tienen una alta similitud entre ellos. En los términos del algoritmo, esta similitud se entiende como lo opuesto de la distancia entre puntos de datos. Cuanto más cerca estén los puntos de datos, más similares y con más probabilidades de pertenecer al mismo clúster serán.<br><br>Modelos de Mezcla Gaussiana (MMG)<br>Los Modelos de Mezcla Gaussiana son modelos probabilísticos que asumen que todas las muestras son generadas a partir de una mezcla de un número de finita de distribución gaussiana con parámetros desconocidos.<br>Pertenece al grupo de algoritmos de agrupamiento blando en el que cada punto de datos pertenecerá a cada grupo existente en el conjunto de datos, pero con diferentes niveles de pertenencia a cada grupo. Esta membresía se asigna como la probabilidad de pertenecer a un determinado grupo, que oscila entre 0 y 1.<br><br><strong>Agrupamiento jerárquico:</strong> crea una jerarquía multinivel de clústeres mediante la creación de un árbol de clústeres.<br><br><br><br></div>]]></description>
         <enclosure url="https://padlet-uploads.storage.googleapis.com/1666932256/73003ce0c4a75943497367e5ff458dfe/image.png" />
         <pubDate>2022-04-14 01:06:21 UTC</pubDate>
         <guid>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143194486</guid>
      </item>
      <item>
         <title>Importancia del aprendizaje no supervisado</title>
         <author></author>
         <link>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143195822</link>
         <description><![CDATA[<div>El aprendizaje no supervisado pretende descubrir patrones previamente desconocidos en los datos, pero la mayoría de las veces estos patrones son aproximaciones pobres de lo que puede lograr el aprendizaje supervisado. Por ejemplo, los algoritmos no supervisados segmentarán a los clientes en grupos grandes en lugar de tratarlos como individuos y permitir que las empresas entreguen comunicaciones altamente personalizadas. La definición del aprendizaje no supervisado es que no se sabe cuál será el resultado para un modelo predictivo, lo que significa que el aprendizaje supervisado es más aplicable a contextos del mundo real.<br><br>El aprendizaje no supervisado pretende descubrir patrones previamente desconocidos en los datos, pero la mayoría de las veces estos patrones son aproximaciones pobres de lo que puede lograr el aprendizaje supervisado. Por ejemplo, los algoritmos no supervisados segmentarán a los clientes en grupos grandes en lugar de tratarlos como individuos y permitir que las empresas entreguen comunicaciones altamente personalizadas. La definición del aprendizaje no supervisado es que no se sabe cuál será el resultado para un modelo predictivo, lo que significa que el aprendizaje supervisado es más aplicable a contextos del mundo real.</div>]]></description>
         <enclosure url="" />
         <pubDate>2022-04-14 01:07:42 UTC</pubDate>
         <guid>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143195822</guid>
      </item>
      <item>
         <title>Aprendizaje No Supervisado - Reglas de asociación (Association rules)</title>
         <author></author>
         <link>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143196210</link>
         <description><![CDATA[<div>Se pueden citar los modelos basados en el descubrimiento de reglas de asociación (Association Rules). A lo que también se le conoce como análisis de la cesta de la compra (Market Basket Analysis) ya que surgieron en este entorno. Siendo unos tipos de análisis extremadamente importantes dentro de la minería de datos.

En estos análisis se busca identificar reglas las cuales predicen la probabilidad de que se observe un consecuente después de observar un antecedente en un registro. Lo que se suele denotar A =&gt; B, donde A es el antecedente y B el consecuente. Pudiendo ser tanto el antecedente como el consecuente un elemento o un conjunto de elementos.

Para obtener las reglas se suele partir de una colección de transacciones con diferentes elementos. La importancia de las reglas generalmente se mide en base al soporte, la probabilidad de observar el antecede y consecuente en los registros, y confianza, la probabilidad de observar el consecuente una vez observado el antecedente. Siendo importante notar que el sentido de la regla lo define el valor de la confianza.

Algunos de los algoritmos más utilizados para obtener las reglas de asociación son Apriori y Eclat.<br>apriori y eclat están como ejemplos del modelo<br>&nbsp;<br><br></div>]]></description>
         <enclosure url="" />
         <pubDate>2022-04-14 01:08:05 UTC</pubDate>
         <guid>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143196210</guid>
      </item>
      <item>
         <title>Segmentación de Audiencia</title>
         <author></author>
         <link>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143198558</link>
         <description><![CDATA[<div>Se suele utilizar el aprendizaje no supervisado para crear y descubrir patrones no conocidos en el comportamiento de los clientes de una web, app o comercio. Estos algoritmos pueden descubrir grupos que desconocíamos por completo o agrupar ciertas características que se correlacionan y que nosotros difícilmente lo hubiéramos identificado.<br><br></div>]]></description>
         <enclosure url="" />
         <pubDate>2022-04-14 01:10:08 UTC</pubDate>
         <guid>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143198558</guid>
      </item>
      <item>
         <title>Algoritmo KMeans – Formas para encontrar el número K de iteración:</title>
         <author></author>
         <link>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143204062</link>
         <description><![CDATA[]]></description>
         <enclosure url="https://padlet-uploads.storage.googleapis.com/1659100420/5712415aeeb967a0660fcb95aeffeb11/image.png" />
         <pubDate>2022-04-14 01:15:04 UTC</pubDate>
         <guid>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143204062</guid>
      </item>
      <item>
         <title>la Densidad con Ruido (DBSCAN)</title>
         <author></author>
         <link>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143206031</link>
         <description><![CDATA[<div><br>La Agrupación Espacial Basada en Densidad de Aplicaciones con Ruido, o DBSCAN (Density-Based Spatial Clustering of Applications with Noise), es otro algoritmo de agrupación especialmente útil para identificar correctamente el ruido en los datos.</div><div><strong><br>Criterios de Asignación de DBSCAN</strong></div><div><br>Se basa en un número de puntos con un radio especificado ε y hay una etiqueta especial asignada a cada punto de datos. El proceso de asignación de esta etiqueta es el siguiente:</div><ul><li>Es un número especificado (MinPts) de puntos vecinos. Se asignará un punto central si existe este número de puntos de los MinPts que caen en el radio ε</li><li>Un punto fronterizo caerá en el radio de ε de un punto central, pero tendrá menos vecinos que el número de MinPts.</li><li>Todos los demás puntos serán puntos de ruido.</li></ul><div><strong><br>Algoritmo DBSCAN</strong></div><div><br>El algoritmo sigue la lógica:</div><ol><li>Identificar un punto central y hacer un grupo para cada uno, o para cada grupo conectado de puntos centrales (si es que establecen que el criterio es el punto central).</li><li>Identificar y asignar puntos fronterizos a sus respectivos puntos centrales.</li></ol><div><br>La siguiente figura resume muy bien este proceso y la notación comentada.<br>DBSCAN vs. K-Means Clustering</div><div><br></div>]]></description>
         <enclosure url="" />
         <pubDate>2022-04-14 01:16:45 UTC</pubDate>
         <guid>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143206031</guid>
      </item>
      <item>
         <title>Modelo no supervisado</title>
         <author></author>
         <link>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143207815</link>
         <description><![CDATA[<div>https://healthdataminer.com/analitica-en-accion/modelos-no-supervisados-en-salud-clusterizando-celulas/</div>]]></description>
         <enclosure url="https://healthdataminer.com/analitica-en-accion/modelos-no-supervisados-en-salud-clusterizando-celulas/" />
         <pubDate>2022-04-14 01:18:14 UTC</pubDate>
         <guid>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143207815</guid>
      </item>
      <item>
         <title>Algoritmo KMeans – Código Python</title>
         <author></author>
         <link>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143207834</link>
         <description><![CDATA[<div><a href="https://www.aprendemachinelearning.com/k-means-en-python-paso-a-paso/">K-Means con Python paso a paso | Aprende Machine Learning</a><br><br>import pandas as pd</div><div>import numpy as np</div><div>import matplotlib.pyplot as plt</div><div>import seaborn as sb</div><div>from sklearn.cluster import KMeans</div><div>from sklearn.metrics import pairwise_distances_argmin_min</div><div>&nbsp;</div><div>%matplotlib inline</div><div>from mpl_toolkits.mplot3d import Axes3D</div><div>plt.rcParams['figure.figsize'] = (16, 9)</div><div>plt.style.use('ggplot')<br><br>dataframe = pd.read_csv(r"analisis.csv")</div><div>dataframe.head()<br><br>dataframe.describe()<br><br>print(dataframe.groupby('categoria').size())<br><br>dataframe.drop(['categoria'],1).hist()<br><br>sb.pairplot(dataframe.dropna(), hue='categoria',size=4,vars=["op","ex","ag"],kind='scatter')</div><div>plt.show()<br><br><br>23 | X = np.array(dataframe[["op","ex","ag"]])y = np.array(dataframe['categoria'])X.shape<br><br>fig = plt.figure()</div><div>ax = Axes3D(fig)</div><div>colores=['blue','red','green','blue','cyan','yellow','orange','black','pink','brown','purple']</div><div>asignar=[]</div><div>for row in y:</div><div>&nbsp; &nbsp; asignar.append(colores[row])</div><div>ax.scatter(X[:, 0], X[:, 1], X[:, 2], c=asignar,s=60)<br><br>Nc = range(1, 20)</div><div>kmeans = [KMeans(n_clusters=i) for i in Nc]</div><div>kmeans</div><div>score = [kmeans[i].fit(X).score(X) for i in range(len(kmeans))]</div><div>score</div><div>plt.plot(Nc,score)</div><div>plt.xlabel('Number of Clusters')</div><div>plt.ylabel('Score')</div><div>plt.title('Elbow Curve')</div><div>plt.show()<br><br>kmeans = KMeans(n_clusters=5).fit(X)</div><div>centroids = kmeans.cluster_centers_</div><div>print(centroids)<br><br># Getting the values and plotting it<br><br><br></div><div>Python</div><div>1234567 | # Getting the values and plotting itf1 = dataframe['op'].valuesf2 = dataframe['ag'].values plt.scatter(f1, f2, c=asignar, s=70)plt.scatter(C[:, 0], C[:, 2], marker='*', c=colores, s=1000)plt.show()</div><div>f1 = dataframe['op'].values</div><div>f2 = dataframe['ex'].values</div><div>&nbsp;</div><div>plt.scatter(f1, f2, c=asignar, s=70)</div><div>plt.scatter(C[:, 0], C[:, 1], marker='*', c=colores, s=1000)</div><div>plt.show()</div><div>Python</div><div>12345678910111213 | # Predicting the clusterslabels = kmeans.predict(X)# Getting the cluster centersC = kmeans.cluster_centers_colores=['red','green','blue','cyan','yellow']asignar=[]for row in labels:&nbsp; &nbsp; asignar.append(colores[row]) fig = plt.figure()ax = Axes3D(fig)ax.scatter(X[:, 0], X[:, 1], X[:, 2], c=asignar,s=60)ax.scatter(C[:, 0], C[:, 1], C[:, 2], marker='*', c=colores, s=1000)<br><br><br>23456 | f1 = dataframe['ex'].valuesf2 = dataframe['ag'].values plt.scatter(f1, f2, c=asignar, s=70)plt.scatter(C[:, 1], C[:, 2], marker='*', c=colores, s=1000)plt.show()<br><br><br></div><div>Python</div><div>12345678 | copy =&nbsp; pd.DataFrame()copy['usuario']=dataframe['usuario'].valuescopy['categoria']=dataframe['categoria'].valuescopy['label'] = labels;cantidadGrupo =&nbsp; pd.DataFrame()cantidadGrupo['color']=colorescantidadGrupo['cantidad']=copy.groupby('label').size()cantidadGrupo<br><br><br></div><div>Python</div><div>1234567 | group_referrer_index = copy['label'] ==0group_referrals = copy[group_referrer_index] diversidadGrupo =&nbsp; pd.DataFrame()diversidadGrupo['categoria']=[0,1,2,3,4,5,6,7,8,9]diversidadGrupo['cantidad']=group_referrals.groupby('categoria').size()diversidadGrupo<br><br>#vemos el representante del grupo, el usuario cercano a su centroid</div><div>closest, _ = pairwise_distances_argmin_min(kmeans.cluster_centers_, X)</div><div>closest<br><br>users=dataframe['usuario'].values</div><div>for row in closest:</div><div>&nbsp; &nbsp; print(users[row])<br><br><br></div><div>Python</div><div>1234 | X_new = np.array([[45.92,57.74,15.66]]) #davidguetta new_labels = kmeans.predict(X_new)print(new_labels)</div>]]></description>
         <enclosure url="https://www.aprendemachinelearning.com/k-means-en-python-paso-a-paso/" />
         <pubDate>2022-04-14 01:18:15 UTC</pubDate>
         <guid>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143207834</guid>
      </item>
      <item>
         <title>Clustering (Agrupamiento), K-Means</title>
         <author></author>
         <link>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143212707</link>
         <description><![CDATA[<div>El <strong>clustering</strong> consiste en la agrupación automática de datos. Es un tipo de aprendizaje automático no-supervisado. En castellano se denomina <em>agrupamiento</em>. Vamos a ver en más detalle en qué consiste el clustering, el algoritmo de agrupamiento más popular: K-Means y algunos ejemplos en python.<br><br>Por ejemplo, se puede utilizar para detectar las posiciones de ciertos jugadores dentro de la cancha.<br>La idea de este ejercicio es <strong>agrupar </strong>(clustering) en cuatro grupos (cluster) a los jugadores en función de sus características de juego (portero, defensa, central, delantero). El objetivo será ver si las diferentes agrupaciones que el algoritmo detecta son coherentes con las dinámicas del fútbol.<br><br><em>K-means es un algoritmo de clasificación no supervisada (clusterización) que agrupa objetos en k grupos basándose en sus características. El agrupamiento se realiza minimizando la suma de distancias entre cada objeto y el centroide de su grupo o cluster. Se suele usar la distancia cuadrática.<br><br>Lo importante en este caso es detectar la cantidad de K o grupos. Para ello existen dos métodos. Elbow o Sulhuette.<br><br></em><br>Método del codo (Elbow Method)<br><br></div><div>Este método utiliza los valores de la inercia obtenidos tras aplicar el K-means a diferente número de Clusters (desde 1 a N Clusters), siendo la inercia la suma de las distancias al cuadrado de cada objeto del Cluster a su centroide:<br><br><br></div>]]></description>
         <enclosure url="https://padlet-uploads.storage.googleapis.com/1659101183/489ddc7a6822033c967e309ee67bea98/0_M9gP2Q4MYd__VWPe.gif" />
         <pubDate>2022-04-14 01:22:09 UTC</pubDate>
         <guid>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143212707</guid>
      </item>
      <item>
         <title>Isolation Forest o Detección de Anomalías // Sala 4</title>
         <author></author>
         <link>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143212784</link>
         <description><![CDATA[<div>Isolation Forest es un método utilizado para la detección de anomalías fuero de los valores normales del dataset o dataframe.<br>Dicho método presenta una manera diferente para&nbsp; aislar explícitamente las anomalías utilizando árboles binarios, lo que demuestra una nueva posibilidad de un detector de anomalías más rápido que apunta directamente a las anomalías sin perfilar todas las instancias normales.<br><br>En cuanto a las ventajas y aplicaciones, lo mismo habilita la posibilidad de detectar anomalías dentro de dataset de gran tamaño, lo cual resulta dificultoso de manera visual, consumiendo así, menor cantidad de memoria.&nbsp;<br><br>Por ejemplo, en el siguiente enlace es posible encontrar un modelo diseña para la detección de anomalías dentro de valores aleatorias. Si bien el mismo se basa en un dataset pequeño, este presenta de manera gráfica y simple los casos en los que se podría utilizar este tipo de métodología.&nbsp;<br><br>Link al Dataset:<br>https://scikit-learn.org/stable/auto_examples/ensemble/plot_isolation_forest.html</div>]]></description>
         <enclosure url="https://en.wikipedia.org/wiki/Isolation_forest#Algorithm" />
         <pubDate>2022-04-14 01:22:13 UTC</pubDate>
         <guid>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143212784</guid>
      </item>
      <item>
         <title>Ejemplo de Aplicacion de Algoritmos No Supervisados</title>
         <author></author>
         <link>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143214123</link>
         <description><![CDATA[<div>Un ejemplo es la construccion de Sistemas de Recomendacion. Son esos sitemas que le recomiendan cosas al Usuario segun sus preferencias.<br><br>Los sistemas de recomendacion pueden ser:&nbsp;<br>*Por contenido: Recomienda segun productos similares que le gustan al usuario<br>*Colaborativo: Recomienda en base a loque otros usuarios similares les gusta<br><br><br>https://www.kaggle.com/code/basu369victor/recommender-system-using-un-supervised-learning/notebook</div>]]></description>
         <enclosure url="" />
         <pubDate>2022-04-14 01:23:21 UTC</pubDate>
         <guid>https://padlet.com/ddapueto/crd1lt5zxleld8ay/wish/2143214123</guid>
      </item>
   </channel>
</rss>
