Preguntas etiquetadas con data-mining

Una actividad que busca patrones en conjuntos de datos grandes y complejos. Por lo general, enfatiza las técnicas algorítmicas, pero también puede involucrar cualquier conjunto de habilidades, aplicaciones o metodologías relacionadas con ese objetivo.

13
Agrupación de K-medias para datos numéricos y categóricos mixtos
Mi conjunto de datos contiene varios atributos numéricos y uno categórico. Decir NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr, donde CategoricalAttrtiene uno de los tres valores posibles: CategoricalAttrValue1, CategoricalAttrValue2o CategoricalAttrValue3. Estoy usando la implementación predeterminada del algoritmo de agrupación k-means para Octave https://blog.west.uni-koblenz.de/2012-07-14/a-working-k-means-code-for-octave/ . Funciona solo con datos numéricos. Entonces mi pregunta: …




1

6
¿Cómo hacer SVD y PCA con big data?
Tengo un gran conjunto de datos (alrededor de 8 GB). Me gustaría utilizar el aprendizaje automático para analizarlo. Entonces, creo que debería usar SVD y luego PCA para reducir la dimensionalidad de los datos para la eficiencia. Sin embargo, MATLAB y Octave no pueden cargar un conjunto de datos tan …

3
Coeficiente de Gini vs impureza de Gini - árboles de decisión
El problema se refiere a la construcción de árboles de decisión. Según Wikipedia, el ' coeficiente de Gini ' no debe confundirse con la ' impureza de Gini '. Sin embargo, ambas medidas se pueden usar al construir un árbol de decisión; estas pueden respaldar nuestras elecciones al dividir el …