Preguntas etiquetadas con scikit-learn

Scikit-learn es un módulo de Python que comprende una herramienta simple y eficiente para el aprendizaje automático, la minería de datos y el análisis de datos. Está construido en NumPy, SciPy y matplotlib. Se distribuye bajo la licencia BSD de 3 cláusulas.

8
¿Diferencia entre fit y fit_transform en modelos scikit_learn?
Soy novato en la ciencia de datos y no entiendo la diferencia entre fity fit_transformmétodos en scikit-learn. ¿Alguien puede simplemente explicar por qué podríamos necesitar transformar los datos? ¿Qué significa ajustar el modelo en los datos de entrenamiento y transformarlos en datos de prueba? ¿Significa, por ejemplo, convertir variables categóricas …






1

3
Comprender predic_proba de MultiOutputClassifier
Estoy siguiendo este ejemplo en el sitio web scikit-learn para realizar una clasificación de múltiples salidas con un modelo de bosque aleatorio. from sklearn.datasets import make_classification from sklearn.multioutput import MultiOutputClassifier from sklearn.ensemble import RandomForestClassifier from sklearn.utils import shuffle import numpy as np X, y1 = make_classification(n_samples=5, n_features=5, n_informative=2, n_classes=2, random_state=1) …



5
Cálculo de divergencia de KL en Python
Soy bastante nuevo en esto y no puedo decir que tengo una comprensión completa de los conceptos teóricos detrás de esto. Estoy tratando de calcular la divergencia de KL entre varias listas de puntos en Python. Estoy usando http://scikit-learn.org/stable/modules/generated/sklearn.metrics.mutual_info_score.html para intentar hacer esto. El problema con el que me encuentro …


3
Diferencia entre OrdinalEncoder y LabelEncoder
Estaba revisando la documentación oficial de scikit-learn learn después de leer un libro sobre ML y encontré lo siguiente: En la Documentación se trata, sklearn.preprocessing.OrdinalEncoder()mientras que en el libro se trata sklearn.preprocessing.LabelEncoder(), cuando verifiqué su funcionalidad, me pareció lo mismo. ¿Puede alguien decirme la diferencia entre los dos por favor?