Preguntas etiquetadas con python

Úselo para preguntas de ciencia de datos relacionadas con el lenguaje de programación Python. No está destinado a preguntas generales de codificación (-> stackoverflow).


8
¿Diferencia entre fit y fit_transform en modelos scikit_learn?
Soy novato en la ciencia de datos y no entiendo la diferencia entre fity fit_transformmétodos en scikit-learn. ¿Alguien puede simplemente explicar por qué podríamos necesitar transformar los datos? ¿Qué significa ajustar el modelo en los datos de entrenamiento y transformarlos en datos de prueba? ¿Significa, por ejemplo, convertir variables categóricas …

15
Python vs R para aprendizaje automático
Estoy empezando a desarrollar una aplicación de aprendizaje automático para fines académicos. Actualmente estoy usando R y entrenándome en ello. Sin embargo, en muchos lugares, he visto personas que usan Python . ¿Qué utilizan las personas en la academia y la industria, y cuál es la recomendación?


1
Diferencia entre isna () e isnull () en pandas
He estado usando pandas por bastante tiempo. Pero, no entendí cuál es la diferencia entre isna()y isnull()en los pandas. Y, lo que es más importante, cuál usar para identificar los valores faltantes en el marco de datos. ¿Cuál es la diferencia básica subyacente de cómo se detecta un valor como …




8
Agrupación de coordenadas de ubicación geográfica (lat, pares largos)
¿Cuál es el enfoque correcto y el algoritmo de agrupación para la agrupación de geolocalización? Estoy usando el siguiente código para agrupar las coordenadas de geolocalización: import numpy as np import matplotlib.pyplot as plt from scipy.cluster.vq import kmeans2, whiten coordinates= np.array([ [lat, long], [lat, long], ... [lat, long] ]) x, …


4
Redes neuronales: ¿qué función de costo usar?
Estoy usando TensorFlow para experimentos principalmente con redes neuronales. Aunque he realizado bastantes experimentos (XOR-Problema, MNIST, algunas cosas de Regresión, ...) ahora, me cuesta elegir la función de costo "correcta" para problemas específicos porque en general podría ser considerado un principiante. Antes de venir a TensorFlow, codifiqué algunos MLP completamente …

9
ValueError: la entrada contiene NaN, infinito o un valor demasiado grande para dtype ('float32')
Obtuve ValueError al predecir datos de prueba usando un modelo RandomForest. Mi código: clf = RandomForestClassifier(n_estimators=10, max_depth=6, n_jobs=1, verbose=2) clf.fit(X_fit, y_fit) df_test.fillna(df_test.mean()) X_test = df_test.values y_pred = clf.predict(X_test) El error: ValueError: Input contains NaN, infinity or a value too large for dtype('float32'). ¿Cómo encuentro los valores incorrectos en el conjunto …



3
Multi GPU en keras
¿Cómo puede programar en la biblioteca de keras (o flujo de tensor) para particionar el entrenamiento en múltiples GPU? Digamos que se encuentra en una instancia de Amazon ec2 que tiene 8 GPU y desea utilizarlas todas para entrenar más rápido, pero su código es solo para una sola CPU …