-
Algoritmos Utilizados 馃挕
-
Random Forests:
- Predicci贸n:
Basada en a帽os de educaci贸n y experiencia.
- Problema:
Sobreajuste.
-
Support Vector Machines (SVMs):馃徆
- Predicci贸n:
Funciones lineales.
- Problema:
Subajuste.
-
Desaf铆os Comunes 馃挭
-
Distribuci贸n Irregular:
- Datos no uniformemente distribuidos.
-
Ruido en los Datos:
- Variabilidad no explicada por los factores considerados.
-
Curse of Dimensionality:
- A mayor n煤mero de caracter铆sticas, mayor riesgo de sobreajuste.
-
Scikit-learn
- Es una biblioteca de Python
-
Ventajas:
-
Accesible:
- Herramientas simples y eficientes para an谩lisis predictivo de datos.
-
Integrado sobre bibliotecas como
- NumPy
- SciPy
-
Funcionalidades:
Incluye m贸dulos
- clasificaci贸n
- regresi贸n
- clustering
- reducci贸n de dimensionalidad
- selecci贸n de modelos
- preprocesamiento.
-
Tipos de Modelos
-
Supervisado
- Entrenamiento:
Usa datos etiquetados (con respuestas conocidas).
- Ejemplo:
Predicci贸n de salarios usando a帽os de educaci贸n y experiencia laboral.
- Problemas:
Sobreajuste (overfitting) si el modelo se adapta demasiado a los datos de entrenamiento.
-
No Supervisado
- Entrenamiento:
Usa datos sin etiquetas (sin respuestas conocidas).
- Ejemplo:
Agrupaci贸n de clientes en segmentos de mercado.
- Problemas:
Subajuste (underfitting) si el modelo no captura la complejidad de los datos.
-
驴Qu茅 es un modelo de Machine Learning?
- Algoritmo que aprende patrones a partir de datos para hacer predicciones o tomar decisiones.