Steps of Problem solving

Algoritmos Utilizados 💡
1. Random Forests:
  1. Predicción: Basada en años de educación y experiencia.
  2. Problema: Sobreajuste.
2. Support Vector Machines (SVMs):🏹
  1. Predicción: Funciones lineales.
  2. Problema: Subajuste.
Desafíos Comunes 💪
1. Distribución Irregular:
  1. Datos no uniformemente distribuidos.
2. Ruido en los Datos:
  1. Variabilidad no explicada por los factores considerados.
3. Curse of Dimensionality:
  1. A mayor número de características, mayor riesgo de sobreajuste.
Scikit-learn
1. Es una biblioteca de Python
2. Ventajas:
  1. Accesible:
    1. Herramientas simples y eficientes para análisis predictivo de datos.
  2. Integrado sobre bibliotecas como
    1. NumPy
    2. SciPy
  3. Funcionalidades: Incluye módulos
    1. clasificación
    2. regresión
    3. clustering
    4. reducción de dimensionalidad
    5. selección de modelos
    6. preprocesamiento.
Tipos de Modelos
1. Supervisado
  1. Entrenamiento: Usa datos etiquetados (con respuestas conocidas).
  2. Ejemplo: Predicción de salarios usando años de educación y experiencia laboral.
  3. Problemas: Sobreajuste (overfitting) si el modelo se adapta demasiado a los datos de entrenamiento.
2. No Supervisado
  1. Entrenamiento: Usa datos sin etiquetas (sin respuestas conocidas).
  2. Ejemplo: Agrupación de clientes en segmentos de mercado.
  3. Problemas: Subajuste (underfitting) si el modelo no captura la complejidad de los datos.
¿Qué es un modelo de Machine Learning?
1. Algoritmo que aprende patrones a partir de datos para hacer predicciones o tomar decisiones.