A) Crear representaciones visuales de los datos. B) Examinar la relación entre variables. C) Para calcular medias de datos numéricos. D) Resumir datos categóricos.
A) Cómo de bien se ajusta el modelo a los datos observados. B) El tipo de prueba estadística utilizada. C) El tamaño del conjunto de datos. D) Número de variables del modelo.
A) Linealidad B) Independencia de las observaciones C) Homoscedasticidad D) Distribución normal de los residuos
A) Cuando un modelo es correcto y generaliza bien a datos desconocidos. B) Cuando un modelo se ajusta perfectamente a los datos de entrenamiento pero falla con datos nuevos. C) Cuando un modelo es demasiado simple y carece de poder predictivo. D) Cuando un modelo es demasiado complejo y capta ruido en los datos.
A) Regresión logística B) PCA C) ANOVA D) Árbol de decisión
A) Investigar las relaciones causa-efecto. B) Trazar puntos de datos en un espacio bidimensional. C) Para crear una única medida compuesta a partir de múltiples variables. D) Agrupar puntos de datos similares basándose en patrones o características.
A) Prueba Chi-cuadrado B) Análisis de componentes principales C) Validación cruzada D) Análisis de regresión
A) Crear nuevas variables de entrada a partir de datos existentes para mejorar el rendimiento del modelo. B) Para eliminar todas las variables de entrada excepto la más importante. C) Automatizar todo el proceso de modelización. D) Para ajustar el modelo exactamente a los datos de entrenamiento.
A) Resumir la distribución de un conjunto de datos. B) Para comprobar el supuesto de linealidad en los modelos de regresión. C) Evaluar el rendimiento de un modelo de clasificación. D) Evaluar la bondad del ajuste en la regresión logística. |