A) Resumir datos categóricos. B) Examinar la relación entre variables. C) Para calcular medias de datos numéricos. D) Crear representaciones visuales de los datos.
A) El tipo de prueba estadística utilizada. B) Número de variables del modelo. C) El tamaño del conjunto de datos. D) Cómo de bien se ajusta el modelo a los datos observados.
A) Homoscedasticidad B) Linealidad C) Distribución normal de los residuos D) Independencia de las observaciones
A) Cuando un modelo es correcto y generaliza bien a datos desconocidos. B) Cuando un modelo es demasiado complejo y capta ruido en los datos. C) Cuando un modelo se ajusta perfectamente a los datos de entrenamiento pero falla con datos nuevos. D) Cuando un modelo es demasiado simple y carece de poder predictivo.
A) Árbol de decisión B) PCA C) ANOVA D) Regresión logística
A) Investigar las relaciones causa-efecto. B) Agrupar puntos de datos similares basándose en patrones o características. C) Para crear una única medida compuesta a partir de múltiples variables. D) Trazar puntos de datos en un espacio bidimensional.
A) Prueba Chi-cuadrado B) Análisis de componentes principales C) Análisis de regresión D) Validación cruzada
A) Para ajustar el modelo exactamente a los datos de entrenamiento. B) Crear nuevas variables de entrada a partir de datos existentes para mejorar el rendimiento del modelo. C) Automatizar todo el proceso de modelización. D) Para eliminar todas las variables de entrada excepto la más importante.
A) Resumir la distribución de un conjunto de datos. B) Evaluar el rendimiento de un modelo de clasificación. C) Evaluar la bondad del ajuste en la regresión logística. D) Para comprobar el supuesto de linealidad en los modelos de regresión. |