A) Un proceso para seleccionar una muestra aleatoria. B) Un método para calcular la mediana de un conjunto de datos. C) Un tipo de gráfico de barras. D) Un método para modelar la relación entre una variable dependiente y una o más variables independientes.
A) Linealidad de la relación entre las variables independientes y dependiente. B) Independencia de las observaciones. C) Homocedasticidad de los residuos. D) Distribución normal de los residuos.
A) La falta de normalidad de los residuos. B) La relación no lineal entre las variables. C) Cuando las variables independientes están altamente correlacionadas entre sí. D) La presencia de valores atípicos en los datos.
A) Una técnica para evaluar el rendimiento de un modelo al dividir los datos en subconjuntos de entrenamiento y prueba. B) Una técnica para calcular el coeficiente de determinación de un modelo. C) Un enfoque para añadir interacciones entre variables en un modelo. D) Un método para calcular la varianza de los residuos.
A) Distribución normal. B) Distribución binomial. C) Distribución uniforme. D) Distribución exponencial.
A) Un tipo de regresión que solo involucra una variable independiente. B) Un método que requiere que los errores sean independientes y homocedásticos. C) Un enfoque para modelar la relación entre variables sin hacer suposiciones sobre la forma funcional de la relación. D) Un método que solo se usa para datos categóricos.
A) Cuando el modelo se ajusta demasiado a los datos de entrenamiento y no puede generalizar bien a nuevos datos. B) Un error en la recolección de datos que introduce sesgo en el modelo. C) Una técnica para mejorar la precisión del modelo. D) Cuando el modelo es muy simple y no puede capturar la complejidad de los datos.
A) Un método para calcular la correlación entre variables. B) Un método para seleccionar las variables independientes más importantes. C) Un método para encontrar los coeficientes del modelo que minimizan la suma de los cuadrados de los residuos. D) Una técnica para hacer predicciones sin ajustar un modelo.
A) Cuando la varianza de los errores no es constante en función de los valores de las variables independientes. B) La distribución no normal de los datos. C) La falta de linealidad en la relación entre las variables. D) La presencia de valores atípicos en los datos. |