A) Un proceso para seleccionar una muestra aleatoria. B) Un método para calcular la mediana de un conjunto de datos. C) Un tipo de gráfico de barras. D) Un método para modelar la relación entre una variable dependiente y una o más variables independientes.
A) Linealidad de la relación entre las variables independientes y dependiente. B) Independencia de las observaciones. C) Distribución normal de los residuos. D) Homocedasticidad de los residuos.
A) La falta de normalidad de los residuos. B) La presencia de valores atípicos en los datos. C) La relación no lineal entre las variables. D) Cuando las variables independientes están altamente correlacionadas entre sí.
A) Una técnica para evaluar el rendimiento de un modelo al dividir los datos en subconjuntos de entrenamiento y prueba. B) Un método para calcular la varianza de los residuos. C) Una técnica para calcular el coeficiente de determinación de un modelo. D) Un enfoque para añadir interacciones entre variables en un modelo.
A) Distribución binomial. B) Distribución uniforme. C) Distribución exponencial. D) Distribución normal.
A) Un enfoque para modelar la relación entre variables sin hacer suposiciones sobre la forma funcional de la relación. B) Un tipo de regresión que solo involucra una variable independiente. C) Un método que solo se usa para datos categóricos. D) Un método que requiere que los errores sean independientes y homocedásticos.
A) Una técnica para mejorar la precisión del modelo. B) Cuando el modelo es muy simple y no puede capturar la complejidad de los datos. C) Cuando el modelo se ajusta demasiado a los datos de entrenamiento y no puede generalizar bien a nuevos datos. D) Un error en la recolección de datos que introduce sesgo en el modelo.
A) Una técnica para hacer predicciones sin ajustar un modelo. B) Un método para calcular la correlación entre variables. C) Un método para seleccionar las variables independientes más importantes. D) Un método para encontrar los coeficientes del modelo que minimizan la suma de los cuadrados de los residuos.
A) La distribución no normal de los datos. B) La presencia de valores atípicos en los datos. C) La falta de linealidad en la relación entre las variables. D) Cuando la varianza de los errores no es constante en función de los valores de las variables independientes. |