A) Να εξετάσει τη σχέση μεταξύ των μεταβλητών. B) Για να δημιουργήσετε οπτικές αναπαραστάσεις δεδομένων. C) Για να υπολογίσετε τους μέσους όρους των αριθμητικών δεδομένων. D) Για να συνοψίσουμε κατηγορηματικά δεδομένα.
A) Το μέγεθος του συνόλου δεδομένων. B) Το είδος της στατιστικής δοκιμής που χρησιμοποιείται. C) Ο αριθμός των μεταβλητών στο μοντέλο. D) Πόσο καλά ταιριάζει το μοντέλο στα παρατηρούμενα δεδομένα.
A) Γραμμικότητα B) Κανονική κατανομή των υπολειμμάτων C) Ομοσκεδαστικότητα D) Ανεξαρτησία παρατηρήσεων
A) Όταν ένα μοντέλο είναι πολύ απλό και στερείται προγνωστικής ισχύος. B) Όταν ένα μοντέλο ταιριάζει απόλυτα στα δεδομένα εκπαίδευσης αλλά αποτυγχάνει σε νέα δεδομένα. C) Όταν ένα μοντέλο είναι σωστό και γενικεύει καλά σε αόρατα δεδομένα. D) Όταν ένα μοντέλο είναι πολύ περίπλοκο και καταγράφει θόρυβο στα δεδομένα.
A) PCA B) ANOVA C) Δέντρο απόφασης D) Λογιστική παλινδρόμηση
A) Για να δημιουργήσετε ένα ενιαίο σύνθετο μέτρο από πολλές μεταβλητές. B) Για να ομαδοποιήσετε παρόμοια σημεία δεδομένων με βάση μοτίβα ή χαρακτηριστικά. C) Να σχεδιάσετε σημεία δεδομένων σε δισδιάστατο χώρο. D) Να διερευνήσει τις σχέσεις αιτίου-αποτελέσματος.
A) Ανάλυση παλινδρόμησης B) Διασταυρωμένη επικύρωση C) Ανάλυση κύριου συστατικού D) Τεστ Chi-square
A) Για να ταιριάζει ακριβώς το μοντέλο στα δεδομένα εκπαίδευσης. B) Για τη δημιουργία νέων μεταβλητών εισόδου από υπάρχοντα δεδομένα για τη βελτίωση της απόδοσης του μοντέλου. C) Για να αφαιρέσετε όλες τις μεταβλητές εισόδου εκτός από την πιο σημαντική. D) Για την αυτοματοποίηση ολόκληρης της διαδικασίας μοντελοποίησης.
A) Να αξιολογήσει την απόδοση ενός μοντέλου ταξινόμησης. B) Για να συνοψίσουμε την κατανομή ενός συνόλου δεδομένων. C) Για την αξιολόγηση της καλής προσαρμογής στην λογιστική παλινδρόμηση. D) Για να ελέγξετε την υπόθεση της γραμμικότητας σε μοντέλα παλινδρόμησης. |