Tip:
Highlight text to annotate it
X
Καλό είναι να πούμε μερικές βασικές ορολογίες
που χρησιμοποιούνται συχνά στην Τεχνητή Νοημοσύνη
Η πρώτη που θα σας μάθω είναι: ολικώς ή μερικώς παρατηρήσιμο (fully ή partially observable).
Ένα περιβάλλον ονομάζεται ολικώς παρατηρήσιμο, αν τα στοιχεία των αισθητήρων του πράκτορα σας
σε οποιαδήποτε χρονική στιγμή, είναι αρκετά για να ληφθεί η ιδανική απόφαση.
Έτσι για παράδειγμα, σε πολλά παιχνίδια με χαρτιά
όταν όλες οι κάρτες είναι στο τραπέζι, η στιγμιαία εμφάνιση όλων των χαρτιών
είναι αρκετή ώστε να ληφθεί η ιδανική απόφαση.
Αντιθέτως, σε άλλα περιβάλλοντα χρειάζεται να χρησιμοποιηθεί μνήμη
από τον πράκτορα, για να ληφθεί η καλύτερη δυνατή απόφαση.
Για παράδειγμα, στο παιχνίδι του πόκερ, τα χαρτιά δεν φαίνονται πάνω στο τραπέζι
και η απομνημόνευση προηγούμενων κινήσεων σας βοηθά να πάρετε μια καλύτερη απόφαση.
Για να καταλάβετε καλύτερα την διαφορά, σκεφτείτε την αλληλεπίδραση ενός πράκτορα
και του περιβάλλοντος του, μέσω των αισθητήρων και ενεργοποιητών
και αυτήν η αλληλεπίδραση γίνεται στη διάρκεια πολλών κύκλων
που λέγεται κύκλος αντίληψης και δράσης (perception-action cycle).
Για πολλά περιβάλλοντα, μας βολεύει να υποθέτουμε
πώς έχουνε κάποιου είδους εσωτερική κατάσταση.
Για παράδειγμα, σε ένα παιχνίδι με χαρτιά, με τα χαρτιά να μην βρίσκονται πάνω στο τραπέζι
η κατάσταση μπορεί να αφορά τα χαρτιά που βρίσκονται στο χέρι μας.
Ένα περιβάλλον είναι ολικώς παρατηρήσιμο, αν οι αισθητήρες μπορούν πάντα να βλέπουν
όλες τις καταστάσεις του περιβάλλοντος.
Είναι μερικώς παρατηρήσιμο, αν οι αισθητήρες μπορούν μόνο να βλέπουν μία κατάσταση,
αλλά απομνημονεύοντας παλιότερες μετρήσεις, μας δίνει πρόσθετες πληροφορίες για την κατάσταση
που δεν μπορούμε να δούμε αυτή τη στιγμή.
Έτσι για παράδειγμα, ένα παιχνίδι στο οποίο οι προηγούμενες κινήσεις μας δώσανε πληροφορίες για
το τι μπορεί να κρατά κάποιος στο χέρι του, λέγεται μερικώς παρατηρήσιμο
και χρειάζεται διαφορετικό σκεπτικό.
Πολύ συχνά, πράκτορες που ασχολούνται με μερικώς παρατηρήσιμα περιβάλλοντα
χρειάζονται εσωτερική μνήμη για να καταλάβουν ποιά
είναι η κατάσταση του περιβάλλοντος, και θα μιλήσουμε εκτενώς γι'αυτό
όταν πούμε για κρυμμένα μοντέλα Μάρκωφ (hidden Markov models) και πώς αυτήν η δομή
έχει τέτοια εσωτερική μνήμη.
Μια δεύτερη ορολογία για τα περιβάλλοντα αφορά στο αν ένα περιβάλλον
είναι ντετερμινιστικό (deterministic) ή στοχαστικό (stochastic).
Ντετερμινιστικό περιβάλλον είναι αυτό, όπου οι πράξεις του πράκτορα
καθορίζουν μοναδικά το αποτέλεσμα.
Έτσι για παράδειγμα, στο σκάκι δεν παίζει ρόλο η τύχη όταν κουνάτε ένα πιόνι.
Η επίδραση της κίνησης του πιονιού είναι προκαθορισμένη
και όπου κι αν κουνήσω το ίδιο πιόνι, το αποτέλεσμα είναι το ίδιο.
Αυτό λέγεται ντετερμινιστικό.
Παιχνίδια με ζάρια, για παράδειγμα το τάβλι, είναι στοχαστικά.
Αν και κουνάτε τα πούλια με ντετερμινιστικό τρόπο
το αποτέλεσμα μιας δράσης εξαρτάται από το ρίξιμο ενός ζαριού
και αυτό δεν μπορείς να το προβλέψεις.
Υπάρχει ο παράγοντας της τύχης για το αποτέλεσμα του ζαριού
κι έτσι αυτό το ονομάζουμε στοχαστικό.
Ας μιλήσουμε για διακριτό (discrete) και συνεχές (continuous).
Ένα διακριτό περιβάλλον είναι αυτό που έχουμε πεπερασμένο αριθμό επιλογών
και πεπερασμένο αριθμό πολλών αντικειμένων παρατήρησης.
Έτσι για παράδειγμα, πάλι για το σκάκι, υπάρχει ένας πεπερασμένος μεγάλος αριθμός θέσεων στην σκακιέρα
και πεπερασμένος αριθμός πολλών επιλογών που μπορούμε να κάνουμε.
Αυτό είναι διαφορετικό από ένα συνεχές περιβάλλον
όπου ο αριθμός των πιθανών επιλογών και δεδομένων παρατήρησης μπορεί να είναι άπειρος.
Έτσι για παράδειγμα, όταν ρίχνετε βελάκια, υπάρχουν άπειρες γωνίες που μπορείτε να δώσετε στο βελάκι όταν το ρίχνετε
και άπειρες επιταχύνσεις που θα του προσδώσετε.
Τέλος, ξεχωρίζουμε τα καλοήθη και ανταγωνιστικά περιβάλλοντα.
Στα καλοήθη περιβάλλοντα, το περιβάλλον μπορεί να είναι τυχαίο.
Μπορεί να είναι στοχαστικό, αλλά δεν έχει κάποιον δικό του σκοπό
που έρχεται σε αντίθεση με τον δικό σας σκοπό.
Έτσι για παράδειγμα, ο καιρός είναι καλοήθης.
Μπορεί να είναι τυχαίος.Μπορεί να επηρεάσει το αποτέλεσμα των πράξεων σας.
Αλλά δεν έχει ώς σκοπό να σας κάνει χαλάστρα.
Αντίθετα από τα ανταγωνιστικά περιβάλλοντα, όπως σε πολλά παιχνίδια σαν το σκάκι
όπου ο αντίπαλος έχει σκοπό να σας κερδίσει.
Είναι πολύ πιο δύσκολο να βρείς τις σωστές πράξεις σε ανταγωνιστικά περιβάλλοντα
όπου ο αντίπαλος σας παρατηρεί και εξουδετερώνει ότι προσπαθείτε να πετύχετε
αντίθετα από τα καλοήθη περιβάλλοντα, όπου το περιβάλλον μπορεί απλά να είναι στοχαστικό
αλλά δεν ενδιαφέρεται να σας κάνει τη ζωή δύσκολη.
Άς δούμε σε τι βαθμό καταλάβατε αυτούς τους ορισμούς
με το επόμενο κουίζ.
Εδώ είναι πάλι οι 4 ορολογίες: μερικώς παρατηρήσιμο και ολικώς
στοχαστικό και ντετερμινιστικό, διακριτό και συνεχές,
ανταγωνιστικό και καλοήθης.
Και δείτε το παιχνίδι της ντάμας.
Επιλέξτε ένα ή όλα από τα χαρακτηριστικά που θεωρείτε σωστά.
Έτσι, αν πιστεύετε πως η ντάμα είναι μερικώς παρατηρήσιμο, επιλέξτε αυτό.
Αλλίως μην το επιλέγετε.
Αν πιστεύετε πως είναι στοχαστικό, επιλέξτε αυτό
συνεχές επιλέξτε αυτό, ανταγωνιστικό επιλέξτε αυτό.
Εάν δεν ξέρετε το παιχνίδι της ντάμας, μπορείτε να ψάξετε στο Διαδίκτυο
για περισσότερες πληροφορίες σχετικά με το παιχνίδι.