Τετάρτη, 8 Ιουνίου 2011

Η θεωρία των παιγνίων (I)

Η θεωρία των παιγνίων (game theory) ξεκίνησε σαν κλάδος των οικονομικών με το σπουδαίο βιβλίο των Τζον φον Νόιμαν και Όσκαρ Μόργκενστερν  «Θεωρία Παιγνίων και Οικονομική Συμπεριφορά » πάνω σε παιχνίδια μηδενικού αθροίσματος. Το κύριο αντικείμενό της είναι η ανάλυση των αποφάσεων σε καταστάσεις (παιχνίδια) στρατηγικής αλληλεπίδρασης στα οποία η απώλεια ενός παίκτη είναι ίση με το κέρδος ενός δεύτερου. 

Πλέον, η θεωρία παιγνίων εντάσσεται πλήρως στον κλάδο των εφαρμοσμένων μαθηματικών και οι εφαρμογές της είναι πολλές και ενδιαφέρουσες. Στους περαιτέρω θεμελιωτές ανήκουν:

  • ο Τζον Φορμπς Νας (John Forbes Nash) (η ζωή του έγινε θέμα της ταινίας «Ένας υπέροχος άνθρωπος»), ο οποίος γενίκευσε το πρόβλημα σε παιχνίδια μη μηδενικού αθροίσματος και πρόσφερε σαν λύση την ισορροπία Νας (Nash Equilibrium),
  • ο Ράινχαρντ Ζέλτεν (Reinhard Selten) άνοιξε το δρόμο για ικανοποιητική λύση του προβλήματος σε δυναμικά παιχνίδια με την έννοια της ισορροπίας στα υποπαιχνίδια και της ισορροπίας τρεμάμενου χεριού, 
  • ο Τζον Χαρσάνυι (John Harsanyi) ασχολήθηκε με παιχνίδια υπό μερική πληροφόρηση. 
Για τις εργασίες τους οι τρεις τελευταίοι τιμήθηκαν το 1994 με το βραβείο Νομπέλ. Είναι σίγουρο βέβαια ότι αν ο Τζον φον Νόιμαν ζούσε θα μοιραζόταν και αυτός το βραβείο.

Τα τελευταία 30 χρόνια, η θεωρία παιγνίων έχει βρει ευρύτατη εφαρμογή στα οικονομικά, όπου ολόκληροι κλάδοι στηρίζονται στις μεθόδους της, όπως π.χ. η βιομηχανική οργάνωση, ο σχεδιασμός μηχανισμών με σπουδαιότερο υποκλάδο τον σχεδιασμό δημοπρασιών κ.α.

Επίσης, η θεωρία παιγνίων χρησιμοποιείται και στην Πολιτική Οικονομία και ειδικά στη θεωρία της συλλογικής δράσης, όπου εξηγεί ενδεχόμενα συνεργασίας μεταξύ των παικτών. Επιπρόσθετα χρησιμοποιείται όμως ευρέως και σε άλλες επιστήμες, όπως εξελικτική βιολογία, ψυχολογία, κοινωνιολογία κλπ.

Το δίλημμα του φυλακισμένου

Σε κάποια παιχνίδια δεν προβλέπεται η συνεργασία, αλλά μπορεί να εκδηλωθεί αυθόρμητα. Ένα γνωστό παράδειγμα είναι το «δίλημμα του φυλακισμένου»: δύο εγκληματίες ύποπτοι για τη συμμετοχή σε μια ληστεία συλλαμβάνονται και ανακρίνονται χωριστά.

Ο ανακριτής λέει και στους δύο: «Γνωρίζουμε ότι είστε ένοχοι. Αν εσύ ομολογήσεις και ο συνεργός σου δεν ομολογήσει, θα είσαι ελεύθερος και ο φίλος σου θα εκτίσει ποινή δεκαετούς φυλάκισης. Αν όμως ομολογήσετε και οι δύο, θα μοιραστείτε την ποινή: 5 χρόνια έκαστος. Σε περίπτωση που δεν ομολογήσει κανείς σας, θα πάρετε το ελάχιστο, 1 χρόνο έκαστος. Σε πληροφορώ ότι ο συνεργάτης μου κάνει την ίδια κουβέντα με το συνεργό σου. Τι αποφάσισες να κάνεις;».

Οι δύο παίκτες έχουν όλες τις πληροφορίες (το παιχνίδι είναι «πλήρους πληροφόρησης»), αλλά βρίσκονται χωριστά και δεν μπορούν να επικοινωνήσουν (το παιχνίδι είναι «μη συνεργατικό»).

Για τα παιχνίδια αυτού του είδους ο Νας απέδειξε το 1950, την ύπαρξη μιας ισορροπίας, δηλαδή ενός συνδυασμού «βέλτιστων» στρατηγικών. Στο δίλημμα του φυλακισμένου, η ισορροπία του Νας προβλέπει ότι θα ομολογήσουν και οι δύο. Πράγματι, ο κίνδυνος δεκαετούς φυλάκισης ξεπερνά το δυνητικό όφελος από τη φυλάκιση ενός μόνου χρόνου.

Τα αποτελέσματα αυτού του είδους μπορεί να μοιάζουν προφανή, όμως οι ίδιες τεχνικές υπολογισμού μπορούν να εφαρμοστούν σε καταστάσεις όλο και πιο πολύπλοκες, παρέχοντας λιγότερο προφανή αποτελέσματα.

Ο δείκτης του Σάπλεϊ

Όμως τα λεγόμενα «συνεργατικά παιχνίδια» είναι εξαιρετικά πολύπλοκα. Για παράδειγμα, είναι δύσκολο να καθορίσουμε ποιος από τους πολλούς μετόχους μιας εταιρείας έχει τον έλεγχο, γιατί οι πιθανές συμμαχίες καθιστούν απρόβλεπτη την κατάσταση.

Ας υποθέσουμε ότι το ελληνικό κράτος αποφασίζει να ιδιωτικοποιήσει μια εταιρεία και πρέπει να καθορίσει το ποσοστό που μπορεί να πουλήσει ώστε να συνεχίσει να έχει τον έλεγχό της. Σε πρώτη ανάγνωση φαίνεται ότι, κρατώντας το 51% των μετοχών, το κράτος παραμένει το αφεντικό. Αυτή η απόφαση είναι έξυπνη από οικονομική άποψη; Η απάντηση είναι όχι. Το κράτος μπορεί να συνεχίσει να βρίσκεται στο τιμόνι της εταιρείας κρατώντας το 35% ή και ακόμα λιγότερο. Φυσικά χρειάζεται πολλή προσοχή, γιατί αν το κράτος κρατήσει το 35% και πουλήσει το υπόλοιπο 65% σε ένα μεγιστάνα, η εταιρεία δεν ανήκει πλέον στο ελληνικό κράτος αλλά στο μεγιστάνα. Αν θέλει να διατηρήσει τον έλεγχο, πρέπει να φροντίσει ώστε οι υπόλοιπες μετοχές να καταλήξουν στα χέρια χιλιάδων μικρομετόχων.

Ένα μέτρο για την ικανότητα ελέγχου ενός μετόχου στην εταιρεία είναι ο λεγόμενος «δείκτης ισχύος», που μπορεί να υπολογιστεί με πολλούς τρόπους. Ο πιο γνωστός είναι ο δείκτης του Σάπλεϊ, από το όνομα του εμπνευστή του, Λόιντ Στόγουελ Σάπλεϊ, συμφοιτητή του Νας στο Πρίνστον. Αυτός ο δείκτης μπορεί να χρησιμοποιηθεί και για το διαμερισμό των κερδών, τα οποία δεν είναι απαραιτήτως ανάλογα με τον αριθμό των μετοχών που κατέχει κάθε μέτοχος. Ιδού ένα συγκεκριμένο παράδειγμα: αν το 100% των μετοχών έχει μοιραστεί σε τέσσερις συνεταίρους που κατέχουν αντίστοιχα το 10%, το 20%, το 30% και το 40%, ο δείκτης του Σάπλεϊ προβλέπει ότι τα κέρδη θα διανεμηθούν ως εξής: 8,3%, 25%, 25%, και 41,6%.

Υπολογισμός της «ωφέλειας»

Στα παιχνίδια όπου μπορεί να καθοριστεί η «ωφέλεια» κάθε παίκτη μπορούν να βρεθούν πολύ συγκεκριμένες λύσεις. Ένα καλό παράδειγμα είναι η διαπραγμάτευση, την οποία μελέτησε ο Νας το 1950: δύο άτομα πρέπει να μοιραστούν ένα χρηματικό ποσό, ο ένας είναι πλούσιος ενώ ο άλλος όχι.

Ενώ ο φτωχός, λόγω ανάγκης, θα ικανοποιηθεί ακόμα και με λίγα, ο πλούσιος, λόγω ισχύος, θα ευχαριστηθεί μόνο με πολλά χρήματα. Αυτό το μοντέλο οδηγεί σε ένα άνισο αποτέλεσμα. Στην περίπτωση που έλυσε ο Νας, αν το ποσό είναι 500 ευρώ, ο πλούσιος θα πάρει 310 ενώ ο φτωχός μόλις 190.

Ο Νας λαμβάνει υπόψη ένα θεμελιώδη παράγοντα: τα πράγματα, ακόμα και το χρήμα, έχουν διαφορετική αξία για κάθε άτομο και αυτό επηρεάζει το παιχνίδι.

«Αν παίζουν δύο, συμφέρει να μπλοφάρεις μόνο όταν έχεις τα χειρότερα χαρτιά, όχι όταν έχεις μέτρια».

Σαμαράς - Παπανδρέου

Ερχόμαστε λοιπόν στο περιβόητο ερώτημα. Τι πρέπει να κάνει ο Αντώνης Σαμαράς; Να πει ΝΑΙ ψηφίζω τα μεσοπρόθεσμο, ή ΟΧΙ δεν τα ψηφίζω. Πριν απαντήσει κανείς ελαφρά την καρδία πρέπει να λάβει υπόψη του ότι για να κερδίσει ο Αντώνης Σαμαράς πρέπει να μπορεί να «παίξει» και με τα δύο δεδομένα. Και με το ΝΑΙ και με το ΟΧΙ.

Εδώ όμως χρειάζεται προσοχή για να έχει κάποιος το πάνω χέρι γιατί όπως είπαμε τα λεγόμενα «συνεργατικά παιχνίδια» είναι εξαιρετικά πολύπλοκα. Για παράδειγμα, είναι δύσκολο να καθορίσουμε ποιος από τους συμμετέχοντες «παίκτες» στο παιγνίδι έχει τον έλεγχο, γιατί οι πιθανές συμμαχίες καθιστούν απρόβλεπτη την κατάσταση.

Αν θέλουμε λοιπόν να εφαρμόσουμε το «δίλλημα του φυλακισμένου» για να δώσουμε μια απάντηση στο τι πρέπει να πράξει ο αρχηγός της ΝΔ τότε λοιπόν οδηγούμαστε υποχρεωτικά στη συνετή λύση της παρακάτω ισορροπίας.

«Πάει ο Παπανδρέου στην ψήφιση με τους 150; - ο Αντώνης διαλέγει το ΟΧΙ αφού δεν έχει να χάσει τίποτε, ούτε να του καταλογισθούν ευθύνες. Πάει ο Παπανδρέου στην ψήφιση με τους 180; – ο Αντώνης διαλέγει το ΝΑΙ για να συμβάλλει στην διάσωση του κράτους αφού τη θέση του αυτή την προβάλλει ως αναγκαστική κίνηση σωτηρίας του κράτους».

Οι παραπάνω κινήσεις του Αντώνη Σαμαρά αποτελούν την μοναδική «βέλτιστη λύση» για την Νέα Δημοκρατία και τον Αντώνη Σαμαρά και βγάζει στο περιθώριο τον Πρωθυπουργό που θα πρέπει στο τέλος δημόσια να ευχαριστήσει την Αντώνη για την θέση ευθύνης που θα πάρει (λέμε τώρα...)

Το παράδοξο του εκβιαστή

Οι Ρούμπεν και Σάιμον βρίσκονται μέσα σε ένα μικρό δωμάτιο με μια βαλίτσα που περιέχει 100.000 δολάρια σε μετρητά. Ο ιδιοκτήτης της βαλίτσας τούς κάνει την παρακάτω πρόταση: 
«Θα σας δώσω όλα τα χρήματα της βαλίτσας αλλά μόνο με την προϋπόθεση ότι θα διαπραγματευτείτε και θα καταλήξετε σε μία φιλική συμφωνία για το μοίρασμα. Αυτός είναι και ο μοναδικός τρόπος για να σας δώσω τα χρήματα».

Ο Rούμπεν που είναι λογικός άνθρωπος, εκτιμά την χρυσή ευκαιρία που του παρουσιάστηκε και απευθύνετε προς τον Σάιμον με την εξής προφανή πρόταση: 
«Έλα, εσύ θα πάρεις το μισό ποσό και εγώ το άλλο μισό, έτσι ο καθένας μας θα φύγει με 50.000 δολάρια». Προς έκπληξή του, ο Σάιμον με σοβαρό πρόσωπο και αποφασιστική φωνή λέει: «Άκουσε, δεν ξέρω ποιες είναι οι προθέσεις σου για τα λεφτά αλλά εγώ δεν φεύγω από αυτό το δωμάτιο με λιγότερα από 90.000 δολάρια. Πάρ’ τα ή φύγε. Εγώ είμαι απόλυτα προετοιμασμένος να γυρίσω στο σπίτι μου χωρίς τίποτα».

Ο Rούμπεν δεν μπορεί να πιστέψει στα αυτιά του. Τι συνέβη στον Σάιμον; διερωτάται. Γιατί θα πρέπει να πάρει αυτός 90% και εγώ μόνο 10%; Αποφασίζει να μιλήσει στον Σάιμον. 
«Έλα, λογικέψου» τον παρακαλεί. «Και οι δυο μας είμαστε μέσα και οι δυο μας θέλουμε τα λεφτά. Ας μοιράσουμε το ποσόν στα ίσια και ας προχωρήσουμε μπροστά».

Όμως η λογική εξήγηση του φίλου του, δεν φαίνεται να έχει αποτέλεσμα στον Σάιμον. Ακούει προσεκτικά τα λόγια του Ρούμπεν αλλά τότε δηλώνει με ακόμη μεγαλύτερη έμφαση: 
«Δεν υπάρχει τίποτε να συζητήσουμε. 90-10 ή τίποτε, αυτή είναι η τελική μου προσφορά!». Το πρόσωπο του Ρούμπεν κοκκινίζει από θυμό. Θέλει να σκαμπιλίσει τον Σάιμον αλλά σύντομα το ξανασκέφτεται.

Συνειδητοποιεί ότι ο Σάιμον είναι αποφασισμένος να φύγει με τα περισσότερα χρήματα και ότι ο μοναδικός τρόπος να φύγει από το δωμάτιο με κάποια χρήματα είναι να υποκύψει στον εκβιασμό του Σάιμον. Ισιώνει τα ρούχα του, βγάζει από τη βαλίτσα το ποσό των 10.000 δολαρίων, ανταλλάσσει χειρονομία με τον Σάιμον και φεύγει ελεεινός από το δωμάτιο.


Αυτή η περίπτωση ονομάζεται 
«το παράδοξο του εκβιαστή». Το παράδοξο που εμφανίζεται σε αυτήν την περίπτωση είναι ότι ο λογικός Ρούμπεν αναγκάζεται τελικά να δράσει πασιφανώς παράλογα προκειμένου να κερδίσει το μέγιστο που είναι διαθέσιμο γι’ αυτόν. Η λογική πίσω από αυτό το παράξενο αποτέλεσμα είναι ότι ο Σάιμον εκπέμπει μια ολοκληρωτική πίστη και αυτοπεποίθηση στις υπέρμετρες αξιώσεις του και ότι είναι ικανός να πείσει τον Ρούμπεν να υποκύψει στον εκβιασμό προκειμένου να εξασφαλίσει το ελάχιστο κέρδος.

H εφαρμογή στη Βιολογία

Τέλος, θα πρέπει να σταθούμε στην εφαρμογή της θεωρίας παιγνίων στη Βιολογία, δηλαδή στην εφαρμογή της «καλύτερης στρατηγικής» στον (συν)ανταγωνισμό ή στη συνεργασία μεταξύ παικτών σε επίπεδο ειδών ή μεμονωμένων ζώων. Αυτό έχει γίνει στις περιπτώσεις εκείνες όπου είναι δύσκολο να προβλέψει κανείς τα αποτελέσματα της φυσικής επιλογής, επειδή το καλύτερο που μπορεί να γίνει εξαρτάται από το τι κάνουν τα άλλα μέλη ενός πληθυσμού.

Οι τεχνικές της θεωρίας παιγνίων χρησιμοποιήθηκαν πράγματι σε απλά μοντέλα «εξελικτικών παιχνιδιών» για να προσφέρουν μιαν εξήγηση για την εξέλιξη ορισμένων χαρακτηριστικών. Ετσι ο βρετανός βιολόγος John Maynard Smith διατύπωσε μια εξελικτική θεωρία παιγνίων, καταλήγοντας στην έννοια της «εξελικτικά σταθερής στρατηγικής» που, αν όλα σχεδόν τα μέλη ενός πληθυσμού υιοθετήσουν, καμία άλλη μεταλλαγμένη στρατηγική δεν μπορεί να αποδώσει καλύτερα έναντί της και να την «απειλήσει» μέσα στον πληθυσμό.

Από την άλλη μεριά, κάποιοι είχαν ήδη υποθέσει ότι πιθανόν δεν χρειάζεται ένα τέλεια ορθολογικό ον για να αναγνωρίσει την καλύτερη στρατηγική και προσπάθησαν να εφαρμόσουν τη θεωρία σε μοντέλα θεμελιωδών μικροβιολογικών δομών. Το ενδιαφέρον είναι ότι ανακαλύφθηκε πως μικροσκοπικά μόρια RNA μπορεί πράγματι να εμπλακούν σε απλά παιχνίδια δύο παικτών.

Σχετικό
Η θεωρία των παιγνίων (ΙI)

Πηγές
Wikipedia
Atopo
Perierga
Το Βήμα

Δεν υπάρχουν σχόλια