Η τεχνητή νοημοσύνη μας κολακεύει και αυτό δεν είναι για καλό - Τι δείχνει νέα μελέτη
Ένα chatbot που λέει πάντα «έχεις δίκιο» μπορεί να μας κάνει λιγότερο υπεύθυνους, προειδοποιούν επιστήμονες.
Οι εφαρμογές τεχνητής νοημοσύνης έχουν μπει για τα καλά στην καθημερινότητα εκατομμυρίων ανθρώπων, από απλές πληροφορίες μέχρι απαντήσεις σε προσωπικά διλήμματα. Όμως νέα επιστημονική έρευνα δείχνει ότι ένα φαινομενικά «αθώο» χαρακτηριστικό τους μπορεί να έχει σοβαρές συνέπειες: η τάση τους να συμφωνούν υπερβολικά με τον χρήστη, ακόμη και όταν αυτός κάνει λάθος ή περιγράφει ανήθικες πράξεις.
Οι ερευνητές ονομάζουν αυτή τη συμπεριφορά «συκοφαντική κολακεία» (sycophancy) και εξηγούν ότι πρόκειται για τη συνήθεια των μοντέλων να λένε στους ανθρώπους αυτό που θέλουν να ακούσουν. Αντί να αμφισβητούν μια άποψη ή να προσφέρουν μια πιο ισορροπημένη οπτική, συχνά επιλέγουν να επιβεβαιώσουν τον χρήστη, κάτι που μπορεί να φαίνεται ευχάριστο αλλά να αποδεικνύεται επικίνδυνο.
Τι εξέτασε η μελέτη και πώς έγινε
Η έρευνα, που βασίστηκε σε 11 από τα πιο σύγχρονα μοντέλα τεχνητής νοημοσύνης, προσπάθησε να απαντήσει σε δύο βασικά ερωτήματα: πόσο συχνά τα συστήματα αυτά «χαϊδεύουν τα αυτιά» των χρηστών και τι επίδραση έχει αυτό στη συμπεριφορά τους.
Στο πρώτο σκέλος, οι επιστήμονες ανέλυσαν απαντήσεις των μοντέλων σε διαφορετικά σενάρια: από καθημερινές συμβουλές μέχρι ηθικά διλήμματα και περιπτώσεις όπου ο χρήστης περιέγραφε παράνομες ή επιβλαβείς πράξεις. Στη συνέχεια, συνέκριναν αυτές τις απαντήσεις με ανθρώπινες απαντήσεις από αντίστοιχες διαδικτυακές συζητήσεις.
Στο δεύτερο σκέλος, συμμετείχαν 2.405 άτομα, τα οποία είτε συζητούσαν υποθετικά σενάρια είτε πραγματικές προσωπικές δυσκολίες που είχαν ζήσει, με τη βοήθεια ενός chatbot. Οι ερευνητές κατέγραψαν πώς επηρέαζαν οι απαντήσεις την κρίση, τα συναισθήματα και τις προθέσεις των χρηστών.
Τι βρήκαν οι επιστήμονες
Τα αποτελέσματα ήταν ξεκάθαρα και ανησυχητικά. Τα μοντέλα τεχνητής νοημοσύνης επιβεβαίωναν τις απόψεις των χρηστών περίπου 49% πιο συχνά από ό,τι οι άνθρωποι. Ακόμη πιο εντυπωσιακό είναι ότι αυτό ίσχυε ακόμα και όταν επρόκειτο για ανήθικες, παραπλανητικές ή παράνομες ενέργειες.
Σε πλατφόρμες όπου οι χρήστες ζητούν την άποψη του ΑΙ για το αν «έκαναν το σωστό», η τεχνητή νοημοσύνη έτεινε να συμφωνεί σε πάνω από τις μισές περιπτώσεις όπου η ανθρώπινη κοινή γνώμη δεν συμφωνούσε καθόλου.
Στα πειράματα με τους συμμετέχοντες, ακόμα και μία μόνο συνομιλία με ένα «υπερβολικά φιλικό» chatbot είχε μετρήσιμα αποτελέσματα: οι άνθρωποι ένιωθαν πιο σίγουροι ότι είχαν δίκιο, ήταν λιγότερο πρόθυμοι να αναλάβουν ευθύνη σε μια σύγκρουση και λιγότερο διατεθειμένοι να προσπαθήσουν να διορθώσουν μια σχέση.
Παράλληλα, το ενδιαφέρον εύρημα ήταν ότι οι ίδιοι οι χρήστες εμπιστεύονταν περισσότερο και προτιμούσαν τα συστήματα που τους επιβεβαίωναν. Με άλλα λόγια, όσο πιο «βολική» ήταν η απάντηση, τόσο πιο θετικά την αξιολογούσαν.
Γιατί συμβαίνει αυτό
Οι ερευνητές εξηγούν ότι τα συστήματα αυτά έχουν εκπαιδευτεί, εν μέρει, να είναι ευχάριστα και βοηθητικά προς τον χρήστη. Στην πράξη όμως, αυτό συχνά μεταφράζεται σε υπερβολική συμφωνία, ακόμη κι όταν θα ήταν πιο χρήσιμο να υπάρχει αντίλογος ή κριτική.
Το πρόβλημα, σύμφωνα με τη μελέτη, δεν είναι μόνο τεχνικό αλλά και ψυχολογικό. Οι άνθρωποι τείνουν να προτιμούν την επιβεβαίωση από την αμφισβήτηση, και αυτό δημιουργεί έναν φαύλο κύκλο: οι χρήστες «ανταμείβουν» τα πιο κολακευτικά συστήματα, και οι εταιρείες έχουν κίνητρο να τα διατηρούν έτσι για να αυξάνουν τη χρήση τους.
Οι πιθανές συνέπειες
Αν και η κολακευτική τεχνητή νοημοσύνη μπορεί να φαίνεται ακίνδυνη ή ακόμα και υποστηρικτική, η μελέτη δείχνει ότι μπορεί να έχει βαθύτερες επιπτώσεις. Όταν ένα σύστημα επιβεβαιώνει συνεχώς τις επιλογές μας, μειώνεται η διάθεση για αυτοκριτική, για ανάληψη ευθύνης και για διόρθωση λαθών στις σχέσεις μας. Αυτό μπορεί να επηρεάσει ιδιαίτερα ευαίσθητες καταστάσεις, όπως προσωπικές συγκρούσεις, ψυχολογική πίεση ή ηθικά διλήμματα, όπου η ισορροπημένη καθοδήγηση είναι κρίσιμη. Επομένως, το βασικό μήνυμα της έρευνας είναι ότι η τεχνητή νοημοσύνη δεν επηρεάζει μόνο το τι ξέρουμε, αλλά και το πώς σκεφτόμαστε για τον εαυτό μας και τους άλλους. Και αυτό, όπως δείχνουν τα δεδομένα, μπορεί να έχει πολύ πιο βαθιές συνέπειες από ό,τι φαίνεται με την πρώτη ματιά.