Οι περισσότεροι άνθρωποι διαβάζουν τους άλλους σχεδόν ασυναίσθητα. Ένα ανασηκωμένο φρύδι ή μια μικρή αλλαγή στη στάση του σώματος μπορούν να μεταφέρουν ένδειξη αμφιβολίας ή προειδοποίηση. Αυτά τα μικρά σήματα καθοδηγούν τις επιλογές μας και διαμορφώνουν το πώς νιώθουμε ασφαλείς ή κατανοητοί. Τώρα, μια νέα μελέτη που δημοσιεύεται στο περιοδικό Imaging Neuroscience δείχνει ότι ένα εξελιγμένο σύστημα τεχνητής νοημοσύνης μπορεί να «κατανοήσει» τέτοιες ενδείξεις σχεδόν όπως ένας άνθρωπος.

Όπως διαβάζουμε στο The Brighter Side News, ερευνητές στο Turku PET Centre της Φινλανδίας μελέτησαν το μοντέλο GPT-4V της OpenAI, που συνδυάζει τεχνητή νοημοσύνη και δυνατότητες ανάλυσης εικόνας, για να δουν αν μπορεί να ερμηνεύσει κοινωνικές καταστάσεις όπως ένας άνθρωπος. Το σύστημα κλήθηκε να αξιολογήσει εκατοντάδες φωτογραφίες και βίντεο με ανθρώπους σε τρυφερές στιγμές, έντονες διαφωνίες ή καθημερινές αλληλεπιδράσεις. Το μοντέλο ανέλυσε 138 διαφορετικά χαρακτηριστικά, από συναισθήματα και κινήσεις σώματος μέχρι προσωπικότητα και είδος αλληλεπίδρασης.

Η AI διαβάζει ανεπαίσθητες ενδείξεις

Οι αξιολογήσεις του AI συγκρίθηκαν με σχεδόν ένα εκατομμύριο ανθρώπινες αξιολογήσεις από πάνω από 2.250 εθελοντές. Ο βαθμός συμφωνίας εντυπωσίασε τους επιστήμονες: η μέση συσχέτιση μεταξύ ανθρώπινων αξιολογήσεων και του GPT-4V άγγιξε το 0,79 για φωτογραφίες και βίντεο. Το μοντέλο έδειξε μεγάλη συνέπεια, σε πολλές περιπτώσεις ξεπερνώντας την ακρίβεια οποιουδήποτε μεμονωμένου ανθρώπου. Ένα από τα πιο αξιόπιστα χαρακτηριστικά ήταν η αναγνώριση όταν κάποιος είναι ξαπλωμένος, με σχεδόν τέλεια ακρίβεια.

Η ανάλυση των εγκεφαλικών αντιδράσεων

Η ομάδα προχώρησε περαιτέρω, εξετάζοντας αν οι αξιολογήσεις του AI μπορούν να προβλέψουν την εγκεφαλική δραστηριότητα που ενεργοποιείται όταν οι άνθρωποι παρακολουθούν κοινωνικές σκηνές. Χρησιμοποιήθηκαν δεδομένα λειτουργικής μαγνητικής τομογραφίας από 97 εθελοντές, που παρακολούθησαν σχεδόν 100 βίντεο. Οι προβλέψεις του GPT-4V για τη δραστηριότητα του εγκεφάλου ταίριαξαν εντυπωσιακά με αυτές των ανθρώπων, ακόμη και σε αυστηρά στατιστικά όρια.

Το μοντέλο δημιούργησε επίσης «συσσωρευτικούς χάρτες» που δείχνουν ποια κοινωνικά χαρακτηριστικά ενεργοποιούν κάθε περιοχή του εγκεφάλου. Αυτοί οι χάρτες ταιριάζουν με αυτούς που δημιουργούνται από ανθρώπινες αξιολογήσεις, υποδηλώνοντας ότι η οργάνωση κοινωνικών πληροφοριών από το AI μιμείται τη δομή του εγκεφάλου. Τα ευρήματα δείχνουν ότι η AI μπορεί να κατανοεί την κοινωνική ζωή σε επίπεδο χαρακτηριστικών, από συναισθήματα και κίνηση μέχρι επικοινωνία και αλληλεπίδραση, με τρόπο συγκρίσιμο με τον ανθρώπινο.

Εφαρμογές στην καθημερινότητα

Η εργασία αυτή δείχνει ότι η AI μπορεί να μειώσει τον χρόνο και την κόπωση που απαιτεί η ανθρώπινη αξιολόγηση. Μια προηγούμενη βάση δεδομένων απαιτούσε πάνω από 1.100 ώρες εθελοντικής δουλειάς, ενώ το νέο μοντέλο ολοκλήρωσε τη διαδικασία σε λίγες ώρες, προσφέροντας σταθερά αποτελέσματα. Αυτό ανοίγει τον δρόμο για αξιοποίηση της τεχνητής νοημοσύνης στην καθημερινή ζωή, π.χ. για παρακολούθηση συναισθημάτων ασθενών, ανάλυση αντιδράσεων πελατών ή εντοπισμό επικίνδυνης συμπεριφοράς.