Νέα τεχνολογία AI διαβάζει τη σκέψη σου από μαγνητικές τομογραφίες
Ερευνητές δημιούργησαν AI που μετατρέπει οπτικές αναπαραστάσεις του εγκεφάλου σε προτάσεις.
Η δραστηριότητα του ανθρώπινου εγκεφάλου μπορεί να μεταφραστεί σε πλήρεις προτάσεις, σύμφωνα με μελέτη που δημοσιεύεται στο περιοδικό Science Advances. Η μέθοδος αυτή, που ονομάζεται «mind captioning», αναπτύχθηκε από τον Tomoyasu Horikawa και την ομάδα του στα NTT Communication Science Laboratories στην Ιαπωνία. Η τεχνολογία συνδυάζει νευροαπεικόνιση και τεχνητή νοημοσύνη για να μετατρέπει τις οπτικές εμπειρίες ή ακόμη και τις νοητικές αναπαραστάσεις σε προτάσεις. Αν και δεν πρόκειται για ανάγνωση σκέψεων με την κυριολεκτική έννοια, το αποτέλεσμα είναι εντυπωσιακό και μας δείχνει τι επιφυλάσσει το μέλλον.
Πώς διεξήχθη η μελέτη
Όπως διαβάζουμε στο ZME Science έξι εθελοντές πέρασαν περίπου δεκαεπτά ώρες ο καθένας σε μαγνητικό τομογράφο, παρακολουθώντας πάνω από 2.000 σύντομα, σιωπηλά βίντεο, από ζώα και καθημερινές σκηνές μέχρι αφηρημένες κινούμενες εικόνες. Παράλληλα, συλλέχθηκαν περιγραφές των σκηνών από ανθρώπους online, οι οποίες δέχθηκαν επεξεργασία με τη βοήθεια γλωσσικών μοντέλων. Με αυτό τον τρόπο, δημιουργήθηκε μια αντιστοίχιση μεταξύ νευρωνικών προτύπων και εννοιών, επιτρέποντας στο AI να «καταλάβει» τι βλέπει ο εγκέφαλος.
50% ακρίβεια
Στη συνέχεια, η τεχνητή νοημοσύνη μετέτρεψε αυτές τις αφηρημένες έννοιες σε πλήρεις προτάσεις χρησιμοποιώντας βήμα βήμα γλωσσικά μοντέλα. Οι πρώτες προσπάθειες ήταν ανορθόδοξες, αλλά με τη σταδιακή βελτίωση, οι προτάσεις γίνονταν ολοένα και πιο ακριβείς. Όταν το σύστημα δοκιμάστηκε με εκατό διαφορετικά βίντεο, μπόρεσε να αντιστοιχίσει σωστά το περιεχόμενο σχεδόν στο 50% των περιπτώσεων.
Ένα ακόμη εντυπωσιακό εύρημα ήταν ότι το AI μπορούσε να περιγράψει με ακρίβεια τις σκηνές, ακόμη και όταν οι συμμετέχοντες απλώς τις φαντάζονταν με κλειστά μάτια. Αυτό υποδηλώνει ότι ο εγκέφαλος χρησιμοποιεί παρόμοιες αναπαραστάσεις για την παρατήρηση και τη νοητική αναπαραγωγή και ότι αυτές μπορούν να μεταφραστούν σε γλώσσα χωρίς να ενεργοποιούνται οι παραδοσιακές περιοχές ομιλίας.
Οι δυνατότητες της τεχνολογίας
Οι δυνατότητες της τεχνολογίας είναι μεγάλες, ειδικά για άτομα που δεν μπορούν να μιλήσουν. Άνθρωποι με αφασία ή νευροεκφυλιστικές ασθένειες θα μπορούσαν στο μέλλον να επικοινωνούν μέσω της μη λεκτικής εγκεφαλικής δραστηριότητας. Παρόλα αυτά, οι ερευνητές επισημαίνουν ότι το σύστημα δεν διαβάζει σκέψεις απευθείας. Χρειάζεται πολλές ώρες εξατομικευμένων δεδομένων, μεγάλους μαγνητικούς τομογράφους και περιορισμένα οπτικά ερεθίσματα. Η ακρίβεια των προτάσεων επηρεάζεται από τις λεζάντες και τα μοντέλα που χρησιμοποιούνται για την εκπαίδευση.