Τεχνητή νοημοσύνη, όπως τα μωρά: Όσο της μιλάμε, τόσο υϊοθετεί τον τρόπο σκέψης του ανθρώπου
Σε μια εποχή που η τεχνητή νοημοσύνη προχωρά με ταχύτατους ρυθμούς, οι επιστήμονες αρχίζουν να ανακαλύπτουν ότι η λειτουργία των μεγάλων γλωσσικών μοντέλων δεν απέχει τόσο πολύ από τον τρόπο που ο ανθρώπινος εγκέφαλος επεξεργάζεται την ομιλία. Όταν ακούμε μια ιστορία, ο εγκέφαλός μας δεν «καταπίνει» τα λόγια μονομιάς. Αντίθετα, η σημασία ξεδιπλώνεται σταδιακά, με διαφορετικές περιοχές να συνεισφέρουν σε διαφορετικές χρονικές στιγμές, ενώ οι λέξεις συσσωρεύονται σε φράσεις, προτάσεις και έννοιες. Μια νέα μελέτη αποκαλύπτει ότι αυτή η χρονική δομή μοιάζει εντυπωσιακά με τα βήματα επεξεργασίας που ακολουθούν τα σύγχρονα τεχνητά μοντέλα γλώσσας, όπως εκείνα που χρησιμοποιούνται σε εφαρμογές τύπου ChatGPT.
Η έρευνα, που δημοσιεύθηκε πρόσφατα, δείχνει ότι η πολυεπίπεδη αρχιτεκτονική των γλωσσικών μοντέλων συνδέεται στενά με την χρονική δυναμική της νευρωνικής δραστηριότητας στις ανθρώπινες περιοχές γλώσσας, όταν κάποιος ακούει φυσική ομιλία. Με άλλα λόγια, όσο βαθύτερο είναι ένα στρώμα του μοντέλου, τόσο αργότερα η δραστηριότητά του ταιριάζει με την αντίστοιχη ανθρώπινη εγκεφαλική αντίδραση, υποδεικνύοντας μια απρόσμενη σύγκλιση ανάμεσα στην βιολογική κατανόηση της γλώσσας και σε συστήματα μηχανικής μάθησης που έχουν εκπαιδευτεί αποκλειστικά με κείμενα.
Η διαδικασία της έρευνας ήταν εξαιρετικά λεπτομερής. Επιστήμονες από διάφορες χώρες κατέγραψαν τη δραστηριότητα του εγκεφάλου εννέα ασθενών με επιληψία που είχαν ήδη εμφυτευμένα ηλεκτρόδια για κλινικούς λόγους. Οι συμμετέχοντες άκουσαν ένα μισάωρο επεισόδιο ενός ραδιοφωνικού προγράμματος, ενώ οι ερευνητές παρακολουθούσαν σε υψηλή ανάλυση την ηλεκτροεγκεφαλογραφική δραστηριότητα σε περιοχές σχετικές με τη γλώσσα. Η τεχνική αυτή επέτρεπε την παρακολούθηση της αντίδρασης του εγκεφάλου σε κάθε λέξη με ακρίβεια χιλιοστού του δευτερολέπτου, προσφέροντας μοναδική εικόνα της χρονικής εξέλιξης της κατανόησης.
Στη συνέχεια, οι ερευνητές εισήγαγαν το ίδιο κείμενο στα μοντέλα GPT-2 XL και Llama 2, εξάγοντας τις εσωτερικές αναπαραστάσεις της κάθε λέξης σε όλα τα στρώματα τους. Μέσω μοντέλων γραμμικής κωδικοποίησης ανέλυσαν σε ποιο βαθμό κάθε στρώμα μπορούσε να προβλέψει τη δραστηριότητα του εγκεφάλου σε διαφορετικά χρονικά σημεία. Το αποτέλεσμα ήταν συναρπαστικό: στις περιοχές του εγκεφάλου που συνδέονται με τη σύνταξη και τη σημασία, όπως η περιοχή του Broca, τα πρώιμα στρώματα των μοντέλων αντιστοιχούσαν σε νευρωνικές αντιδράσεις κοντά στην εκφώνηση της λέξης, ενώ τα βαθύτερα στρώματα αντιστοιχούσαν σε αντιδράσεις που εμφανίζονταν εκατοντάδες χιλιοστά του δευτερολέπτου αργότερα.
Η αντιστοίχιση αυτή δεν περιοριζόταν σε μια μόνο περιοχή του εγκεφάλου. Οι επιστήμονες παρατήρησαν παρόμοιες χρονικές αλληλουχίες και σε άλλες ανώτερες γλωσσικές περιοχές, που είναι υπεύθυνες για την ενοποίηση του νοήματος σε μεγαλύτερες μονάδες λόγου. Αντίθετα, οι πρώιμες ακουστικές περιοχές παρουσίασαν ελάχιστη ή καθόλου αντιστοιχία, υποδεικνύοντας ότι η παραλληλία αναδύεται μόνο σε υψηλότερα επίπεδα επεξεργασίας.
Σημαντικό είναι ότι η ίδια αλληλουχία εμφανίστηκε και στα δύο διαφορετικά μοντέλα, γεγονός που υποστηρίζει ότι δεν πρόκειται για τυχαίο φαινόμενο αλλά για χαρακτηριστικό των βαθιών γλωσσικών δικτύων γενικότερα. Σε σύγκριση, παραδοσιακά σύμβολα γλώσσας και χειροποίητες αναπαραστάσεις όπως φωνήματα, μορφήματα ή γραμματικοί κανόνες δεν κατάφεραν να αναπαράγουν την τακτική χρονική εξέλιξη που παρατηρείται στα μοντέλα.
Τα ευρήματα, χωρίς να ισχυρίζονται ότι ο ανθρώπινος εγκέφαλος λειτουργεί όπως ένα δίκτυο μετασχηματιστή, υπογραμμίζουν την πιθανότητα τα μεγάλα γλωσσικά μοντέλα να χρησιμεύουν ως εργαλεία για την κατανόηση της ανθρώπινης γλώσσας. Ανοίγουν νέους δρόμους για την ενοποίηση των σύγχρονων προσεγγίσεων της τεχνητής νοημοσύνης με παραδοσιακά ψυχογλωσσολογικά μοντέλα και προσφέρουν πολύτιμες πληροφορίες για το πώς αναδύεται το νόημα από συνεχείς, ευαίσθητες στο πλαίσιο αναπαραστάσεις, αντί για αυστηρά διακριτά στάδια επεξεργασίας.
Η έρευνα υποδηλώνει ότι όσο τα συστήματα τεχνητής νοημοσύνης γίνονται πιο ικανά, τα όρια μεταξύ τεχνητής και βιολογικής νοημοσύνης μπορεί να είναι στενότερα και πιο αποκαλυπτικά απ’ ό,τι πιστεύαμε. Η σύγκλιση αυτή προσφέρει όχι μόνο ευκαιρίες για την ανάπτυξη καλύτερων αλγορίθμων, αλλά και για βαθύτερη κατανόηση της ανθρώπινης σκέψης, ανοίγοντας ένα νέο κεφάλαιο στη μελέτη της γλώσσας και της νόησης.