Μια πρόσφατη, επιστημονικά τεκμηριωμένη μελέτη του The British Medical Journal (BMJ) αποκαλύπτει σημαντικές γνωσιακές αδυναμίες σε κορυφαία γλωσσικά μοντέλα τεχνητής νοημοσύνης, τα οποία επιδεικνύουν συμπεριφορές που παραπέμπουν σε πρώιμη γνωσιακή έκπτωση.
Η σύγκριση ανάμεσα σε εκδόσεις ΑΙ, όπως το ChatGPT και το Gemini, δείχνει ότι όχι μόνο δεν είναι έτοιμα να αναλάβουν κλινικούς ρόλους, αλλά παρουσιάζουν και «γνωσιακή υποβάθμιση» σε παλαιότερες εκδόσεις τους – ένα φαινόμενο που θυμίζει νευροεκφυλιστική πορεία.
Τεστ για διανοητική ικανότητα σε ΑΙ
Η έρευνα, που διενεργήθηκε από νευρολόγους σε Ισραήλ και Ηνωμένο Βασίλειο, εστίασε σε τέσσερα μοντέλα: ChatGPT-4, ChatGPT-4o (OpenAI), Gemini 1 και Gemini 1.5 (Google), και Claude 3.5 (Anthropic). Τα μοντέλα αξιολογήθηκαν μέσω του Montreal Cognitive Assessment (MoCA) – ενός πρότυπου τεστ που χρησιμοποιείται για την ανίχνευση πρώιμης γνωσιακής εξασθένησης στους ανθρώπους.
Το MoCA ελέγχει γνωστικές παραμέτρους όπως:
- Προσοχή και συγκέντρωση
- Βραχυπρόθεσμη μνήμη
- Γλωσσικές ικανότητες
- Χωρική αντίληψη
- Εκτελεστικές λειτουργίες (π.χ. ταξινόμηση στοιχείων)
Το μέγιστο σκορ είναι 30 μονάδες, ενώ κάτω από 26 θεωρείται ένδειξη γνωσιακής δυσλειτουργίας.
Ανεπάρκειες στα βασικά επίπεδα αντίληψης
Το ChatGPT-4o πέτυχε το υψηλότερο σκορ με 26/30, ακολουθούμενο από το ChatGPT-4 (25/30). Αντιθέτως, το Gemini 1.5 απέτυχε με 16/30, εμφανίζοντας σοβαρές αδυναμίες στη χωρική αντίληψη και στην απομνημόνευση λέξεων. Όλα τα μοντέλα εμφάνισαν προβλήματα σε απλές γνωστικές δοκιμασίες, όπως:
- Σχεδίαση ρολογιού
- Ταξινόμηση αριθμών και γραμμάτων
- Ανάλυση σύνθετων οπτικών πληροφοριών
Η έκφραση ενσυναίσθησης – κρίσιμη σε κλινικό περιβάλλον – αποδείχθηκε ιδιαίτερα ελλειμματική, επιβεβαιώνοντας ότι η ΑΙ λειτουργεί με βάση στατιστικά μοτίβα και όχι με πραγματική κατανόηση συναισθημάτων ή αυτεπίγνωση.
Η «ηλικιακή φθορά» των μοντέλων και οι επιπτώσεις στην κλινική εφαρμογή
Οι ερευνητές παρατήρησαν ότι παλαιότερες εκδόσεις των μοντέλων είχαν χειρότερες επιδόσεις από τις νεότερες – ένα μοτίβο που παραπέμπει στη γνωσιακή εξασθένηση που συνοδεύει τη γήρανση στους ανθρώπους. Αυτό ανοίγει ένα νέο κεφάλαιο στη μελέτη των ΑΙ: η έννοια της “γνωσιακής υποβάθμισης” στις τεχνητές γενεές.
Το βασικό συμπέρασμα είναι πως, παρότι τα μεγάλα γλωσσικά μοντέλα μπορούν να μιμηθούν ιατρική γνώση, δεν διαθέτουν αυθεντική κατανόηση, ενσυναίσθηση ή διαισθητική σκέψη, καθιστώντας τα ακατάλληλα – και εν δυνάμει επικίνδυνα – για αυτόνομη χρήση στην ιατρική πράξη.
Συναισθηματική νοημοσύνη: Ένα ανυπέρβλητο εμπόδιο
Η απουσία συναισθηματικής νοημοσύνης αποτελεί θεμελιώδες μειονέκτημα. Η αδυναμία ενός μοντέλου να κατανοήσει τον ανθρώπινο πόνο, να διαμορφώσει την επικοινωνία του ανάλογα και να εμπνεύσει εμπιστοσύνη, το καθιστά ακατάλληλο για ρόλους που απαιτούν συναισθηματική και ηθική διαμεσολάβηση.
Σε περιβάλλοντα όπως η ψυχολογική υποστήριξη, η διαχείριση σοβαρών διαγνώσεων ή η φροντίδα τελικού σταδίου, η αποτυχία προσομοίωσης αυθεντικής ανθρώπινης αλληλεπίδρασης μπορεί να έχει σοβαρές επιπτώσεις.
Τεχνολογικές και ηθικές αναθεωρήσεις
Η μελέτη προτείνει:
- Ενίσχυση της χωρικής αντίληψης και των εκτελεστικών λειτουργιών
- Έρευνα για ενσωμάτωση συναισθηματικής νοημοσύνης
- Παρακολούθηση “γνωσιακής πορείας” σε νέα και παλαιά μοντέλα
- Επαναπροσδιορισμό της ικανότητας των ΑΙ να υποκαταστήσουν επαγγελματίες υγείας
Οι επιστήμονες υπογραμμίζουν ότι η ικανότητα παραγωγής ακριβών πληροφοριών δεν αρκεί. Χωρίς κρίση, συναίσθημα και ανθρώπινη διαίσθηση, η ΑΙ δεν μπορεί να ανταποκριθεί στην πολυπλοκότητα της ιατρικής πραγματικότητας. Το όριο αυτό δεν είναι τεχνικό – είναι θεμελιώδες.