Η αξιολόγηση από ομοτίμους αποτελεί το κεντρικό φίλτρο της επιστημονικής δημοσίευσης. Ανεξάρτητοι ειδικοί αξιολογούν την αυστηρότητα, την πρωτοτυπία και τη συνάφεια κάθε χειρογράφου πριν γίνει αποδεκτό. Ωστόσο, ένα επιστημονικό άρθρο που γράφτηκε από μια τεχνητή νοημοσύνη μόλις πέρασε αυτό το φίλτρο χωρίς να προσδιορίζεται ως τέτοιο, θέτοντας νέα ερωτήματα σχετικά με το μέλλον της ακαδημαϊκής έρευνας.
Το AI Scientist, ένα σύστημα που συνδέει όλα τα στάδια της έρευνας
Η εταιρεία Sakana AI, σε συνεργασία με το Πανεπιστήμιο της Βρετανικής Κολομβίας και το Πανεπιστήμιο της Οξφόρδης, ανέπτυξαν το σύστημα που ονομάζεται The AI Scientist. Αυτό το σύστημα κάνει περισσότερα από τη σύνταξη κειμένου. Διατυπώνει ερευνητικές υποθέσεις, γράφει τον απαραίτητο κώδικα υπολογιστή, εκτελεί τα πειράματα, αναλύει τα αποτελέσματα, παράγει γραφήματα και γράφει ολόκληρο το χειρόγραφο.
Για να δοκιμάσει τις δυνατότητές της, η ομάδα υπέβαλε 3 εργασίες που δημιουργήθηκαν από αυτό το AI σε ένα εργαστήριο στο συνέδριο ICLR 2025, ένα από τα πιο σημαντικά γεγονότα στον τομέα της μηχανικής μάθησης. Το πείραμα έλαβε έγκριση από επιτροπή δεοντολογίας στο Πανεπιστήμιο της Βρετανικής Κολομβίας και πραγματοποιήθηκε με τη συμφωνία των διοργανωτών του συνεδρίου.
Σύμφωνα με τη μελέτη που δημοσιεύτηκε στο Nature, οι αξιολογητές έδωσαν σε ένα από τα τρία άρθρα βαθμολογίες 6, 7 και 6, κατά μέσο όρο 6,33, επαρκείς για να το αποδεχτούν. Αυτή η βαθμολογία τοποθετούσε αυτό το άρθρο πάνω από το 55% των άρθρων που υποβλήθηκαν από ανθρώπους στο ίδιο εργαστήριο.

Ένα επιστημονικό άρθρο γραμμένο από AI, αλλά γεμάτο ελαττώματα
Παρά τη φαινομενική αυτή επιτυχία, το σύστημα παρουσιάζει αξιοσημείωτες αδυναμίες. Όπως αναφέρει το Phys.org, η τεχνητή νοημοσύνη παράγει παραισθήσεις, δηλαδή επινοημένες πληροφορίες που παρουσιάζονται ως αληθινές. Μεταξύ των προβλημάτων που παρατηρούνται είναι εικονικές βιβλιογραφικές παραπομπές και διπλότυπα στοιχεία χωρίς αιτιολόγηση.
Επιπλέον, το ποσοστό αποδοχής για το στοχευμένο εργαστήριο κυμαινόταν μεταξύ 60 και 70%, ένα πολύ λιγότερο επιλεκτικό όριο από αυτό των κύριων συνεδρίων, που είναι περίπου 20 έως 30%. Με άλλα λόγια, ο πήχης που πέρασε η τεχνητή νοημοσύνη δεν ανταποκρίνεται στο υψηλότερο επίπεδο απαιτήσεων της επιστημονικής κοινότητας.
Ωστόσο, η εμπειρία δείχνει ότι οι ανθρώπινοι κριτικοί δεν εντόπισαν την τεχνητή προέλευση του χειρογράφου. Αυτή η παρατήρηση αμφισβητεί την ικανότητα του τρέχοντος συστήματος αξιολόγησης από ομοτίμους να διακρίνει την ανθρώπινη εργασία από την αυτοματοποιημένη εργασία.
Προς τον πληθωρισμό των αυτοματοποιημένων εκδόσεων
Η άφιξη αυτών των εργαλείων εγείρει εύλογες ανησυχίες στον ακαδημαϊκό κόσμο. Εάν μια τεχνητή νοημοσύνη μπορεί να παράγει αποδεκτά άρθρα σε λίγες ώρες, τίποτα δεν την εμποδίζει να δημιουργήσει εκατοντάδες ταυτόχρονες υποβολές. Οι επιτροπές διόρθωσης, ήδη υπερφορτωμένες, κινδυνεύουν να βρεθούν να κυριευτούν από μια πλημμύρα τεχνητών χειρογράφων.
Ταυτόχρονα, αυτή η τεχνολογία θα μπορούσε να οδηγήσει σε πληθωρισμό των δημοσιεύσεων. Σε ένα σύστημα όπου ο αριθμός των άρθρων που δημοσιεύονται επιβαρύνει τις σταδιοδρομίες, ο πειρασμός να χρησιμοποιηθεί η τεχνητή νοημοσύνη για να αυξηθούν οι υποβολές φαίνεται προφανής. Ορισμένοι παρατηρητές φοβούνται επίσης ότι οι ηθοποιοί θα διεξάγουν ανήθικα πειράματα, αδύνατο να επιβληθούν από τον άνθρωπο, και στη συνέχεια θα τα δημοσιεύσουν με αυτοματοποιημένο τρόπο.
Ωστόσο, άλλες φωνές τονίζουν τις θετικές δυνατότητες του αυτοματισμού. Απελευθερωμένοι από τις πιο επαναλαμβανόμενες εργασίες, οι ερευνητές θα μπορούσαν να επικεντρωθούν στη δημιουργικότητα και την ερμηνεία. Επομένως, το κεντρικό ερώτημα δεν είναι αν η τεχνητή νοημοσύνη θα γράψει ερευνητικά άρθρα, αλλά πώς η επιστημονική κοινότητα θα προσαρμόσει τις διασφαλίσεις της για να απορροφήσει τον αντίκτυπο.







