Σπάνια η δημοσίευση ενός ερευνητικού άρθρου είχε τέτοιο αντίκτυπο στο χρηματιστήριο. Την περασμένη εβδομάδα, οι γίγαντες των τσιπ μνήμης είδαν τις τιμές τους να πέφτουν, διαγράφοντας μέρος των θεαματικών κερδών που συσσωρεύτηκαν την περασμένη χρονιά. Θέμα: μια νέα τεχνολογία που παρουσιάστηκε από ερευνητές της Google, η οποία προτείνει σημαντική μείωση των απαιτήσεων μνήμης για τη λειτουργία μοντέλων τεχνητής νοημοσύνης. Αυτή η πρόοδος θα μπορούσε να καταστήσει δυνατή τη μείωση του κόστους εξαγωγής συμπερασμάτων, επιβαρύνοντας παράλληλα τη ζήτηση για ορισμένα τσιπ.
Ο αντίκτυπος στους κατασκευαστές μνήμης είναι δύσκολο να προσδιοριστεί. Πρώτον, επειδή η τεχνολογία παραμένει στο στάδιο της έρευνας, χωρίς εγγύηση για εφαρμογές μεγάλης κλίμακας ή ορατότητα σε πραγματικά οφέλη. Στη συνέχεια, επειδή τα κέρδη θα μπορούσαν να αντισταθμιστούν από ένα άλμα στις χρήσεις, που ευνοείται από τη μείωση του κόστους τεχνητής νοημοσύνης. Για να μην αναφέρουμε ότι η ζήτηση για αυτά τα τσιπ παραμένει πολύ μεγαλύτερη από την προσφορά. Ωστόσο, η αντίδραση της αγοράς δείχνει μια επίμονη αμφιθυμία, μεταξύ σημαντικών εμπορικών προοπτικών και φόβων για πιθανή φούσκα.
Έξι φορές λιγότερη μνήμη
Η άνοδος της γενετικής τεχνητής νοημοσύνης δεν βασίζεται μόνο στην κολοσσιαία υπολογιστική ισχύ, που παρέχεται από τις κάρτες γραφικών. Επίσης, βασίζεται σε τεράστιες ποσότητες μνήμης, που παρέχονται από διαφορετικούς τύπους τσιπ, ιδίως μνήμες HBM, απαραίτητες για μοντέλα προπόνησης. Αυτή η τεράστια όρεξη έχει προκαλέσει κρίση υποπαραγωγής, οδηγώντας σε ανακατανομή της χωρητικότητας σε εξαρτήματα αφιερωμένα στην τεχνητή νοημοσύνη και σε άνοδο των τιμών. Οι επιπτώσεις εκτείνονται πολύ πέρα από τον τομέα, επηρεάζοντας επίσης τα τσιπ που χρησιμοποιούνται σε smartphone και υπολογιστές.
Συγκεκριμένα, η καινοτομία των ομάδων της Google λαμβάνει χώρα κατά τη φάση συμπερασμάτων, δηλαδή τη διαδικασία δημιουργίας ενός κειμένου ή μιας εικόνας. Παίρνει τη μορφή ενός αλγόριθμου συμπίεσης μοντέλου AI, ικανού να μειώσει δραστικά την απαραίτητη μνήμη «Χωρίς απώλεια ακρίβειας». Σε δοκιμές που πραγματοποιήθηκαν σε πολλά μοντέλα ανοιχτού κώδικα, ελήφθη μια διαίρεση με έξι. â€œΗ εφαρμογή του είναι εξαιρετικά αποτελεσματική και έχει ως αποτέλεσμα αμελητέα έξοδα εκτέλεσης (επομένως πρόσθετο κόστος, σημείωση του συντάκτη)†, διαβεβαιώνουν επίσης οι ερευνητές.
Δυσαναλογία δράσης;
Ωστόσο, αυτά τα κέρδη αποτελεσματικότητας δεν αφορούν ολόκληρη τη διαδικασία. Ακόμα κι αν τα αποτελέσματα των δοκιμών επιβεβαιώνονταν σε πραγματικές συνθήκες, δεν θα οδηγούσαν σε διαίρεση με έξι από τις συνολικές απαιτήσεις μνήμης. Η μέθοδος συμπίεσης που αναπτύχθηκε από την Google θα μπορούσε ωστόσο να οδηγήσει σε σημαντική μείωση του κόστους εξαγωγής συμπερασμάτων – μια δυνητικά κρίσιμη πρόοδος, ενώ η ανάπτυξη πρακτόρων τεχνητής νοημοσύνης θα πρέπει να δεκαπλασιάσει τις χρήσεις. Θα μπορούσε επίσης να επιτρέψει την εκτέλεση μοντέλων τοπικά, χωρίς να χρειάζεται να υποστηρίξει το κόστος μιας πλατφόρμας cloud.
Οι αναλυτές, ωστόσο, πιστεύουν ότι οι ανησυχίες της αγοράς σχετικά με τη ζήτηση μνήμης είναι δυσανάλογες. Προβάλλονται τρία επιχειρήματα. Από τη μία πλευρά, τα τσιπ HBM, τα πιο προσοδοφόρα, δεν πρέπει να επηρεαστούν. Από την άλλη πλευρά, τα κέρδη απόδοσης θα επέτρεπαν την εκτέλεση περισσότερων μοντέλων με σταθερές ποσότητες μνήμης, αντί να μειώσουν τους όγκους που απαιτούνται για ισοδύναμη χρήση. Τέλος, το μειωμένο κόστος συμπερασμάτων θα μπορούσε να επιταχύνει περαιτέρω την ανάπτυξη της τεχνητής νοημοσύνης – ένα φαινόμενο γνωστό ως παράδοξο Jevons.
Για να πάτε παρακάτω:
«Η Nvidia κάνει μια στρατηγική αλλαγή με το πρώτο της τσιπ αφιερωμένο στην εξαγωγή συμπερασμάτων
Η τεχνητή νοημοσύνη ενισχύει τα κέρδη της Samsung και της SK Hynix





