Αρχική Πολιτισμός Αποκωδικοποίηση του Οπτικού Κόσμου

Αποκωδικοποίηση του Οπτικού Κόσμου

12
0

Στα τέλη της δεκαετίας του 1990, η αυξανόμενη ισχύς των υπολογιστών και οι εξελιγμένοι αλγόριθμοι επέτρεψαν στις μηχανές να μαθαίνουν μοτίβα από δεδομένα αυτόματα, κάνοντας την αναγνώριση αντικειμένων ταχύτερη, πιο ευέλικτη και ακριβή.

Μια κομβική στιγμή ήρθε το 2009, όταν η Fei-Fei Li, με την υποστήριξη ενός βραβείου πρώιμης ανάπτυξης σταδιοδρομίας του NSF Faculty, και η ομάδα της κυκλοφόρησαν το ImageNet, μια δημόσια διαθέσιμη βάση δεδομένων που περιέχει περισσότερες από 3 εκατομμύρια εικόνες σε 5.000 κατηγορίες. Το ImageNet έδωσε στους ερευνητές το μεγάλο, υψηλής ποιότητας σύνολο δεδομένων που απαιτείται για την εκπαίδευση των λεγόμενων συστημάτων βαθιάς μάθησης που είναι ικανά να χρησιμοποιούν τεχνητά πολυεπίπεδα νευρωνικά δίκτυα για να αναγνωρίζουν πολύπλοκες εικόνες πραγματικού κόσμου.

Το ImageNet πυροδότησε επίσης το ImageNet Challenge, έναν ετήσιο διαγωνισμό για να δούμε ποιοι αλγόριθμοι θα μπορούσαν να αναγνωρίσουν με μεγαλύτερη ακρίβεια νέες εικόνες. Το 2012, ένα μοντέλο βαθιάς μάθησης που ονομάζεται AlexNet χρησιμοποίησε CNN και προηγμένους επεξεργαστές γραφικών για να αναλύσει το τεράστιο σύνολο δεδομένων του ImageNet. Πέτυχε ακρίβεια ρεκόρ στην πρόκληση ImageNet, μειώνοντας τα ποσοστά σφαλμάτων στο μισό και αποδεικνύοντας ότι η βαθιά εκμάθηση θα μπορούσε να ξεπεράσει κατά πολύ τις προηγούμενες προσεγγίσεις.

Παράλληλα με το ImageNet, τα υποστηριζόμενα από το NSF κέντρα όπως το Temporal Dynamics of Learning Center συνέχισαν να επεκτείνουν την κατανόηση του τρόπου με τον οποίο ο εγκέφαλος αντιλαμβάνεται τα αντικείμενα, προσφέροντας βασικές γνώσεις που ενημέρωσαν την ανάπτυξη των σημερινών αλγορίθμων βαθιάς μάθησης. Με βάση αυτή την κληρονομιά, το NSF AI Institute for Foundations of Machine Learning προωθεί τα βασικά μαθηματικά και υπολογιστικά εργαλεία πίσω από την AI. Για παράδειγμα, οι ερευνητές χρησιμοποιούν μοντέλα βαθιάς παραγωγής για τη μείωση του θορύβου και την ευκρίνεια των χαμηλής ποιότητας ή θολών εικόνων, συμπεριλαμβανομένων των μαγνητικής τομογραφίας, οι οποίες παράγουν σαφέστερα και ακριβέστερα αποτελέσματα για ιατρική διάγνωση και θεραπείες.