Η DeepMind συνεχίζει να μας εκπλήσσει. Αυτή τη φορά θέτει ένα νέο, ακόμη πιο φιλόδοξο στόχο. Μέσω του Genie θέλει να παρουσιάσει μια εφαρμογή τεχνητής νοημοσύνης ικανή να παράγει ολοκληρωμένα βιντεοπαιχνίδια ξεκινώντας από μερικές εικόνες!
Μια διαδραστική γεννήτρια περιβάλλοντος
Για να θέσει τα θεμέλια για το σύστημά της, η DeepMind ξεκίνησε συλλέγοντας περίπου 200.000 ώρες βίντεο παιχνιδιών από το Διαδίκτυο. Στη συνέχεια φιλτράρισε αυτόν τον τεράστιο όγκο από εικόνες για να εξάγει περίπου 30.000 ώρες παιχνιδιού που χρησιμοποιήθηκαν για να τροφοδοτήσει ένα μοντέλο με 200 εκατομμύρια παραμέτρους.
Χρησιμοποιώντας αυτά τα δεδομένα, η Genie μπόρεσε να μάθει πώς να δημιουργεί έναν εντελώς νέο εικονικό κόσμο — ή πιο συγκεκριμένα, έναν συνδυασμό δύο μοντέλων που ονομάζονται «μοντέλο λανθάνουσας δράσης» και «μοντέλο δυναμικής». Αυτό το ζεύγος επιτρέπει στο σύστημα να ξεκινήσει από μια απλή εικόνα που παρέχεται από τον χρήστη. Το αντιμετωπίζει σαν να ήταν η αρχή ενός βίντεο και, στη συνέχεια, προσπαθεί να μαντέψει πώς πρέπει να φαίνονται τα επόμενα καρέ με βάση τις ενέργειες του χρήστη (π.χ. πατώντας ένα πλήκτρο σε ένα πληκτρολόγιο) με βάση τα μοτίβα που προέκυψαν κατά τη διάρκεια της εκπαίδευσης.
Στο τέλος της διαδικασίας, το Genie έδωσε μερικά αρκετά εντυπωσιακά αποτελέσματα. Το σύστημα φαίνεται ικανό να διακρίνει μεταξύ του αναπαραγόμενου χαρακτήρα και των στοιχείων του σκηνικού, και να ζωντανεύει τα πάντα με έναν μάλλον συνεκτικό τρόπο ως απόκριση σε εντολές.
Αρκετά τεχνικό επίτευγμα, δεδομένου ότι η δημιουργία διαδραστικού περιεχομένου από μια απλή εικόνα ήταν ακόμα ένα καθαρό πείραμα σκέψης μόλις πριν από λίγους μήνες.
Μια εξαιρετικά ευέλικτη προσέγγιση
Η Genie οφείλει αυτή την απόδοση εν μέρει σε μια προσέγγιση ριζικά διαφορετική από αυτές που χρησιμοποιούν άλλοι ερευνητές που προσπάθησαν να δημιουργήσουν παιχνίδια χρησιμοποιώντας AI.
Η εργασία βασίστηκε σε ένα σύστημα σήμανσης που βοηθά στην καθοδήγηση του μοντέλου κατά τη διάρκεια της εκπαίδευσης. Για παράδειγμα, οι προγραμματιστές λένε στον αλγόριθμο ότι αυτή ή εκείνη η ακολουθία αντιστοιχεί σε ένα άλμα, μια πλευρική κίνηση κ.λπ.
Το Genie, από την άλλη πλευρά, εκπαιδεύεται «χωρίς τον παραμικρό σχολιασμό». Μπορεί να συμπεράνει όλες τις πληροφορίες που χρειάζεται απευθείας από ακατέργαστες εικόνες και να γενικεύσει αυτά τα μοτίβα για να δημιουργήσει ένα διαδραστικό πρόγραμμα από οποιαδήποτε άλλη εικόνα.
Αυτή η προσέγγιση έχει δύο σημαντικά πλεονεκτήματα. Το πρώτο είναι ότι επιτρέπει στους ερευνητές να τροφοδοτούν τεράστιες ποσότητες δεδομένων στο μοντέλο χωρίς να σπαταλούν δεκάδες ώρες επισημαίνοντας τα πάντα με το χέρι. Το δεύτερο είναι ότι κάνει το σύστημα εξαιρετικά πιο ευέλικτο. Το Genie μπορεί να λειτουργήσει με ένα κλασικό 2D sprite, αλλά και με μια πραγματική φωτογραφία ή ακόμα και ένα απλό doodle!
Σε αρχικό στάδιο αλλά πολλά υποσχόμενο
Το Genie απέχει ακόμα πολύ από το να είναι σε θέση να παράγει ένα πραγματικό βιντεοπαιχνίδι στη σωστή μορφή από μια απλή εικόνα. Και η DeepMind το γνωρίζει καλά αυτό. Για αυτό και η ομάδα προτιμά να μιλά για «εικονικά περιβάλλοντα».
Ο πρώτος μεγάλος περιορισμός είναι ότι το σύστημα μπορεί να λειτουργεί μόνο με περίπου ένα καρέ ανά δευτερόλεπτο – πολύ μακριά από το όριο των 30 fps που γενικά θεωρείται το ελάχιστο για άνετο παιχνίδι.
Επιπλέον, η αυτόνομη προσέγγιση χωρίς επισήμανση παρουσιάζει κάποια μειονεκτήματα. Μερικές φορές το σύστημα είναι εντελώς λάθος στην ερμηνεία των εικόνων. Για παράδειγμα, συμβαίνει ο χαρακτήρας να μην πέφτει ποτέ στο έδαφος αφού έχει πραγματοποιήσει ένα άλμα ή δύο οντότητες να συγχωνεύονται χωρίς προφανή λόγο…
Ωστόσο, αυτό είναι ένα πολύ αξιοσημείωτο βήμα προς τα εμπρός στον τομέα της γενετικής τεχνητής νοημοσύνης. Κάποιοι αρχίζουν ήδη να λένε ότι το Genie σηματοδοτεί την αρχή μιας νέας εποχής όπου αυτή η τεχνολογία θα μπορεί να προχωρήσει πολύ πέρα από εικόνες και βίντεο για να επινοήσει ρεαλιστικά, συνεκτικά και διαδραστικά εναλλακτικά σύμπαντα.
Ακόμα κι αν αυτοί οι ισχυρισμοί εξακολουθούν να είναι λίγο αλαζονικοί ως έχουν, οι δυνατότητες είναι αναμφισβήτητες, και όχι μόνο στον κόσμο των βιντεοπαιχνιδιών. Αυτή η προσέγγιση θα μπορούσε να ωφελήσει άλλους κλάδους της βιομηχανίας και της επιστήμης, για παράδειγμα τη ρομποτική.
Μπορεί να λάβουμε ένα μικρό ποσοστό εάν κάνετε κλικ σε έναν σύνδεσμο και αγοράσετε κάποιο προϊόν. Για περισσότερες λεπτομέρειες, εδώμπορείτε να μάθετε πώς χρησιμοποιούμε τους συνδέσμους συνεργατών. Σας ευχαριστούμε για την υποστήριξη.
-----------
Ακολουθήστε το Gizchina Greece στο Google Newsγια νέα και ειδήσεις στον χώρο της τεχνολογίας. Αν ψάχνετε HOT προσφορές και κουπόνια για κινητά και gadgets, κάντε εγγραφή στο κανάλι μαςστο Telegram.
-----------