RT-2: Το νέο AI μοντέλο της Google για επικοινωνία με τα ρομπότ
Σε μια περίοδο όπου έχουμε κατακλυστεί από ειδήσεις για γλωσσικά μοντέλα Τεχνητής Νοημοσύνης που αξιοποιούνται ως εργαλεία ενίσχυσης της παραγωγικότητας και της αναζήτησης, η Google ανακοίνωσε μια διαφορετική αξιοποίηση της τεχνολογίας με σκοπό να βοηθήσει την επικοινωνία μεταξύ των χρηστών και των ρομπότ.
Ειδικότερα, η Google αποκάλυψε το VLA model (Visual-Language-Action) με ονομασία Robotics Transformer 2 (RT-2), το πρώτο στον κόσμο που έχει τη δυνατότητα να δέχεται εντολές με κείμενο ή εικόνα και να τις μετατρέπει σε ρομποτικές ενέργειες. Η εταιρεία τονίζει ότι η εκπαίδευση των ρομπότ απαιτεί τιτάνια προσπάθεια, διότι χρειάζεται δισεκατομμύρια δεδομένα για κάθε αντικείμενο, περιβάλλον, διεργασία και κατάσταση. Παρόλα αυτά, με το RT-2 θεωρεί πως ανοίγει ο δρόμος για την ευκολότερη εκπαίδευση των ρομπότ γενικής χρήσης.
Σύμφωνα με τη DeepMind, εταιρεία ρομποτικής που ανήκει στη Google και συμμετέχει ενεργά στο project, αυτά τα μοντέλα VLA είναι αρκετά πιθανό πως θα οδηγήσουν στο μεσοπρόθεσμο μέλλον στην κατασκευή τέτοιων ρομπότ γενικής χρήσης που θα μπορούν να κατανοούν, να επεξεργάζονται, να εκφράζουν και να επιλύουν καθημερινά προβλήματα.
Όπως αντιλαμβάνεστε από την ονομασία, το RT-2 δεν είναι το πρώτο μοντέλο VLA της Google, αλλά αποτελεί την εξέλιξη του RT-1 που κρατήθηκε «μυστικό» από την εταιρεία. Ως νέα γενιά αναμενόμενα προσφέρει σημαντικά βελτιωμένες δυνατότητες και ανταποκρίνεται καλύτερα σε νέες, άγνωστες καταστάσεις. Για παράδειγμα, αντιλαμβάνεται φαινομενικά ασαφείς ιδέες και τις επεξεργάζεται με λογική, χωρίς να έχει εκπαιδευτεί συγκεκριμένα για κάτι τέτοιο.
Ακόμα είναι αρκετά νωρίς, όπως σε όλα αυτά τα projects, αλλά βλέπουμε πως η εξέλιξη είναι εκθετική και ίσως δούμε χειροπιαστά αποτελέσματα πολύ νωρίτερα από ό,τι ενδεχομένως φανταζόμαστε.
Δεν υπάρχουν σχόλια