Η Mentee Robotics με έδρα το Ισραήλ, μια startup που συνιδρύθηκε από τον ιδρυτή της Mobileye και της AI21 Labs, Amnon Shashua, ξεπρόβαλε από τη μυστικότητα της παρουσιάζοντας το project στο οποίο εργάζεται τα τελευταία δύο χρόνια: ένα ανθρωποειδές ρομπότ με την ονομασία Menteebot.
Παρόλο που είναι ακόμα πρωτότυπο, το Menteebot έχει σχεδιαστεί με στόχο εφαρμογές οικιακής χρήσης και αποθηκών με τεχνολογίες AI, συμπεριλαμβανομένων των μεγάλων γλωσσικών μοντέλων (LLM) που έχουν γίνει δημοφιλή από το ChatGPT της OpenAI και άλλους σημαντικούς παίκτες στον τομέα της Τεχνητής Νοημοσύνης.
Η εταιρεία περιγράφει ότι πρόκειται για ένα ρομπότ με τεχνητή νοημοσύνη που θα μπορούσε να ολοκληρώσει πολύπλοκες εργασίες από την αρχή μέχρι το τέλος. Οι περισσότεροι άλλοι παίκτες στο χώρο έχουν εξελίξει τα προϊόντα τους ώστε να αξιοποιήσουν την Τεχνητή Νοημοσύνη, αντί να κατασκευάσουν το προϊόν με μια AI-first προσέγγιση εξαρχής. Η Mentee δημοσίευσε ακόμη και ένα video που δείχνει το AI ρομπότ να λαμβάνει μια προφορική εντολή και να επεξεργάζεται την απαιτούμενη εργασία με μια απάντηση που συνοδεύεται από κίνηση, κατανόηση σκηνής, ανίχνευση και εντοπισμό αντικειμένων και πιάσιμο.
Παρόλο που τα ανθρωποειδή ρομπότ υπάρχουν εδώ και χρόνια, το εγχείρημα έχει επικεντρωθεί σε μεγάλο βαθμό στη βελτίωση του τρόπου με τον οποίο οι μηχανές αλληλεπιδρούν με τον πραγματικό κόσμο, καλύπτοντας πτυχές όπως η μίμηση της ανθρώπινης κίνησης και της επιδεξιότητας.
Τα περισσότερα ρομπότ στο παρελθόν ήταν είτε προ-προγραμματισμένα είτε ελεγχόμενα με μια πλατφόρμα λογισμικού για την εκτέλεση μιας συγκεκριμένης εργασίας, όπως η ρίψη κουτιών σε ένα ελεγχόμενο περιβάλλον. Στη συνέχεια, πριν από μερικά χρόνια, εμφανίστηκαν στο προσκήνιο τα μοντέλα γλώσσας και ενσώματης μάθησης. Πολλοί κατασκευαστές ρομπότ υιοθέτησαν σύντομα την τεχνολογία (κυρίως μέσω συνεργασιών) για να δώσουν στα ανθρωποειδή τους την ικανότητα να κατανοούν τι ζητά ο χρήστης σε φυσική γλώσσα και να εκτελούν την εργασία αυτή, ενώ μαθαίνουν με την πάροδο του χρόνου.
Η Mentee κάνει επίσης κάτι παρόμοιο, αν και αντί να φέρει την AI σε ένα υπάρχον ανθρωποειδές υπό ανάπτυξη, η εταιρεία εργάζεται για την κατασκευή ενός ανθρωποειδούς με AI σε όλα τα επίπεδα των λειτουργιών του. Σύμφωνα με την εταιρεία, το πρωτότυπο Menteebot μετατρέπει τις εντολές που δίνει ο άνθρωπος σε σύνθετες ενέργειες στον πραγματικό κόσμο χρησιμοποιώντας Τεχνητή Νοημοσύνη σε τρία βασικά επίπεδα.
Πρώτον, χρησιμοποιεί μετασχηματιστικά LLM για να ερμηνεύει τις εντολές και να “σκέφτεται” τα απαιτούμενα βήματα για την ολοκλήρωση μιας εργασίας. Στη συνέχεια, χρησιμοποιώντας αλγορίθμους βασισμένους στο NeRF, κατασκευάζει έναν γνωστικό τρισδιάστατο χάρτη του περιβάλλοντος σε πραγματικό χρόνο, συμπληρωμένο με σημασιολογικές πληροφορίες για διάφορα αντικείμενα και εντοπίζει τον εαυτό του στον χάρτη, ενώ σχεδιάζει μια δυναμική διαδρομή για να αποφύγει τα εμπόδια. Τέλος, εκτελεί τα προγραμματισμένα βήματα στο προγραμματισμένο μονοπάτι με μια προσέγγιση μηχανικής μάθησης από προσομοιωτή σε πραγματικότητα (Sim2Real), η οποία ορίζει την απαιτούμενη κίνηση σε ένα προσομοιωμένο περιβάλλον και την υιοθετεί στον πραγματικό κόσμο με κινήσεις βάδισης και χεριών.
Αν και το ρομπότ που παρουσιάστηκε στο demo video φαίνεται να εκτελεί το βασικό έργο της εισόδου σε μια κουζίνα και της μετακίνησης φρούτων από το ένα μέρος στο άλλο, είναι σημαντικό να σημειωθεί ότι δεν εκτέλεσε το καθήκον με μία μόνο εντολή. Ο χρήστης έδωσε εντολή στο ρομπότ να πάει και να περιμένει στην κουζίνα και στη συνέχεια έδωσε μια άλλη εντολή να πάρει και να αφήσει τα φρούτα στο επόμενο μέρος. Μένει να δούμε αν το ρομπότ είναι σε θέση να εκτελέσει την ίδια εργασία με μία μόνο εντολή.
Τούτου λεχθέντος, δεδομένου ότι πρόκειται για πρωτότυπο, μπορούμε να περιμένουμε ότι το ρομπότ θα βελτιωθεί με την πάροδο του χρόνου και θα αποκτήσει την ικανότητα να χειρίζεται σύνθετες εντολές χωρίς βήμα προς βήμα οδηγίες. Αυτό θα ήταν ζωτικής σημασίας για την παροχή πρακτικών εφαρμογών σε περιβάλλοντα οικιακής χρήσης και αποθηκών.
Η Mentee, από την πλευρά της, αναφέρει ότι η τελική έκδοση του ανθρωποειδούς που θα είναι έτοιμη για παραγωγή θα τροφοδοτείται μόνο με αισθητήρες με κάμερες, ιδιόκτητους ηλεκτροκινητήρες που υποστηρίζουν πρωτοφανή επιδεξιότητα και πλήρως ενσωματωμένη Τεχνητή Νοημοσύνη. Θα είναι έτοιμο για ανάπτυξη το πρώτο τρίμηνο του 2025, αν και η εταιρεία δεν έχει επιβεβαιώσει σε ποιο τμήμα σκοπεύει να στοχεύσει πρώτα.
[Menteebot]