Φαίνεται ότι βρισκόμαστε ένα βήμα πιο κοντά στην εποχή που δεν θα πιστεύουμε στα μάτια μας, καθώς η εξέλιξη της τεχνητής νοημοσύνης φέρνει εντυπωσιακά νέα εργαλεία.
Αφού «κατέκτησε» τον κόσμο με το ChatGPT, που χρησιμοποιεί τεχνητή νοημοσύνη για να παράγει κείμενο που προσπαθεί να μοιάζει γραμμένο από ανθρώπινο χέρι, τώρα η OpenAI επιχειρεί να πάει ένα βήμα πιο μακριά με το «Sora», ένα νέο μοντέλο τεχνητής νοημοσύνης που φτιάχνει βίντεο από απλές εντολές που του δίνουμε.
Έχουμε δει αντίστοιχου τύπου λειτουργίες με ΑΙ που φτιάχνει εικόνες, αλλά η δημιουργία βίντεο, με την ποιότητα εικόνας που παρουσιάζει η εταιρεία, φαίνεται πως ανοίγει πολλές νέες δυνατότητες -με θετικές και αρνητικές προεκτάσεις.
Ήδη, υπάρχουν ανησυχίες που εγείρονται εξαιτίας της ανεξέλεγκτης χρήσης τεχνητής νοημοσύνης για παραγωγή έργων τέχνης, για την απώλεια θέσεων εργασίας, αλλά και για τη χρήση προσώπων χωρίς τη συγκατάθεσή τους, με διάφορους τρόπους.
Στο διαδίκτυο έχουν αρχίσει να εμφανίζονται τέτοια παραδείγματα: από χιουμοριστικά βίντεο που χρησιμοποιούν τη φωνή ενός πολιτικού, μέχρι -πειστικά- fake news ή βίντεο ερωτικού περιεχομένου με το πρόσωπο ενός ατόμου που δεν έχει δώσει συγκατάθεση.
Εντυπωσιακή η πρώτη παρουσίαση του Sora
Σε κάθε περίπτωση, το νέο εργαλείο της OpenAI εντυπωσιάζει στην πρώτη του παρουσίαση, με σύντομα βίντεο που αναπτύσσονται βάσει απλών περιγραφών που δίνει ο χρήστης και με εντελώς ρεαλιστική εικόνα. Η εικόνα είναι τόσο αληθοφανής που δύσκολα θα μπορούσε κανείς να διακρίνει ότι δεν πρόκειται για πραγματικά βίντεο, τραβηγμένα από κάμερα.
Το μοντέλο Sora θα γίνει αρχικά διαθέσιμο για περιορισμένο αριθμό χρηστών, σύμφωνα με την εταιρεία που το αναπτύσσει.
Η OpenAI, πάντως, ανέφερε ότι, επί του παρόντος, το μοντέλο παρουσιάζει κάποια ελαττώματα, ενώ τόνισε ότι το θέμα της ασφάλειας είναι σημαντικό και ότι θα γίνουν βήματα για να καθοριστούν σωστά τα όρια της πλατφόρμας.
Δείτε παραδείγματα από βίντεο που έφτιαξε το νέο μοντέλο τεχνητής νοημοσύνης της OpenAI
Για να δείξει πώς λειτουργεί το Sora, η OpenAI έχει αναρτήσει στην ιστοσελίδα της μερικά βίντεο, γράφοντας δίπλα το κείμενο πάνω στο οποίο βασίστηκε η τεχνητή νοημοσύνη για να φτιάξει το υλικό.
Το ίδιο έκανε και ο Σαμ Άλτμαν, επικεφαλής της εταιρείας, ο οποίος ζήτησε από τους χρήστες των social media να του δώσουν κάποιες περιγραφές, τις οποίες μετά έκανε βίντεο με το Sora, σε μερικά λεπτά, τα οποία ανέβασε στο Χ.
- Δίνοντας την περιγραφή «ένας μάγος με μυτερό καπέλο και μπλε στολή με λευκά αστέρια που κάνει ένα ξόρκι που εκτοξεύει αστραπές από το χέρι του και κρατά ένα παλιό βιβλίο στο άλλο του χέρι», το μοντέλο έφτιαξε το παρακάτω βίντεο:
- Εδώ, βλέπουμε: «Η όμορφη, χιονισμένη πόλη του Τόκιο είναι πολύβουη. Η κάμερα κινείται στον πολυσύχναστο δρόμο της πόλης, ακολουθώντας αρκετούς ανθρώπους που απολαμβάνουν τον όμορφο χιονισμένο καιρό και ψωνίζουν σε κοντινούς πάγκους. Πανέμορφα πέταλα σάκουρα [κερασιά] πετούν στον άνεμο μαζί με νιφάδες χιονιού».
- Παρακάτω: «Μια κομψή γυναίκα περπατάει σε έναν δρόμο του Τόκιο γεμάτο με ζεστό λαμπερό νέον και κινούμενες πινακίδες της πόλης. Φοράει ένα μαύρο δερμάτινο μπουφάν, ένα μακρύ κόκκινο φόρεμα και μαύρες μπότες και κρατάει μια μαύρη τσάντα. Φοράει γυαλιά ηλίου και κόκκινο κραγιόν. Περπατάει με αυτοπεποίθηση και άνετα. Ο δρόμος είναι υγρός και αντανακλαστικός, δημιουργώντας ένα εφέ καθρέφτη των πολύχρωμων φώτων. Πολλοί πεζοί περπατούν γύρω».
- Σε πιο χιουμοριστικά παραδείγματα, βλέπουμε «μια ποδηλατοδρομία στον ωκεανό με διάφορα ζώα ως αθλητές που οδηγούν τα ποδήλατα με θέα από κάμερα drone»:
- Επίσης, «μια μισή πάπια μισός δράκος πετάει μέσα σε ένα όμορφο ηλιοβασίλεμα με ένα χάμστερ ντυμένο με εξοπλισμό περιπέτειας στην πλάτη του»:
- «Δύο γκόλντεν ριτρίβερ κάνουν podcast στην κορυφή ενός βουνού»:
- «Μια εκπαιδευτική συνεδρία μαγειρικής για σπιτικά νιόκι από μια γιαγιά influencer στα μέσα κοινωνικής δικτύωσης σε μια ρουστίκ κουζίνα της Τοσκάνης με κινηματογραφικό φωτισμό»: