Η Google ετοιμάζει μια σειρά από ενημερώσεις στο μέτωπο της παραγωγικής Τεχνητής Νοημοσύνης (AI), συμπεριλαμβανομένου ενός νέου εργαλείου μετατροπής κειμένου σε εικόνα. Αυτό που διαφέρει στο ImageFX είναι ότι διαθέτει ένα περιβάλλον εργασίας που διαθέτει «εκφραστικά chips». Σκοπός εδώ είναι να σας βοηθήσουν να «πειραματιστείτε γρήγορα με παρακείμενες διαστάσεις της δημιουργίας και των ιδεών σας».
Το πρότυπο Imagen 2 τροφοδοτεί τα νέα χαρακτηριστικά δημιουργίας εικόνων του ImageFX. Είναι επίσης η τεχνολογία που κινεί τις νέες επιλογές παραγωγικής Τεχνητής Νοημοσύνης στο Bard, το Search, τις Διαφημίσεις, το Duet AI στο Workspace και το Vertex AI. Η Google αναφέρει ότι το Imagen 2 βοηθά στην παροχή της υψηλότερης ποιότητας εικόνων που δημιουργούνται από AI. Η εταιρεία σημειώνει ότι το μοντέλο βοηθά να διατηρηθούν οι εικόνες καθαρές από τεχνουργήματα και βελτιώνει τους τομείς της δημιουργίας εικόνων με τους οποίους τέτοια εργαλεία δυσκολεύονταν μέχρι τώρα.
Επιπλέον, η Google αναφέρει ότι έχει κάνει “σημαντικές επενδύσεις” στο Imagen 2, προκειμένου να το εκπαιδεύσει στην ασφάλεια των δεδομένων, προσθέτοντας παράλληλα κατευθυντήριες γραμμές για τον “περιορισμό προβληματικών αποτελεσμάτων, όπως βίαιο, προσβλητικό ή σεξουαλικό περιεχόμενο, καθώς και την εφαρμογή φίλτρων για τη μείωση του κινδύνου δημιουργίας εικόνων επώνυμων ατόμων“. Αυτό οφείλεται στην αναβαθμισμένη ικανότητα του μοντέλου να παράγει φωτορεαλιστικές εικόνες. Η εταιρεία ισχυρίζεται ότι πραγματοποιεί επίσης “εκτεταμένες αντιπαραθετικές δοκιμές” για τον εντοπισμό και την καταστολή του δυνητικά προβληματικού και επιβλαβούς περιεχομένου.
Παράλληλα με το ντεμπούτο του ImageFX, η Google αναφέρει ότι έχει βελτιώσει τα εργαλεία MusicFX και TextFX. Η εταιρεία ισχυρίζεται ότι έκανε αναβαθμίσεις στο μοντέλο MusicLM στις οποίες συμπεριλαμβάνονται ταχύτερη παραγωγή μουσικής και υψηλότερης ποιότητας ήχος, μαζί με άλλα νέα χαρακτηριστικά. Τα παραγόμενα τραγούδια μπορούν πλέον να έχουν διάρκεια έως και 70 δευτερόλεπτα. Όσον αφορά το TextFX, η Google έχει προχωρήσει σε αναβαθμίσεις που αφορούν την ευκολία χρήσης με στόχο τη βελτίωση της πλοήγησης και της συνολικής εμπειρίας του χρήστη.
Οι εικόνες που δημιουργούνται με το ImageFX και ο ήχος που παράγεται με το MusicFX επισημαίνονται με το SynthID, ένα ψηφιακό υδατογράφημα που έχει ως στόχο να καταστήσει σαφές πως έχουν δημιουργηθεί με Τεχνητή Νοημοσύνη, ειδικά όταν εμφανίζονται στο Search ή τον Chrome. Οι δημιουργίες με το ImageFX θα περιλαμβάνουν επίσης IPTC metadata. Αυτό, σύμφωνα με τη Google, θα προσφέρει «στους ανθρώπους περισσότερες πληροφορίες κάθε φορά που συναντούν τις εικόνες που δημιουργούνται από την Τεχνητή Νοημοσύνη μας».
Οι κάτοικοι των ΗΠΑ, της Κένυας, της Νέας Ζηλανδίας και της Αυστραλίας μπορούν να δοκιμάσουν αυτά τα νέα και ανανεωμένα εργαλεία στο AI Test Kitchen από σήμερα. Προς το παρόν είναι διαθέσιμα μόνο στα Αγγλικά.
Εξάλλου, το Gemini Pro στο Bard είναι ευρύτερα διαθέσιμο από σήμερα. Είναι πλέον προσβάσιμο σε περισσότερες από 40 γλώσσες και σε 230 χώρες (συμπεριλαμβάνεται η Ελλάδα και η Κύπρος). Επίσης, από σήμερα, η Google λέει ότι οι άνθρωποι στις περισσότερες χώρες μπορούν να δημιουργήσουν εικόνες στο Bard στα Αγγλικά δωρεάν. Οι εικόνες αυτές θα περιλαμβάνουν υδατογραφήματα SynthID.
[Google]