Η εκδήλωση Cloud Next 2024 της Google που πραγματοποιήθηκε σήμερα είναι μια πραγματική επίδειξη των νέων εξελίξεων στον τομέα της τεχνητής νοημοσύνης που εφαρμόζεται στις πλατφόρμες cloud της εταιρείας. Οι ειδήσεις είναι αρκετές και αντιλαμβάνεστε ότι στο Mountain View ήταν (και είναι) πολύ απασχολημένοι με την AI!
Το Gemini 1.5 Pro μπορεί πλέον να σας ακούσει!
Η νέα έκδοση του LLM της Google ενημερώνεται με τη δυνατότητα ακρόασης αρχείων ήχου που ανεβάζετε στην πλατφόρμα. Αυτό καθιστά δυνατό για το Gemini να κάνει περιλήψεις φωνητικών κλήσεων ή βίντεο χωρίς να χρειάζεται να καταφύγετε σε προηγούμενη μεταγραφή. Το Gemini 1.5 Pro είχε ήδη ανακοινωθεί τον Φεβρουάριο, αλλά τώρα το καθιστά διαθέσιμο στο κοινό μέσω της πλατφόρμας ανάπτυξης εφαρμογών AI, Vertex AI.
Imagen 2.0
Η οικογένεια μοντέλων Generative AI έχει ένα μάλλον παραπλανητικό όνομα, καθώς δεν παράγει μόνο εικόνες. Το Imagen 2 παρουσιάστηκε πριν από μήνες, αλλά τώρα επαναλανσάρεται ως εναλλακτική λύση σε έναν όλο και πιο ανταγωνιστικό τομέα. Μεταξύ των επιλογών του είναι αυτές της προσθήκης περιεχομένου σε μια υπάρχουσα εικόνα (outpainting) ή της διόρθωσης και διαγραφής δεδομένων από άλλες (inpainting, όπως το Pixel Magic Editor). Η Google θα κάνει χρήση της επιλογής SynthID για την προσθήκη υδατογραφημάτων σε εικόνες που δημιουργούνται από τεχνητή νοημοσύνη.
Όπως αναφέραμε προηγουμένως, το Imagen 2 είναι μια οικογένεια μοντέλων AI που δεν παράγει μόνο εικόνες, αλλά και videos. Έτσι, είναι δυνατή η δημιουργία σύντομων βίντεο τεσσάρων δευτερολέπτων από προτροπές κειμένου. Και αν αυτό δεν ήταν αρκετό, περιλαμβάνει επίσης μια γεννήτρια κώδικα AI, συγκεκριμένα το CodeGemma, ένα ελαφρύ μοντέλο που προσπαθεί να προσφέρει βοήθεια όπως αυτές που ήδη παρέχονται, για παράδειγμα, από το GitHub Copilot.
Google Vids
Μια άλλη αξιοσημείωτη καινοτομία είναι το Google Vids, ένα εργαλείο που εντάσσεται στο πακέτο cloud εφαρμογών Google Workspace. Πρόκειται για έναν επεξεργαστή βίντεο που έχει σχεδιαστεί για επιχειρηματικά περιβάλλοντα και σας επιτρέπει να παράγετε γρήγορα βίντεο που μπορείτε στη συνέχεια να μοιραστείτε στην εργασία σας. Στη Google το αντιλαμβάνονται ως εναλλακτική λύση για τις παρουσιάσεις Powerpoint, αλλά εδώ η εταιρεία προσφέρει επίσης τη δύναμη του Gemini AI, ώστε η τεχνητή νοημοσύνη να δημιουργεί ένα πρώτο προσχέδιο του βίντεο για να εργαστείτε. Μπορείτε να δημιουργήσετε ένα storyboard, ένα σενάριο, μπορείτε να το διαβάσετε δυνατά ή μπορείτε να δημιουργήσετε εικόνες που θα χρησιμοποιηθούν στο βίντεο. Για τους υπεύθυνους για τη δημιουργία, η ιδέα είναι να δουλεύουμε όπως θα δουλεύαμε με ένα spreadsheet ή έναν επεξεργαστή κειμένου.
Η AI κατακτά το cloud της Google
Η εταιρεία επιθυμεί να ενσωματώσει τις δυνατότητες τεχνητής νοημοσύνης σε όλα τα προϊόντα της και ανακοίνωσε νέα χαρακτηριστικά στα εργαλεία ανάλυσης, τις βάσεις δεδομένων, την κυβερνοασφάλεια, την πλατφόρμα IaaS (computing, communications), καθώς και νέες περιπτώσεις για πελάτες όπως το A3 Mega (βασισμένο στην NVIDIA H100) και τη διαθεσιμότητα του νέου NVIDIA HGX B200 στις αρχές του 2025.
Ο Chrome browser θωρακίζεται για τις επιχειρήσεις
Ο web browser της Google θα είναι διαθέσιμος και σε έκδοση για επιχειρήσεις με την ονομασία Chrome Enterprise Premium. Σε αυτή την έκδοση, ακόμη πιο φιλόδοξη από αυτή που ήδη προσφέρει για τις εταιρείες, το πρόγραμμα περιήγησης γίνεται μια συνδρομητική εφαρμογή με κόστος 6 δολάρια το μήνα ανά χρήστη, αλλά προσθέτει περισσότερες δυνατότητες ασφαλείας για να προστατεύεται από εξωτερικές απειλές και να αποτρέπει πιθανές επιθέσεις.
[Google]