Στην εκδήλωση Google I/O 2024, η Google αποκάλυψε πολλές ενημερώσεις και προσθήκες στις προσφορές της, εστιάζοντας στη βελτίωση των εμπειριών των χρηστών και στην παροχή νέων εργαλείων για προγραμματιστές. Ακολουθεί η ανάλυση των όσων ανακοινώθηκαν:
Gemini 1.5 Pro and 1.5 Flash
Το Gemini 1.5 Pro έλαβε σημαντικές βελτιώσεις ποιότητας σε διάφορες εργασίες όπως η μετάφραση και η κωδικοποίηση. Αυτές οι βελτιώσεις στοχεύουν να δώσουν τη δυνατότητα στους χρήστες να χειρίζονται αποτελεσματικά ευρύτερες και πιο σύνθετες εργασίες.
Εν τω μεταξύ, η εισαγωγή του Gemini 1.5 Flash καλύπτει εργασίες που απαιτούν γρήγορες απαντήσεις, χάρη στη βελτιστοποιημένη σχεδίασή του. Και τα δύο μοντέλα υποστηρίζουν εγγενώς πολυτροπικές δυνατότητες, επιτρέποντας στους χρήστες να ενσωματώνουν απρόσκοπτα κείμενο, εικόνες, ήχο και βίντεο.
Ενώ η τυπική έκδοση προσφέρει ένα παράθυρο περιβάλλοντος 1 εκατομμυρίου διακριτικών, οι χρήστες μπορούν να έχουν πρόσβαση στο παράθυρο διακριτικών 2 εκατομμυρίων μπαίνοντας στη λίστα αναμονής στο Google AI Studio ή στο Vertex AI για πελάτες του Google Cloud.
Οι εκδόσεις προεπισκόπησης και των δύο μοντέλων είναι διαθέσιμες σήμερα σε περισσότερες από 200 χώρες και περιοχές, με τη γενική διαθεσιμότητα να προγραμματίζεται για τον Ιούνιο.
- Παρουσιάστηκε το 1.5 Flash, βελτιστοποιημένο για ταχύτητα και αποτελεσματικότητα. Είναι ελαφρύτερο από το 1.5 Pro, αλλά υπερέχει σε εργασίες όπως η σύνοψη, οι εφαρμογές συνομιλίας και η εξαγωγή δεδομένων από έγγραφα.
- Σημαντικές βελτιώσεις έγιναν στο 1.5 Pro, βελτιώνοντας την απόδοσή του σε διάφορες εργασίες, όπως η δημιουργία κώδικα, η λογική συλλογιστική και η κατανόηση ήχου.
- Το Gemini Nano κατανοεί πλέον τις πολυτροπικές εισόδους, όπως κείμενο, εικόνες, ήχο και προφορική γλώσσα.
Developer Features
Σε απάντηση στα σχόλια των χρηστών, η Google εισάγει δύο νέες δυνατότητες στο Gemini API: εξαγωγή καρέ βίντεο και παράλληλη κλήση λειτουργιών, επιτρέποντας την πιο αποτελεσματική επεξεργασία των εργασιών.
Τον Ιούνιο, η Google σχεδιάζει να εφαρμόσει την προσωρινή αποθήκευση περιβάλλοντος για το Gemini 1.5 Pro, μειώνοντας την ανάγκη επανειλημμένης αποστολής μηνυμάτων και μεγάλων αρχείων στο μοντέλο, βελτιώνοντας έτσι την αποτελεσματικότητα και την οικονομική προσιτότητα.
Ενώ η πρόσβαση στο Gemini API παραμένει δωρεάν σε επιλέξιμες περιοχές μέσω του Google AI Studio, η Google επεκτείνει την υπηρεσία pay-as-you-go της, αυξάνοντας τα όρια τιμών για μεγαλύτερη χρήση.
Gemma Family
Το PaliGemma, το εναρκτήριο ανοιχτό μοντέλο της Google σε γλώσσα όρασης, κάνει το ντεμπούτο του, βελτιστοποιημένο για εργασίες όπως η δημιουργία λεζάντας εικόνων και οπτικές ερωτήσεις και απαντήσεις, ενώ ενώνει τις υπάρχουσες παραλλαγές της Gemma CodeGemma και RecurrentGemma.
Το Gemma 2, που πρόκειται να κυκλοφορήσει τον Ιούνιο, αντιπροσωπεύει την επόμενη γενιά μοντέλων Gemma, προσφέροντας κορυφαίες επιδόσεις στον κλάδο σε μεγέθη φιλικά προς τους προγραμματιστές.
Το μοντέλο Gemma 27B, ειδικά σχεδιασμένο για να εξισορροπεί το μέγεθος και την απόδοση, ξεπερνά την απόδοση των μεγαλύτερων μοντέλων, ενώ παραμένει συμβατό με GPU και TPU.
- Gemma 2: Google introduced Gemma 2, the next generation of open models designed for breakthrough performance and efficiency, available in new sizes.
- PaliGemma: The Gemma family expands with PaliGemma, the first vision-language model inspired by PaLI-3.
- Responsible Generative AI Toolkit: Upgraded with LLM Comparator for evaluating model responses’ quality.
Project Astra
Η Google μοιράστηκε την πρόοδο στο Project Astra, με στόχο την ανάπτυξη καθολικών πρακτόρων AI για καθημερινή βοήθεια.









