Η Google ανακοίνωσε την κυκλοφορία του Nano Banana 2, που επίσημα ονομάζεται Gemini 3.1 Flash Image. Αυτή η ενημέρωση έρχεται μετά την αρχική κυκλοφορία του μοντέλου Nano Banana τον Αύγουστο του περασμένου έτους και την επακόλουθη έκδοση Nano Banana Pro τον Νοέμβριο.
Το νέο μοντέλο έχει σχεδιαστεί για να συνδυάζει τις προηγμένες δυνατότητες δημιουργίας οπτικών πληροφοριών και συλλογισμού της έκδοσης Pro με τις ταχύτερες ταχύτητες επεξεργασίας που χαρακτηρίζουν την αρχιτεκτονική Flash της Google. Έχει σχεδιαστεί για να προσφέρει στους προγραμματιστές μια βελτιωμένη αναλογία τιμής-απόδοσης για την ανάπτυξη εξελιγμένης δημιουργίας οπτικών πληροφοριών σε μεγάλη κλίμακα.
Το Nano Banana 2 εισάγει αρκετές τεχνικές και λειτουργικές ενημερώσεις που στοχεύουν στη βελτίωση τόσο της ταχύτητας όσο και της ποιότητας εξόδου σε σύγκριση με τον προκάτοχο του:
- Ενσωμάτωση Γνώσης σε Πραγματικό Χρόνο: Το μοντέλο αποκτά πρόσβαση σε πληροφορίες πραγματικού κόσμου και εικόνες αναζήτησης στο διαδίκτυο για την ακριβή απόδοση συγκεκριμένων θεμάτων. Για να το καταδείξει αυτό, η Google δημιούργησε μια εφαρμογή επίδειξης “Window Seat”, η οποία δημιουργεί φωτορεαλιστικές προβολές παραθύρων με βάση συγκεκριμένες παγκόσμιες τοποθεσίες και δεδομένα καιρού σε πραγματικό χρόνο.
- Απόδοση και Τοπικοποίηση Κειμένου: Το σύστημα μπορεί να δημιουργήσει ευανάγνωστο κείμενο μέσα σε εικόνες, κατάλληλο για δυναμικές γεννήτριες UI ή μακέτες μάρκετινγκ. Υποστηρίζει επίσης την τοπική προσαρμογή εντός εικόνας. Μια εφαρμογή επίδειξης με τίτλο “Global Ad Localizer” το υπογραμμίζει αυτό μεταφράζοντας το κείμενο της διαφήμισης και προσαρμόζοντας το οπτικό πλαίσιο για διαφορετικές διεθνείς αγορές απευθείας μέσα στην εικόνα.
- Συνέπεια Θέματος: Το μοντέλο επιτρέπει στους χρήστες να διατηρούν την οπτική συνέπεια έως και πέντε διακριτών χαρακτήρων και 14 αντικειμένων σε μία μόνο ροή εργασίας. Η επίδειξη “Pet Passport” της Google το καταδεικνύει αυτό λαμβάνοντας μία μόνο φωτογραφία αναφοράς ενός κατοικίδιου και αποδίδοντάς την με ακρίβεια σε διάφορα διάσημα παγκόσμια ορόσημα.
- Διαμορφώσιμα Επίπεδα Σκέψης: Οι προγραμματιστές μπορούν πλέον να προσαρμόσουν τη διαδικασία συλλογισμού του μοντέλου. Εναλλάσσοντας μεταξύ των επιπέδων σκέψης «Ελάχιστη» (προεπιλογή) και «Υψηλή/Δυναμική», το μοντέλο μπορεί να αφιερώσει περισσότερο χρόνο επεξεργασίας σε σύνθετες, πολυεπίπεδες υποδείξεις πριν από την απόδοση, γεγονός που βελτιώνει την τήρηση των οδηγιών.
- Εκτεταμένες Προδιαγραφές Εξόδου: Το Nano Banana 2 υποστηρίζει ένα ευρύτερο φάσμα αναλογιών διαστάσεων, προσθέτοντας εγγενή υποστήριξη για μορφές 4:1, 1:4, 8:1 και 1:8. Εισάγει επίσης ένα νέο επίπεδο ανάλυσης 512px βελτιστοποιημένο για απόδοση και ελαχιστοποίηση της καθυστέρησης σε αγωγούς βαρέως τύπου, ενώνοντας τις υπάρχουσες προσφορές 1K, 2K και 4K.
- Οπτική Πιστότητα: Το νέο μοντέλο παρέχει βελτιώσεις στον ζωντανό φωτισμό, τον πλούτο υφής και τη συνολική λεπτομέρεια, διατηρώντας παράλληλα ταχύτερες ταχύτητες δημιουργίας.
Η Google προσφέρει το Nano Banana 2 για εργασίες ταχείας δημιουργίας και βασισμένες στην αναζήτηση, ενώ το Nano Banana Pro παραμένει διαθέσιμο για ροές εργασίας που απαιτούν μέγιστη υψηλή πιστότητα στην ακρίβεια των δεδομένων. Το Nano Banana 2 κυκλοφορεί αυτήν τη στιγμή στις ακόλουθες πλατφόρμες:
- Εργαλεία Προγραμματιστή: Το μοντέλο είναι διαθέσιμο σήμερα για προγραμματιστές που χρειάζονται ανάπτυξη σε επιχειρήσεις ή δημιουργούν προσαρμοσμένες εφαρμογές. Η πρόσβαση απαιτεί ένα επί πληρωμή κλειδί API. Είναι ενσωματωμένο στο Gemini API, το Google AI Studio, το Vertex AI του Google Cloud, το Google Antigravity και το Firebase.
- Εφαρμογή Gemini: Το Nano Banana 2 αντικαθιστά το Nano Banana Pro ως προεπιλογή στα μοντέλα Fast, Thinking και Pro. Οι συνδρομητές του Google AI Pro και Ultra διατηρούν πρόσβαση στο Nano Banana Pro για εξειδικευμένες εργασίες χρησιμοποιώντας την επιλογή “αναγέννηση” στο μενού με τις τρεις τελείες.
- Αναζήτηση Google: Ενσωματωμένο στη Λειτουργία AI και το Google Lens σε όλη την εφαρμογή Google, καθώς και σε προγράμματα περιήγησης ιστού για κινητά και υπολογιστές. Είναι διαθέσιμο σε 141 νέες χώρες και περιοχές, υποστηρίζοντας οκτώ επιπλέον γλώσσες.
- Flow: Το Nano Banana 2 είναι πλέον το προεπιλεγμένο μοντέλο δημιουργίας εικόνων στο Flow, προσβάσιμο στους χρήστες με μηδενική χρέωση.
- Διαφημίσεις Google: Το μοντέλο είναι προς το παρόν διαθέσιμο για την υποστήριξη προτάσεων στοιχείων κατά τη δημιουργία καμπάνιας.
Παράλληλα με την κυκλοφορία του μοντέλου, η Google παρείχε μια ενημέρωση σχετικά με τα εργαλεία αναγνώρισης δημιουργικών μέσων. Οι έξοδοι Nano Banana 2 χρησιμοποιούν την ιδιόκτητη τεχνολογία υδατογράφησης SynthID της εταιρείας, διαλειτουργώντας με τα Διαπιστευτήρια Περιεχομένου C2PA για να παρέχουν πληροφορίες σχετικά με τον τρόπο δημιουργίας ή τροποποίησης μιας εικόνας.
Σύμφωνα με την Google, η λειτουργία επαλήθευσης SynthID στην εφαρμογή Gemini έχει χρησιμοποιηθεί πάνω από 20 εκατομμύρια φορές από την κυκλοφορία της το Νοέμβριο. Η εταιρεία ανακοίνωσε επίσης σχέδια για την ενσωμάτωση της επαλήθευσης C2PA απευθείας στην εφαρμογή Gemini στο εγγύς μέλλον.









