Η Google παρουσίασε το Gemini 2.5 Flash Image (γνωστό και ως nano-banana), το τελευταίο μοντέλο δημιουργίας και επεξεργασίας εικόνων της εταιρείας. Το μοντέλο έχει σχεδιαστεί για να διαπρέπει στη διατήρηση της συνέπειας των χαρακτήρων, στην τήρηση οπτικών προτύπων, στην ενεργοποίηση στοχευμένων μετασχηματισμών και στην πραγματοποίηση ακριβών τοπικών επεξεργασιών χρησιμοποιώντας φυσική γλώσσα.
Αυτό το τελευταίο μοντέλο δημιουργίας και επεξεργασίας εικόνων βρίσκεται στην κορυφή του πίνακα κατάταξης Image Edit Arena του LMArena, ξεπερνώντας το μοντέλο FLUX.1 Kontext όσον αφορά την ψηφοφορία και τη βαθμολογία. Για ευρύτερη διαθεσιμότητα, η Google το έχει ενσωματώσει στην εφαρμογή Gemini, επιτρέποντας στους χρήστες να δημιουργήσουν την τέλεια εικόνα τους.
Επιδεικνύοντας διάφορες περιπτώσεις χρήσης του μοντέλου, η Google έχει παραθέσει ορισμένες δυνατότητες που μπορούν να δοκιμάσουν οι χρήστες:
- Μπορείτε να ανεβάσετε μια φωτογραφία σας ή του κατοικίδιου ζώου σας και να δοκιμάσετε να αλλάξετε την ενδυμασία ή την τοποθεσία στην εικόνα. Το μοντέλο αναμένεται να προσφέρει επαναπροσδιορισμένα αποτελέσματα, διατηρώντας παράλληλα την εμφάνιση του θέματος σταθερή σε κάθε περίσταση.
- Το νέο μοντέλο σας επιτρέπει επίσης να ανεβάσετε πολλές φωτογραφίες και να τις συνδυάσετε για μια ολοκαίνουργια σκηνή μέσω ερωτήματος φυσικής γλώσσας.
- Το μοντέλο σας προσφέρει επίσης δυνατότητα επεξεργασίας πολλαπλών στροφών, που σημαίνει ότι μπορείτε να συνεχίσετε να επεξεργάζεστε τις εικόνες που δημιουργεί η Gemini.
- Αναμείξτε σχέδια: Εφαρμόστε το στυλ μιας εικόνας σε ένα αντικείμενο μιας άλλης. Μπορείτε να πάρετε το χρώμα και την υφή των πετάλων λουλουδιών και να τα εφαρμόσετε σε ένα ζευγάρι αδιάβροχες μπότες ή να σχεδιάσετε ένα φόρεμα χρησιμοποιώντας το μοτίβο από τα φτερά μιας πεταλούδας.
Το ευρύ κοινό μπορεί να δοκιμάσει αυτό το μοντέλο μέσω της εφαρμογής Google Gemini τώρα.
Είναι επίσης διαθέσιμο μέσω του Gemini API και του Google AI Studio για προγραμματιστές και του Vertex AI για επιχειρήσεις. Η τιμή του Gemini 2.5 Flash Image είναι 30,00 USD ανά 1 εκατομμύριο tokens εξόδου, με κάθε εικόνα να αποτελείται από 1290 tokens εξόδου (0,039 USD ανά εικόνα).









