Η Google παρουσίασε το Gemma 4, μια οικογένεια ανοιχτών μοντέλων σχεδιασμένων για προηγμένες ροές εργασίας συλλογισμού και πρακτικών. Τα μοντέλα έχουν σχεδιαστεί για να παρέχουν υψηλή νοημοσύνη ανά παράμετρο, ενώ παράλληλα παραμένουν αποτελεσματικά σε ένα ευρύ φάσμα περιβαλλόντων υλικού. Το Gemma 4 τοποθετείται ως μέρος του ευρύτερου οικοσυστήματος τεχνητής νοημοσύνης της Google και συμπληρώνει τα ιδιόκτητα μοντέλα Gemini.
Η κυκλοφορία έρχεται μετά την ισχυρή υιοθέτηση προηγούμενων μοντέλων Gemma, τα οποία έχουν καταγράψει πάνω από 400 εκατομμύρια λήψεις και έχουν συμβάλει σε ένα μεγάλο οικοσύστημα που βασίζεται στην κοινότητα με περισσότερες από 100.000 παραλλαγές. Το Gemma 4 συνεχίζει αυτή την κατεύθυνση, διαθέτοντας τις δυνατότητές του με μια εμπορικά επιτρεπτική άδεια Apache 2.0.
Gemma 4 open AI models
Το Gemma 4 διατίθεται σε τέσσερις παραλλαγές σχεδιασμένες για διαφορετικές ανάγκες υπολογισμού και ανάπτυξης:
- Effective 2B (E2B)
- Effective 4B (E4B)
- 26B Mixture of Experts (MoE)
- 31B Dense
Το μοντέλο 26B MoE ενεργοποιεί ένα υποσύνολο παραμέτρων κατά την εξαγωγή συμπερασμάτων (περίπου 3,8 δισεκατομμύρια ενεργές παράμετροι), βελτιώνοντας την απόδοση και την καθυστέρηση. Το μοντέλο 31B dense χρησιμοποιεί όλες τις παραμέτρους και έχει σχεδιαστεί για να δίνει προτεραιότητα στην ποιότητα εξόδου και να χρησιμεύει ως ισχυρή βάση για βελτιστοποίηση.
Τα μεγαλύτερα μοντέλα προορίζονται για υλικό υψηλής απόδοσης, συμπεριλαμβανομένων των GPU σταθμών εργασίας και των περιβαλλόντων επιταχυντή, ενώ τα μικρότερα μοντέλα E2B και E4B είναι βελτιστοποιημένα για συσκευές edge όπως smartphones και ενσωματωμένα συστήματα.
Βασικά χαρακτηριστικά
- Προηγμένη συλλογιστική: Υποστηρίζει λογική πολλαπλών βημάτων, σχεδιασμό και βελτιωμένη απόδοση σε μαθηματικές εργασίες και εργασίες που ακολουθούν οδηγίες.
- Ροές εργασίας πρακτορικών: Περιλαμβάνει εγγενή κλήση συναρτήσεων, δομημένες εξόδους JSON και υποστήριξη οδηγιών συστήματος για την κατασκευή πρακτόρων τεχνητής νοημοσύνης με χρήση εργαλείων.
- Πολυτροπικές είσοδοι: Επεξεργάζεται εικόνες και βίντεο εγγενώς, υποστηρίζοντας OCR, κατανόηση γραφημάτων και οπτική ανάλυση. Τα E2B και E4B υποστηρίζουν επίσης είσοδο ήχου για εργασίες που σχετίζονται με ομιλία.
- Μεγάλα παράθυρα περιβάλλοντος: Έως 128.000 διακριτικά για μοντέλα edge και έως 256.000 διακριτικά για μεγαλύτερα μοντέλα, επιτρέποντας τον χειρισμό μεγάλων εγγράφων και βάσεων κώδικα.
- Δημιουργία κώδικα: Υποστηρίζει τη δημιουργία κώδικα εκτός σύνδεσης για ροές εργασίας ανάπτυξης και τοπική κωδικοποίηση με υποβοήθηση τεχνητής νοημοσύνης.
- Πολυγλωσσική κάλυψη: Εκπαιδευμένο σε περισσότερες από 140 γλώσσες για παγκόσμιες περιπτώσεις χρήσης.
- Αποδοτικότητα υλικού: Βελτιστοποιημένο για εκτέλεση σε GPU, κινητές συσκευές και υλικό edge με αποτελεσματική χρήση υπολογισμού και μνήμης.
- Ανάπτυξη Edge: Τα μοντέλα E2B και E4B λειτουργούν πλήρως εκτός σύνδεσης με χαμηλή καθυστέρηση σε συσκευές όπως smartphone και ενσωματωμένες πλατφόρμες. Έρευνα και εφαρμοσμένες περιπτώσεις χρήσης: Χρησιμοποιείται σε έργα όπως το BgGPT από το INSAIT και η έρευνα Cell2Sentence-Scale στο Πανεπιστήμιο Yale για επιστημονική εξερεύνηση.
Το Gemma 4 κυκλοφορεί με την άδεια Apache 2.0, η οποία επιτρέπει εμπορική και μη εμπορική χρήση με ελάχιστους περιορισμούς. Οι προγραμματιστές μπορούν να τροποποιήσουν, να βελτιώσουν και να αναπτύξουν τα μοντέλα διατηρώντας παράλληλα τον έλεγχο των δεδομένων, της υποδομής και των περιβαλλόντων ανάπτυξης.
Η άδεια υποστηρίζει ευέλικτη χρήση σε συστήματα εσωτερικής εγκατάστασης, ιδιωτικές υποδομές και πλατφόρμες cloud χωρίς περιοριστικούς περιορισμούς αδειοδότησης.
Το Gemma 4 υποστηρίζεται σε ένα ευρύ φάσμα πλαισίων τεχνητής νοημοσύνης και εργαλείων προγραμματιστών, επιτρέποντας την ενσωμάτωση σε διαφορετικές ροές εργασίας και ρυθμίσεις ανάπτυξης.
Τα υποστηριζόμενα εργαλεία περιλαμβάνουν τα Hugging Face (Transformers, TRL, Transformers.js, Candle), vLLM, llama.cpp, Ollama, NVIDIA NIM και NeMo, LM Studio, Unsloth, SGLang, Docker, MaxText, Tunix και Keras.
Οι επιλογές πρόσβασης σε μοντέλα και πειραματισμού περιλαμβάνουν:
- Google AI Studio για μεγαλύτερα μοντέλα
- Google AI Edge Gallery για μοντέλα βελτιστοποιημένα για edge
- Hugging Face, Kaggle και Ollama για λήψεις
Οι επιλογές ανάπτυξης περιλαμβάνουν:
- Τοπική συμπερασματολογία σε GPU καταναλωτών και συστήματα προγραμματιστών
- Ανάπτυξη Edge σε κινητές και ενσωματωμένες συσκευές
- Ανάπτυξη cloud μέσω υπηρεσιών Google Cloud όπως Vertex AI, Cloud Run, GKE και Sovereign Cloud
- Εξυπηρέτηση βάσει TPU για φόρτους εργασίας μεγάλης κλίμακας
- Τα μοντέλα είναι συμβατά με πολλά οικοσυστήματα υλικού, συμπεριλαμβανομένων των GPU NVIDIA, των GPU AMD μέσω ROCm και των TPU Google.
Το Gemma 4 ακολουθεί καθιερωμένες πρακτικές ασφάλειας και προστασίας που ευθυγραμμίζονται με τα εσωτερικά πρότυπα ανάπτυξης μοντέλων της Google. Αυτές περιλαμβάνουν προστασίες σε επίπεδο υποδομής, ελέγχους αξιοπιστίας και ελεγχόμενες πρακτικές ανάπτυξης.
Τα μοντέλα έχουν σχεδιαστεί για να πληρούν τις εταιρικές και τις κανονιστικές απαιτήσεις, παρέχοντας μια σταθερή και διαφανή βάση για χρήση στην παραγωγή, διατηρώντας παράλληλα σταθερή απόδοση.
Το Gemma 4 είναι διαθέσιμο μέσω πολλαπλών πλατφορμών για πειραματισμό, ανάπτυξη και ανάπτυξη:
- Google AI Studio για πρόσβαση σε 26B μοντέλα MoE και 31B
- Google AI Edge Gallery για μοντέλα E2B και E4B
- Εργαλεία ανάπτυξης Android όπως το Android Studio με λειτουργία Agent και το ML Kit GenAI Prompt API
- Βάρη μοντέλων που κατανέμονται μέσω Hugging Face, Kaggle και Ollama
Οι προγραμματιστές μπορούν να εκτελέσουν το Gemma 4 τοπικά, να το βελτιστοποιήσουν για συγκεκριμένες εργασίες ή να το αναπτύξουν σε κλίμακα χρησιμοποιώντας υποδομή cloud. Τα μοντέλα υποστηρίζονται σε τοπικά, edge και cloud περιβάλλοντα, επιτρέποντας ευέλικτες ροές εργασίας από τη δημιουργία πρωτοτύπων έως τις αναπτύξεις παραγωγής.









