Home Software H OpenAI αποκαλύπτει το μοντέλο AI GPT-4o και επεκτείνει τα εργαλεία σε...

H OpenAI αποκαλύπτει το μοντέλο AI GPT-4o και επεκτείνει τα εργαλεία σε free ChatGPT χρήστες

34
GPT-4o

Η OpenAI παρουσίασε το GPT-4o, το πιο πρόσφατο κορυφαίο μοντέλο τεχνητής νοημοσύνης, μαζί με άλλες ενημερώσεις στην εκδήλωση «Spring Update», τονίζοντας τη δέσμευσή τους για την προώθηση της τεχνητής νοημοσύνης διασφαλίζοντας ταυτόχρονα την προσβασιμότητα για όλους.

GPT-4o: Faster, Smarter, Multimodal

Το GPT-4o, που ονομάζεται “o for omni”, προσφέρει ευφυΐα σε επίπεδο GPT-4, αλλά με αξιοσημείωτες βελτιώσεις ταχύτητας και διευρυμένες δυνατότητες σε επεξεργασία κειμένου, φωνής και βίντεο.

Συγκεκριμένα, υπερέχει στην κατανόηση και τη συζήτηση εικόνων, επιτρέποντας εργασίες όπως η μετάφραση μενού ή η εξήγηση αθλητικών κανόνων σε πραγματικό χρόνο. Επιπλέον, υποστηρίζει περισσότερες από 50 γλώσσες σε διάφορες λειτουργίες, ενισχύοντας την παγκόσμια προσβασιμότητα.

  • Αξιολογήσεις μοντέλου: Το GPT-4o επιτυγχάνει κορυφαίες επιδόσεις σε κείμενο, συλλογισμό και νοημοσύνη κωδικοποίησης. Θέτει νέα πρότυπα στις δυνατότητες πολυγλωσσίας, ήχου και όρασης.
  • Γλώσσα Tokenization: 20 αντιπροσωπευτικές γλώσσες επωφελούνται από τη συμπίεση του νέου tokenizer σε διάφορες οικογένειες γλωσσών.

Η ευελιξία του μοντέλου επιτρέπει την απρόσκοπτη αλληλεπίδραση με εισόδους και εξόδους σε μορφές κειμένου, ήχου και εικόνας. Με χρόνους απόκρισης συγκρίσιμους με την ανθρώπινη συνομιλία, το GPT-4o προσφέρει υψηλή απόδοση σε όλες τις γλώσσες και τις λεπτομέρειες, ειδικά στην κατανόηση βίντεο και ήχου.

Ο CEO της OpenAI, Sam Altman, επαινεί τη νέα λειτουργία φωνής (και βίντεο) ως την καλύτερη διεπαφή υπολογιστή που έχει βιώσει. Το βρίσκει εντυπωσιακά αληθινό, θυμίζοντας AI από ταινίες.

Ο Altman εκτιμά την ταχύτητα, την ευφυΐα, την απόλαυση, τη φυσικότητα και την υποστηρικτική του ικανότητα, σε αντίθεση με τις προηγούμενες διεπαφές. Προβλέπει ένα συναρπαστικό μέλλον με χαρακτηριστικά όπως η εξατομίκευση και η εκτέλεση εργασιών, όπου οι υπολογιστές ενδυναμώνουν τους χρήστες όσο ποτέ άλλοτε.

Η OpenAI δίνει έμφαση στην ασφάλεια στο GPT-4o, χρησιμοποιώντας τεχνικές όπως φιλτραρισμένα δεδομένα εκπαίδευσης και βελτιώσεις μετά την εκπαίδευση σε όλους τους τρόπους λειτουργίας του. Η αξιολόγηση μέσω του Πλαισίου Ετοιμότητας εξασφαλίζει μεσαία επίπεδα κινδύνου σε κρίσιμους τομείς όπως η κυβερνοασφάλεια και η αυτονομία του μοντέλου. Οι εκτεταμένες εξωτερικές αξιολογήσεις βοηθούν στον εντοπισμό και τον μετριασμό των κινδύνων, ειδικά σε νέους τομείς όπως οι έξοδοι ήχου, οι οποίες θα υποβληθούν σταδιακά με την εφαρμογή μέτρων ασφαλείας.

Στο πλαίσιο της αποστολής τους, η OpenAI επεκτείνει τα προηγμένα εργαλεία AI σε περισσότερους χρήστες, συμπεριλαμβανομένων των συνδρομητών ChatGPT Free. Λειτουργίες όπως η ευφυΐα επιπέδου GPT-4, οι απαντήσεις ιστού, η ανάλυση δεδομένων, οι συζητήσεις φωτογραφιών, οι μεταφορτώσεις αρχείων, η πρόσβαση σε GPT και η μνήμη είναι πλέον διαθέσιμες. Ωστόσο, ισχύουν όρια χρήσης, με το ChatGPT να αλλάζει σε GPT-3.5 μόλις φτάσει το όριο.

Additional Updates

  • Desktop App: Η νέα εφαρμογή macOS απλοποιεί τη ροή εργασίας των χρηστών, επιτρέποντας άμεση πρόσβαση στο ChatGPT και απρόσκοπτες συζητήσεις στιγμιότυπων οθόνης.
  • Φωνητικές συνομιλίες: Οι χρήστες μπορούν να συμμετέχουν σε φωνητικές συνομιλίες απευθείας από την εφαρμογή για υπολογιστές, με σχέδια για βελτιώσεις ήχου και βίντεο στο μέλλον.
  • Διάδοση εφαρμογών macOS: Η εφαρμογή macOS κάνει το ντεμπούτο της για χρήστες Plus, με μια έκδοση των Windows που αναμένεται να κυκλοφορήσει αργότερα.
  • Βελτιωμένη διεπαφή: Το ChatGPT διαθέτει μια ανανεωμένη, φιλική προς το χρήστη διεπαφή για μια πιο συναρπαστική εμπειρία.

Οι δυνατότητες του GPT-4o αναπτύσσονται σταδιακά, με τις λειτουργίες κειμένου και εικόνας να είναι ήδη ενσωματωμένες στο ChatGPT. Διαθέσιμο στο δωρεάν επίπεδο και προσφέροντας υψηλότερα όρια μηνυμάτων για τους χρήστες Plus, το GPT-4o στοχεύει στη βελτίωση της προσβασιμότητας.

Οι προγραμματιστές μπορούν να έχουν πρόσβαση στο GPT-4o στο API, απολαμβάνοντας μεγαλύτερες ταχύτητες και αυξημένα όρια τιμών στη μισή τιμή. Η υποστήριξη για δυνατότητες ήχου και βίντεο θα επεκταθεί σύντομα σε επιλεγμένους συνεργάτες API.