Home Software H OpenAI κυκλοφορεί το GPT‑5.2 με προηγμένη χρήση εργαλείων, vision και συλλογισμό...

H OpenAI κυκλοφορεί το GPT‑5.2 με προηγμένη χρήση εργαλείων, vision και συλλογισμό πολλαπλών βημάτων

38
Chat-GPT-5.2

Η OpenAI παρουσίασε την Πέμπτη το GPT-5.2, την πιο ικανή σειρά μοντέλων της εταιρείας για επαγγελματική εργασία γνώσης. Η ενημέρωση έρχεται μετά τη συνεχιζόμενη υιοθέτηση του ChatGPT σε επιχειρήσεις, όπου οι τυπικοί χρήστες αναφέρουν ότι εξοικονομούν 40-60 λεπτά την ημέρα, ενώ οι heavy χρήστες αναφέρουν ότι εξοικονομούν περισσότερες από 10 ώρες την εβδομάδα.

GPT-5.2

Το GPT-5.2 έχει σχεδιαστεί για να επεκτείνει αυτήν την επίδραση στην παραγωγικότητα. Το μοντέλο βελτιώνεται στη δημιουργία υπολογιστικών φύλλων, στη δημιουργία παρουσιάσεων, στη σύνταξη κώδικα, στην ερμηνεία εικόνων, στον χειρισμό μεγάλων εγγράφων, στη χρήση εργαλείων και στη διαχείριση σύνθετων ροών εργασίας πολλαπλών βημάτων. Η έκδοση αναπτύχθηκε σε συνεργασία με την NVIDIA και τη Microsoft, χρησιμοποιώντας κέντρα δεδομένων Azure που υποστηρίζονται από GPU H100, H200 και GB200-NVL72.

GPT-5.2 in ChatGPT

Οι χρήστες θα πρέπει να βιώνουν πιο δομημένη και συνεπή συμπεριφορά και στις τρεις εμπειρίες GPT-5.2:

  • GPT-5.2 Άμεση: Ταχύτερες απαντήσεις με βελτιώσεις στην αναζήτηση πληροφοριών, την τεχνική γραφή, τις μεταφράσεις και την καθοδήγηση βήμα προς βήμα.
  • GPT-5.2 Σκέψη: Σχεδιασμένο για βαθύτερη εργασία που περιλαμβάνει κωδικοποίηση, σύνοψη μακροσκελών εγγράφων, μαθηματικά και λογική, καθώς και εργασίες πολλαπλών σταδίων.
  • GPT-5.2 Pro: Προορίζεται για δύσκολες ερωτήσεις όπου η συλλογιστική υψηλότερης ποιότητας αξίζει μεγαλύτερους χρόνους απόκρισης.

Το GPT-5.2 θέτει νέα, κορυφαία αποτελέσματα σε πολλαπλές αξιολογήσεις, συμπεριλαμβανομένου του GDPval, όπου ξεπερνά τους επαγγελματίες του κλάδου σε σαφώς καθορισμένες εργασίες γνώσης που καλύπτουν 44 επαγγέλματα.

Συνεργάτες όπως οι Notion, Box, Shopify, Harvey και Zoom ανέφεραν ισχυρότερη απόδοση συλλογισμού μακροπρόθεσμου ορίζοντα και κλήσης εργαλείων. Οι Databricks, Hex και Triple Whale σημείωσαν κέρδη στην επιστήμη δεδομένων και την ανάλυση εγγράφων που βασίζονται σε πράκτορες. Οι Cognition, Warp, Charlie Labs, JetBrains και Augment Code παρατήρησαν υψηλότερη απόδοση στον προγραμματισμό πρακτόρων.

Το GPT-5.2 Thinking επιτυγχάνει την υψηλότερη απόδοση της OpenAI μέχρι σήμερα στο GDPval, καθιστώντας το πρώτο μοντέλο της εταιρείας που φτάνει ή ξεπερνά τα επίπεδα των ανθρώπινων εμπειρογνωμόνων. Ισοδυναμεί ή ξεπερνά τους κορυφαίους επαγγελματίες στο 70,9% των συγκρίσεων. Το μοντέλο παρήγαγε αποτελέσματα GDPval περισσότερο από 11 φορές ταχύτερα και με κόστος κάτω του 1% του κόστους των έμπειρων επαγγελματιών, με βάση ιστορικές μετρήσεις.

Ένας αξιολογητής του GDPval περιέγραψε ένα αποτέλεσμα ως «ένα αξιοσημείωτο άλμα στην ποιότητα του αποτελέσματος που έγινε από μια επαγγελματική εταιρεία με προσωπικό», ενώ σημείωσε ότι παρέμειναν μικρά σφάλματα.

Στο εσωτερικό σημείο αναφοράς της OpenAI για εργασίες μοντελοποίησης επενδυτικής τραπεζικής για νέους —όπως η δημιουργία μοντέλων τριών δηλώσεων ή μοντέλων εξαγοράς με μόχλευση— η μέση βαθμολογία του μοντέλου αυξήθηκε από 59,1% σε 68,4%, σημειώνοντας βελτίωση 9,3% σε σχέση με το GPT-5.1.

Το μοντέλο παρουσιάζει ισχυρότερη απόδοση στον εντοπισμό σφαλμάτων, την υλοποίηση λειτουργιών, την ανακατασκευή κώδικα και τις ολοκληρωμένες διορθώσεις. Οι πρώτοι δοκιμαστές ανέφεραν επίσης καλύτερα αποτελέσματα στην ανάπτυξη front-end, συμπεριλαμβανομένων των σύνθετων εργασιών UI και των εργασιών τρισδιάστατης διεπαφής.

Το GPT-5.2 Thinking μειώνει τα ποσοστά ψευδαισθήσεων κατά 30% σε σύγκριση με το GPT-5.1 Thinking, με βάση τα ανωνυμοποιημένα ερωτήματα ChatGPT. Αυτό βελτιώνει την αξιοπιστία για έρευνα, γραφή, ανάλυση και υποστήριξη αποφάσεων.

Το GPT-5.2 Thinking προσφέρει νέα, κορυφαία αποτελέσματα στο MRCRv2, το οποίο έχει σχεδιαστεί για να ελέγχει την ικανότητα ενός μοντέλου να ενσωματώνει πληροφορίες σε μεγάλα έγγραφα.

Επιτυγχάνει σχεδόν τέλεια ακρίβεια στην εργασία 4-needle MRCR με έως και 256.000 διακριτικά, βελτιώνοντας τη συνοχή και την ακρίβεια για ροές εργασίας που περιλαμβάνουν αναφορές, συμβάσεις, ερευνητικές εργασίες, αντίγραφα και έργα πολλαπλών αρχείων.

Το GPT-5.2 βασίζεται στις βελτιώσεις ασφαλείας που εισήχθησαν με το GPT-5, στοχεύοντας σε πιο αξιόπιστες απαντήσεις σε ευαίσθητες συζητήσεις που αφορούν αυτοτραυματισμό, ψυχική δυσφορία και συναισθηματική υπερβολική εξάρτηση από την Τεχνητή Νοημοσύνη. Τόσο το GPT-5.2 Instant όσο και το Thinking παρουσιάζουν λιγότερες ανεπιθύμητες εξόδους από τα μοντέλα GPT-5.1.

Η OpenAI λανσάρει επίσης ένα μοντέλο πρόβλεψης ηλικίας για την αυτόματη εφαρμογή προστασίας περιεχομένου για χρήστες κάτω των 18 ετών, παράλληλα με τα υπάρχοντα συστήματα γονικού ελέγχου. Η εταιρεία σημειώνει ότι συνεχίζονται οι εργασίες σε ζητήματα όπως οι υπερβολικές αρνήσεις, καθώς συνεχίζει να βελτιώνει την ασφάλεια και την αξιοπιστία.

Το GPT-5.2 (Instant, Thinking και Pro) ξεκινά σήμερα την κυκλοφορία του στο ChatGPT για χρήστες Plus, Pro, Go, Business και Enterprise. Η ανάπτυξη θα είναι σταδιακή. Το GPT-5.1 θα παραμείνει διαθέσιμο για τρεις μήνες σε παλαιότερα μοντέλα πριν από την κατάργησή του για τους χρήστες επί πληρωμή.