Η OpenAI λάνσαρε το πιο προηγμένο σύστημά της μέχρι σήμερα το ChatGPT Agent που μπορεί να σχεδιάζει, να συλλογίζεται και να εκτελεί εργασίες πολλαπλών βημάτων σε ολόκληρο τον ιστό και εφαρμογές χρησιμοποιώντας ενσωματωμένα εργαλεία. Ο παράγοντας εισάγει ένα νέο επίπεδο αυτοματισμού τεχνητής νοημοσύνης με λειτουργίες όπως περιήγηση, πρόσβαση σε τερματικό, επεξεργασία αρχείων και ενσωμάτωση API — όλα εκτελούνται με ασφάλεια μέσω ενός εικονικού υπολογιστή.
Τι είναι το ChatGPT Agent?
Αυτό το σύστημα ασίζεται στα υπάρχοντα εργαλεία του ChatGPT, επιτρέποντας στην Τεχνητή Νοημοσύνη να σκέφτεται, να αποφασίζει και να ενεργεί ανεξάρτητα. Χρησιμοποιεί μια εικονική μηχανή σε περιβάλλον δοκιμών (sandboxed) για την ασφαλή ολοκλήρωση εργασιών, εναλλάσσοντας εργαλεία όπως ένα πρόγραμμα περιήγησης ιστού, έναν διερμηνέα κώδικα Python, ένα τερματικό και ένα σύστημα αρχείων.
Το σύστημα έχει σχεδιαστεί για να αυτοματοποιεί τις ροές εργασίας σε όλη την εργασία, την έρευνα και την παραγωγικότητα, διατηρώντας παράλληλα τους χρήστες τον έλεγχο σε κάθε βήμα. Η OpenAI ανέφερε ότι το ChatGPT Agent δεν ανταποκρίνεται απλώς σε προτροπές — μπορεί να αναλύσει πολύπλοκες οδηγίες, να σχεδιάσει τα απαραίτητα βήματα, να εκτελέσει κάθε μέρος αυτόνομα και να ειδοποιήσει τους χρήστες όταν ολοκληρωθεί.
Σύμφωνα με την OpenAI, ο παράγοντας ChatGPT έχει σχεδιαστεί για πραγματικές περιπτώσεις χρήσης και σενάρια παραγωγικότητας. Οι βασικές δυνατότητες περιλαμβάνουν:
- Σχεδιασμός και Εκτέλεση Εργασιών – Διαχωρίζει σύνθετες οδηγίες σε βήματα, τις εκτελεί μία προς μία και προσαρμόζεται με βάση τα αποτελέσματα.
- Ενσωμάτωση Εργαλείων – Εναλλαγή μεταξύ προγράμματος περιήγησης, τερματικού, διερμηνέα κώδικα και εργαλείων αρχείων κατά την εκτέλεση.
- Περιήγηση στο Web με Ενέργειες – Αναζητά στον ιστό, συνδέεται σε ιστότοπους (με έγκριση), κατεβάζει αρχεία και εξάγει ή συνοψίζει πληροφορίες.
- API και Πρόσβαση σε Εφαρμογές – Αλληλεπιδρά με υπηρεσίες όπως το Gmail, το Google Calendar, το Notion και το GitHub για την αυτοματοποίηση εργασιών.
- Αναφορές Πολλαπλών Βημάτων – Μπορεί να δημιουργήσει τράπουλες διαφανειών, να συμπληρώσει υπολογιστικά φύλλα, να αναλύσει CSV και να δημιουργήσει αναφορές από άκρο σε άκρο.
- Επεξεργασία Αρχείων & Χρήση Τερματικού – Περιηγείται σε καταλόγους, διαβάζει αρχεία, γράφει σενάρια, εκτελεί εντολές και επεξεργάζεται έγγραφα.
Η OpenAI τόνισε ότι η ασφάλεια είναι ενσωματωμένη σε κάθε επίπεδο λειτουργίας του πράκτορα. Οι βασικές δικλείδες ασφαλείας περιλαμβάνουν:
- Απαιτείται έλεγχος από τον χρήστη για όλες τις μη αναστρέψιμες ενέργειες (π.χ. υποβολή φορμών, πραγματοποίηση αγορών).
- Το εικονικό sandbox περιήγησης αποτρέπει την άμεση πρόσβαση σε κωδικούς πρόσβασης, τραπεζικές πληροφορίες ή ευαίσθητα διαπιστευτήρια.
- Έλεγχος περιόδου λειτουργίας – οι χρήστες μπορούν να προβάλουν, να διακόψουν προσωρινά ή να ακυρώσουν τη δραστηριότητα του εκπροσώπου ανά πάσα στιγμή.
- Ενσωματωμένη αντίσταση στην κακή χρήση σε ευαίσθητους τομείς όπως η χημεία, η βιολογία ή η κυβερνοασφάλεια.
- Δυνατότητα ελέγχου – διατίθεται πλήρες ιστορικό εργασιών για διαφάνεια.
Η OpenAI δήλωσε ότι οι χρήστες διατηρούν τον πλήρη έλεγχο καθ ‘όλη τη διάρκεια κάθε συνεδρίας και μπορούν να απενεργοποιήσουν την πρόσβαση των πρακτόρων ανά πάσα στιγμή. Οι χρήστες μπορούν να διαχειρίζονται το ChatGPT Agent μέσω των ρυθμίσεων και να ειδοποιούνται όταν είναι ενεργός ή έχει ολοκληρώσει μια εργασία.









