Home Microsoft Η Microsoft προσθέτει το DeepSeek R1 στο Azure AI Foundry και στο...

Η Microsoft προσθέτει το DeepSeek R1 στο Azure AI Foundry και στο GitHub

24
Azure AI Foundry

Η Microsoft παρουσίασε την Τετάρτη το DeepSeek R1 στον εκτεταμένο κατάλογο μοντέλων της στο Azure AI Foundry και στο GitHub, προσθέτοντας σε μια συλλογή που ξεπερνά πλέον τα 1.800 μοντέλα. Αυτά τα μοντέλα εκτείνονται από τα σύνορα και ανοιχτού κώδικα έως τις λύσεις τεχνητής νοημοσύνης που σχετίζονται με τη βιομηχανία και βασίζονται σε εργασίες.

Προσβασιμότητα και δυνατότητες DeepSeek R1

Το DeepSeek R1 είναι πλέον προσβάσιμο μέσω του Azure AI Foundry, παρέχοντας μια αξιόπιστη, επεκτάσιμη και έτοιμη για επιχειρήσεις πλατφόρμα. Αυτή η ρύθμιση επιτρέπει στις επιχειρήσεις να ενσωματώνουν απρόσκοπτα προηγμένες λύσεις τεχνητής νοημοσύνης, τηρώντας παράλληλα τις συμφωνίες επιπέδου υπηρεσιών (SLA), τα πρότυπα ασφαλείας και τις υπεύθυνες πρακτικές τεχνητής νοημοσύνης, όλα που υποστηρίζονται από τη δέσμευση της Microsoft για αξιοπιστία και καινοτομία.

Επιτάχυνση συλλογισμού AI

Η Asha Sharma, Εταιρική Αντιπρόεδρος της Πλατφόρμας AI στη Microsoft, τόνισε τη ραγδαία αύξηση της προσβασιμότητας του συλλογισμού της τεχνητής νοημοσύνης, η οποία αλλάζει τον τρόπο με τον οποίο οι προγραμματιστές και οι επιχειρήσεις χρησιμοποιούν την προηγμένη τεχνητή νοημοσύνη.

Τόνισε ότι το DeepSeek R1 προσφέρει ένα οικονομικά αποδοτικό μοντέλο στους χρήστες για να αξιοποιήσουν τις δυνατότητες τεχνητής νοημοσύνης αιχμής με ελάχιστες επενδύσεις σε υποδομές.

Εργαλεία προγραμματιστών και ταχύτητα

Η ενσωμάτωση του DeepSeek R1 στο Azure AI Foundry επιταχύνει τις διαδικασίες πειραματισμού, επανάληψης και ενσωμάτωσης για τους προγραμματιστές. Με εργαλεία αξιολόγησης μοντέλων, οι προγραμματιστές μπορούν να συγκρίνουν τα αποτελέσματα, την απόδοση συγκριτικής αξιολόγησης και να κλιμακώσουν τις εφαρμογές τεχνητής νοημοσύνης γρήγορα.

Δέσμευση για αξιόπιστη ανάπτυξη AI

Η Sharma υπογράμμισε την αφοσίωση της Microsoft στην ασφάλεια και την ασφάλεια, σημειώνοντας ότι το DeepSeek R1 έχει υποβληθεί σε αυστηρούς ελέγχους κόκκινης ομάδας και ασφάλειας. Το Azure AI Content Safety παρέχει προεπιλεγμένο φιλτράρισμα περιεχομένου με επιλογές εξαίρεσης και το Σύστημα Αξιολόγησης Ασφάλειας βοηθά στη δοκιμή εφαρμογών πριν βγουν ζωντανά, διασφαλίζοντας ένα ασφαλές περιβάλλον ανάπτυξης.

Πρόσβαση στο DeepSeek R1

Για να χρησιμοποιήσετε το DeepSeek R1:

  • Εγγραφείτε για έναν λογαριασμό Azure εάν δεν έχετε.
  • Αναζητήστε το DeepSeek R1 στον κατάλογο μοντέλων Azure AI Foundry.
  • Ανοίξτε την κάρτα μοντέλου και κάντε κλικ στο “deploy” για να αποκτήσετε το API και το κλειδί συμπερασμάτων και να αποκτήσετε πρόσβαση στο playground.
  • Χρησιμοποιήστε το API και το κλειδί με διάφορους πελάτες για την ενοποίηση εφαρμογών.

Τοπική ανάπτυξη σε υπολογιστές Copilot+

Η Microsoft φέρνει επίσης τις βελτιστοποιημένες για NPU εκδόσεις του DeepSeek R1 σε υπολογιστές Copilot+, ξεκινώντας από το Qualcomm Snapdragon X, ακολουθούμενο από τον Intel Core Ultra 200V.

Η αρχική έκδοση, DeepSeek-R1-Distill-Qwen-1.5B, θα είναι διαθέσιμη στο AI Toolkit, με τις παραλλαγές 7B και 14B να ακολουθήσουν. Αυτά τα μοντέλα επιτρέπουν στους προγραμματιστές να δημιουργούν και να αναπτύσσουν εφαρμογές που τροφοδοτούνται με AI που εκτελούνται αποτελεσματικά στη συσκευή, χρησιμοποιώντας τις ισχυρές Μονάδες Νευρωνικής Επεξεργασίας (NPU).

Το NPU σε υπολογιστές Copilot+ υποστηρίζει αποτελεσματική εξαγωγή συμπερασμάτων μοντέλων, επιτρέποντας την ημισυνεχή εκτέλεση της γενετικής τεχνητής νοημοσύνης. Οι προσπάθειες της Microsoft με το Phi Silica οδήγησαν σε ανταγωνιστικούς ρυθμούς χρόνου και απόδοσης, ελαχιστοποιώντας ταυτόχρονα τον αντίκτυπο στη διάρκεια ζωής της μπαταρίας και στους πόρους του υπολογιστή.

Τα βελτιστοποιημένα μοντέλα DeepSeek για NPU χρησιμοποιούν τεχνικές όπως η κβαντοποίηση χαμηλού bit και η αντιστοίχιση μετασχηματιστή στο NPU, διασφαλίζοντας τη συμβατότητα σε όλο το οικοσύστημα των Windows μέσω της μορφής ONNX QDQ.

Βελτιστοποιήσεις πυριτίου

Το αποσταγμένο μοντέλο Qwen 1.5B περιλαμβάνει εξαρτήματα όπως ένα tokenizer, ένα επίπεδο ενσωμάτωσης, το μοντέλο επεξεργασίας περιβάλλοντος, το μοντέλο επανάληψης διακριτικών, την κεφαλή του μοντέλου γλώσσας και τον detokenizer.

Η Microsoft χρησιμοποιεί κβαντισμό κατά μπλοκ 4-bit για τις ενσωματώσεις και την κεφαλή του μοντέλου γλώσσας, με αυτές τις λειτουργίες να εκτελούνται στη CPU. Η βελτιστοποίηση NPU εστιάζει στα μπλοκ μετασχηματιστών υψηλής έντασης υπολογισμού, χρησιμοποιώντας κβαντισμό int4 ανά κανάλι και επιλεκτική μικτή ακρίβεια για βάρη με ενεργοποιήσεις int16.

Η Microsoft αξιοποιεί τη σχεδίαση συρόμενου παραθύρου για γρήγορη υποστήριξη από το χρόνο έως το πρώτο και με μεγάλο πλαίσιο. Το σχήμα κβαντοποίησης 4-bit QuaRot ενισχύει την ακρίβεια εξαλείφοντας τα ακραία βάρη και τις ενεργοποιήσεις. Αυτές οι βελτιστοποιήσεις επιτυγχάνουν ένα διακριτικό time-to-first 130 ms και ρυθμό διεκπεραίωσης 16 tokens/s για σύντομα μηνύματα (<64 tokens).

Διαθεσιμότητα

Το DeepSeek R1 είναι πλέον διαθέσιμο μέσω ενός τερματικού σημείου χωρίς διακομιστή στον κατάλογο μοντέλων Azure AI Foundry. Περισσότεροι πόροι και οδηγοί βήμα προς βήμα είναι διαθέσιμοι στο GitHub. Οι αποσταγμένες εκδόσεις του DeepSeek R1 για τοπική ανάπτυξη σε υπολογιστές Copilot+ θα είναι σύντομα διαθέσιμες.