Η Nvidia παρουσίασε το Nemotron 3 Super 120B—ανοιχτό LLM με πεντάπλασιασμα της ταχύτητας για AI-άγγελους.
Νέα μοντέλο από την Nvidia – Nemotron 3 Super
Η Nvidia ανακοίνωσε την κυκλοφορία του Nemotron 3 Super, ενός ανοικτού μοντέλου AI τύπου Mixture‑of‑Experts (MoE).
* 120 δισεκατομμύρια συνολικά παραμέτρους, από τις οποίες 12 δισεκατομμύρια είναι ενεργές.
* Σχεδιάστηκε για agent-based AI – συστήματα όπου πολλοί «agents» αλληλεπιδρούν μεταξύ τους και με τον εξωτερικό κόσμο.
Αρχιτεκτονική
Το μοντέλο χρησιμοποιεί μια υβριδική προσέγγιση Mamba‑Transformer (συνδυασμός στρωμάτων Mamba και στοιχείων Transformer).
Στο Nemotron 3 Super εφαρμόζεται για πρώτη φορά η παραδοχή LatentMoE, τα στρώματα Multi‑Token Prediction και προεκπαίδευση με πρωτόκολλο NVFP4. Σύμφωνα με την Nvidia, αυτός ο stack αυξάνει τη ακρίβεια και επιταχύνει το inference.
Απόδοση
* Ταχύτητα – έως 5× πιο γρήγορη από την προηγούμενη έκδοση Nemotron Super.
* Ακρίβεια – έως 2× υψηλότερη.
* Υποστήριξη παραθύρου συμφραζομένων με 1 εκτ. tokens επιτρέπει στους agents να αποθηκεύουν ολόκληρο το στάδιο εργασίας, μειώνοντας τον κίνδυνο απόκλισης από τους στόχους.
Πρακτική εφαρμογή
Το Nemotron 3 Super είναι κατάλληλο για σύνθετες εργασίες σε πολυ-agent συστήματα:
| Παράδειγμα Εφαρμογής | Χρήση |
|---|---|
| Δημιουργία και αποσφαλμάτωση κώδικα χωρίς διαίρεση σε έγγραφα | Αυτόματη συγγραφή και επαλήθευση μεγάλων προγραμμάτων |
| Οικονομική ανάλυση | Ενσωμάτωση χιλιάδων σελίδων αναφορών στη μνήμη του μοντέλου |
Εκπαίδευση
Το μοντέλο εκπαιδεύτηκε με συνθετικά δεδομένα, δημιουργημένα μέσω λογικών μοντέλων σκέψης. Η Nvidia αποκαλύπτει την πλήρη μεθοδολογία:
* πάνω από 10 τρισεκατομμύρια tokens πριν και μετά την εκπαίδευση;
* 15 περιβάλλοντα για reinforcement learning;
* συνταγές αξιολόγησης.
Οι ερευνητές μπορούν να χρησιμοποιήσουν την πλατφόρμα Nvidia NeMo για περαιτέρω προσαρμογή ή δημιουργία των δικών τους εκδόσεων μοντέλου.
Τεχνικές λεπτομέρειες
* Υποστήριξη NVFP4 στην αρχιτεκτονική Nvidia Blackwell.
* Μείωση απαιτήσεων μνήμης και επιτάχυνση εξόδου τέσσερα φορές σε σύγκριση με FP8 στο Nvidia Hopper χωρίς απώλεια ακρίβειας.
Διαθεσιμότητα
Το μοντέλο είναι ήδη διαθέσιμο:
* Από build.nvidia.com, Hugging Face, OpenRouter και Perplexity.
* Μέσω cloud συνεργατών: Google Cloud Vertex AI, Oracle Cloud Infrastructure, CoreWeave, Together AI, Baseten, Cloudflare, DeepInfra, Fireworks AI, Modal.
* Ως microservice Nvidia NIM, επιτρέποντας την τοπική ή cloud εγκατάσταση.
Το Nemotron 3 Super ανοίγει νέες δυνατότητες για agent-based AI, συνδυάζοντας υψηλή ακρίβεια, κλιμάκωση και ευελιξία προσαρμογής.
Σχόλια (0)
Μοιραστείτε τη γνώμη σας — παρακαλώ να είστε ευγενικοί και εντός θέματος.
Συνδεθείτε για να σχολιάσετε