Η Nvidia παρουσίασε το Nemotron 3 Super 120B—ανοιχτό LLM με πεντάπλασιασμα της ταχύτητας για AI-άγγελους.

Η Nvidia παρουσίασε το Nemotron 3 Super 120B—ανοιχτό LLM με πεντάπλασιασμα της ταχύτητας για AI-άγγελους.

7 hardware

Νέα μοντέλο από την Nvidia – Nemotron 3 Super

Η Nvidia ανακοίνωσε την κυκλοφορία του Nemotron 3 Super, ενός ανοικτού μοντέλου AI τύπου Mixture‑of‑Experts (MoE).

* 120 δισεκατομμύρια συνολικά παραμέτρους, από τις οποίες 12 δισεκατομμύρια είναι ενεργές.
* Σχεδιάστηκε για agent-based AI – συστήματα όπου πολλοί «agents» αλληλεπιδρούν μεταξύ τους και με τον εξωτερικό κόσμο.

Αρχιτεκτονική
Το μοντέλο χρησιμοποιεί μια υβριδική προσέγγιση Mamba‑Transformer (συνδυασμός στρωμάτων Mamba και στοιχείων Transformer).

Στο Nemotron 3 Super εφαρμόζεται για πρώτη φορά η παραδοχή LatentMoE, τα στρώματα Multi‑Token Prediction και προεκπαίδευση με πρωτόκολλο NVFP4. Σύμφωνα με την Nvidia, αυτός ο stack αυξάνει τη ακρίβεια και επιταχύνει το inference.

Απόδοση
* Ταχύτητα – έως 5× πιο γρήγορη από την προηγούμενη έκδοση Nemotron Super.
* Ακρίβεια – έως 2× υψηλότερη.
* Υποστήριξη παραθύρου συμφραζομένων με 1 εκτ. tokens επιτρέπει στους agents να αποθηκεύουν ολόκληρο το στάδιο εργασίας, μειώνοντας τον κίνδυνο απόκλισης από τους στόχους.

Πρακτική εφαρμογή
Το Nemotron 3 Super είναι κατάλληλο για σύνθετες εργασίες σε πολυ-agent συστήματα:

Παράδειγμα ΕφαρμογήςΧρήση
Δημιουργία και αποσφαλμάτωση κώδικα χωρίς διαίρεση σε έγγραφαΑυτόματη συγγραφή και επαλήθευση μεγάλων προγραμμάτων
Οικονομική ανάλυσηΕνσωμάτωση χιλιάδων σελίδων αναφορών στη μνήμη του μοντέλου

Εκπαίδευση
Το μοντέλο εκπαιδεύτηκε με συνθετικά δεδομένα, δημιουργημένα μέσω λογικών μοντέλων σκέψης. Η Nvidia αποκαλύπτει την πλήρη μεθοδολογία:

* πάνω από 10 τρισεκατομμύρια tokens πριν και μετά την εκπαίδευση;
* 15 περιβάλλοντα για reinforcement learning;
* συνταγές αξιολόγησης.

Οι ερευνητές μπορούν να χρησιμοποιήσουν την πλατφόρμα Nvidia NeMo για περαιτέρω προσαρμογή ή δημιουργία των δικών τους εκδόσεων μοντέλου.

Τεχνικές λεπτομέρειες
* Υποστήριξη NVFP4 στην αρχιτεκτονική Nvidia Blackwell.
* Μείωση απαιτήσεων μνήμης και επιτάχυνση εξόδου τέσσερα φορές σε σύγκριση με FP8 στο Nvidia Hopper χωρίς απώλεια ακρίβειας.

Διαθεσιμότητα
Το μοντέλο είναι ήδη διαθέσιμο:

* Από build.nvidia.com, Hugging Face, OpenRouter και Perplexity.
* Μέσω cloud συνεργατών: Google Cloud Vertex AI, Oracle Cloud Infrastructure, CoreWeave, Together AI, Baseten, Cloudflare, DeepInfra, Fireworks AI, Modal.
* Ως microservice Nvidia NIM, επιτρέποντας την τοπική ή cloud εγκατάσταση.

Το Nemotron 3 Super ανοίγει νέες δυνατότητες για agent-based AI, συνδυάζοντας υψηλή ακρίβεια, κλιμάκωση και ευελιξία προσαρμογής.

Σχόλια (0)

Μοιραστείτε τη γνώμη σας — παρακαλώ να είστε ευγενικοί και εντός θέματος.

Δεν υπάρχουν ακόμη σχόλια. Αφήστε ένα σχόλιο και μοιραστείτε τη γνώμη σας!

Για να αφήσετε σχόλιο, παρακαλώ συνδεθείτε.

Συνδεθείτε για να σχολιάσετε