Η Nvidia παρουσίασε το Nemotron 3 Super 120B—ανοιχτό LLM με πεντάπλασιασμα της ταχύτητας για AI-άγγελους.

Νέα μοντέλο από την Nvidia – Nemotron 3 Super

Η Nvidia ανακοίνωσε την κυκλοφορία του Nemotron 3 Super, ενός ανοικτού μοντέλου AI τύπου Mixture‑of‑Experts (MoE).

* 120 δισεκατομμύρια συνολικά παραμέτρους, από τις οποίες 12 δισεκατομμύρια είναι ενεργές.
* Σχεδιάστηκε για agent-based AI – συστήματα όπου πολλοί «agents» αλληλεπιδρούν μεταξύ τους και με τον εξωτερικό κόσμο.

Αρχιτεκτονική
Το μοντέλο χρησιμοποιεί μια υβριδική προσέγγιση Mamba‑Transformer (συνδυασμός στρωμάτων Mamba και στοιχείων Transformer).

Στο Nemotron 3 Super εφαρμόζεται για πρώτη φορά η παραδοχή LatentMoE, τα στρώματα Multi‑Token Prediction και προεκπαίδευση με πρωτόκολλο NVFP4. Σύμφωνα με την Nvidia, αυτός ο stack αυξάνει τη ακρίβεια και επιταχύνει το inference.

Απόδοση
* Ταχύτητα – έως 5× πιο γρήγορη από την προηγούμενη έκδοση Nemotron Super.
* Ακρίβεια – έως 2× υψηλότερη.
* Υποστήριξη παραθύρου συμφραζομένων με 1 εκτ. tokens επιτρέπει στους agents να αποθηκεύουν ολόκληρο το στάδιο εργασίας, μειώνοντας τον κίνδυνο απόκλισης από τους στόχους.

Πρακτική εφαρμογή
Το Nemotron 3 Super είναι κατάλληλο για σύνθετες εργασίες σε πολυ-agent συστήματα:

Παράδειγμα Εφαρμογής	Χρήση
Δημιουργία και αποσφαλμάτωση κώδικα χωρίς διαίρεση σε έγγραφα	Αυτόματη συγγραφή και επαλήθευση μεγάλων προγραμμάτων
Οικονομική ανάλυση	Ενσωμάτωση χιλιάδων σελίδων αναφορών στη μνήμη του μοντέλου

Εκπαίδευση
Το μοντέλο εκπαιδεύτηκε με συνθετικά δεδομένα, δημιουργημένα μέσω λογικών μοντέλων σκέψης. Η Nvidia αποκαλύπτει την πλήρη μεθοδολογία:

* πάνω από 10 τρισεκατομμύρια tokens πριν και μετά την εκπαίδευση;
* 15 περιβάλλοντα για reinforcement learning;
* συνταγές αξιολόγησης.

Οι ερευνητές μπορούν να χρησιμοποιήσουν την πλατφόρμα Nvidia NeMo για περαιτέρω προσαρμογή ή δημιουργία των δικών τους εκδόσεων μοντέλου.

Τεχνικές λεπτομέρειες
* Υποστήριξη NVFP4 στην αρχιτεκτονική Nvidia Blackwell.
* Μείωση απαιτήσεων μνήμης και επιτάχυνση εξόδου τέσσερα φορές σε σύγκριση με FP8 στο Nvidia Hopper χωρίς απώλεια ακρίβειας.

Διαθεσιμότητα
Το μοντέλο είναι ήδη διαθέσιμο:

* Από build.nvidia.com, Hugging Face, OpenRouter και Perplexity.
* Μέσω cloud συνεργατών: Google Cloud Vertex AI, Oracle Cloud Infrastructure, CoreWeave, Together AI, Baseten, Cloudflare, DeepInfra, Fireworks AI, Modal.
* Ως microservice Nvidia NIM, επιτρέποντας την τοπική ή cloud εγκατάσταση.

Το Nemotron 3 Super ανοίγει νέες δυνατότητες για agent-based AI, συνδυάζοντας υψηλή ακρίβεια, κλιμάκωση και ευελιξία προσαρμογής.

Η Nvidia παρουσίασε το Nemotron 3 Super 120B—ανοιχτό LLM με πεντάπλασιασμα της ταχύτητας για AI-άγγελους.

Related news

Η εταιρεία της Καλιφόρνιας δημιούργησε ένα κεφαλαίο κράνος που επιτρέπει την ανάγνωση σκέψεων χωρίς βλάβες στον εγκέφαλο

Οι μηχανικοί δημιούργησαν μια συσκευή που επιτρέπει την τοποθέτηση ηλεκτρονικών εξαρτημάτων σε ζωντανούς ιστούς και ιατρικά εμφυτεύματα χωρίς βλάβες

Οι αστρονόμοι μπορούν πλέον να ανακατασκευάσουν την ιστορία της γαλαξίας, βασιζόμενοι μόνο σε μία φωτογραφία

Η Apple ξανά νίκησε τη Masimo στη μάχη για την ακρίβεια μέτρησης του επιπέδου οξυγόνου στο αίμα

Σχόλια (0)

Συνδεθείτε για να σχολιάσετε

Η Nvidia παρουσίασε το Nemotron 3 Super 120B—ανοιχτό LLM με πεντάπλασιασμα της ταχύτητας για AI-άγγελους.

Related news

Η εταιρεία της Καλιφόρνιας δημιούργησε ένα κεφαλαίο κράνος που επιτρέπει την ανάγνωση σκέψεων χωρίς βλάβες στον εγκέφαλο

Οι μηχανικοί δημιούργησαν μια συσκευή που επιτρέπει την τοποθέτηση ηλεκτρονικών εξαρτημάτων σε ζωντανούς ιστούς και ιατρικά εμφυτεύματα χωρίς βλάβες

Οι αστρονόμοι μπορούν πλέον να ανακατασκευάσουν την ιστορία της γαλαξίας, βασιζόμενοι μόνο σε μία φωτογραφία

Η Apple ξανά νίκησε τη Masimo στη μάχη για την ακρίβεια μέτρησης του επιπέδου οξυγόνου στο αίμα

Συνδεθείτε για να σχολιάσετε

Η Nvidia παρουσίασε το Nemotron 3 Super 120B—ανοιχτό LLM με πεντάπλασιασμα της ταχύτητας για AI-άγγελους.