Η Alibaba ξεκινά τις συμπαγείς μοντέλα Qwen 3.5, που λειτουργούν απευθείας σε φορητές συσκευές και υπερβαίνουν τα αντίστοιχα της OpenAI.

Η Alibaba ξεκινά τις συμπαγείς μοντέλα Qwen 3.5, που λειτουργούν απευθείας σε φορητές συσκευές και υπερβαίνουν τα αντίστοιχα της OpenAI.

11 hardware

Alibaba Qwen 3.5 — νέα σειρά συμπαγών μοντέλων ΤΝ

Στο πλαίσιο της ενότητας τεχνητής νοημοσύνης, η Alibaba ανακοίνωσε την κυκλοφορία μιας σειράς μοντέλων Qwen 3.5 που υπόσχονται «μικρό μέγεθος + υψηλή αποδοτικότητα». Σε σύγκριση με τα αμερικανικά αντίστοιχα, δείχνουν καλύτερη ακρίβεια με μικρότερο όγκο μνήμης.

Μοντέλο Μέγεθος Κύρια χαρακτηριστικά
Qwen 3.5‑0.8B 0,8 mld παραμέτρων «μικροσκοπικό» και «γρήγορο», προορισμένο για πρωτότυπα και κινητές συσκευές με περιορισμένη αυτονομία
Qwen 3.5‑2B 2 mld Παρόμοιο με το 0.8B, αλλά ελαφρώς ισχυρότερο
Qwen 3.5‑4B 4 mld Πολυμορφικό, παράθυρο συμφραζομένων 262 144 tokens· κατάλληλο για ελαφριά λύση πρακτορείου
Qwen 3.5‑9B 9 mld Ικανό να συλλογίζεται, ξεπερνά το OpenAI gpt‑oss‑120B (13,5× περισσότερες παραμέτρους) και επιδεικνύει επίπεδο μεταπτυχιακής λογικής σκέψης

Όλα τα μοντέλα είναι διαθέσιμα υπό την άδεια Apache 2.0, επιτρέποντας τη χρήση τους σε εμπορικά έργα και την περαιτέρω εκπαίδευση αν χρειαστεί.

Τι νέο υπάρχει στην αρχιτεκτονική;
Η Alibaba απέφυγε τα κλασικά Transformer‑s και εφαρμόζει ένα υβριδικό σχήμα:

* Gated Delta Networks (GDN) – εξασφαλίζουν υψηλή διαύγεια και χαμηλό καθυστέρηση.
* Mixture‑of‑Experts (MoE) – αντιμετωπίζουν το πρόβλημα περιορισμένης μνήμης, χαρακτηριστικό των μικρών μοντέλων.

Χάρη σε αυτό το Qwen 3.5 μπορεί να δουλεύει με πολυμορφικά tokens αμέσως, αντί να «συνδέει» γεννήτριες εικόνων στα κείμενα όπως έκαναν οι προηγούμενες γενιές. Ως αποτέλεσμα, οι εκδόσεις 4B και 9B μπορούν να αναγνωρίζουν στοιχεία UI και να μετρούν αντικείμενα σε βίντεο.

Δοκιμές και αποτελέσματα
Benchmark Qwen 3.5‑9B
Σύγκριση MMMU‑Pro (οπτικό) 70,1 % – ξεπεράσει το Google Gemini 2.5 Flash‑Lite (59,7) και το εξειδικευμένο Qwen 3‑VL‑30B‑A3B (63,0)
Λογική σκέψη 81,7 % – περισσότερο από το OpenAI gpt‑oss‑120B (80,1), αν και το τελευταίο έχει 10× περισσότερες παραμέτρους
HMMT Feb 2025 (μαθηματικά) 83,2 % (9B), 74,0 % (4B) – αποδείχθηκε ότι για σύνθετες επιστημονικές εργασίες δεν χρειάζονται τεράστιες νέφους πόροι
OmniDocBench v1.58 7,7 % – η κορυφαία από όλα τα μοντέλα
MMMLU (πολυγλωσσικότητα) 81,2 % – ξεπεράσει το gpt‑oss‑120B (78,2 %)

Γιατί είναι σημαντικό;
Η εμφάνιση του Qwen 3.5 συνέβη με την αύξηση της ζήτησης για αυτόνομα ΤΝ-πρακτορεία. Ο σύγχρονος χρήστης απαιτεί όχι μόνο chat‑bots αλλά και συστήματα που:

1. Σκέφτονται – συλλογίζονται πάνω σε προβλήματα.
2. Βλέπουν – επεξεργάζονται εικόνες, βίντεο και στοιχεία UI.
3. Δράσουν – μπορούν να χρησιμοποιούν εργαλεία (συμπλήρωση φορμών, ταξινόμηση αρχείων).

Λαμβάνοντας υπόψη ότι τα μεγάλα μοντέλα (τριπλά-πεντάπλασιασμα) κοστίζουν πολλά στην λειτουργία, το Qwen 3.5 είναι μια πιο οικονομική λύση. Τα μοντέλα μπορούν να τρέξουν τοπικά χωρίς σύνδεση στο cloud και API, ενώ η εκπαίδευση με ενίσχυση επιτρέπει την «ανθρώπινη απόφαση» – π.χ., οργάνωση της επιφάνειας εργασίας ή ανάπτυξη κώδικα από βίντεο‑εγγραφή.

Πρακτική εφαρμογή
* Κινητές συσκευές – 0,8 mld παραμέτρων χωρά εύκολα σε smartphone και εξασφαλίζουν αυτονομία.
* Εργασιακές σταθμοί – 9 mld παραμέτρων παρέχουν πλήρη σύνολο λειτουργιών πρακτορείου χωρίς cloud.
* Πρακτορεία διεπαφής – χάρη στη «δεσμεύση στο επίπεδο pixel» τα μοντέλα μπορούν να πλέουν το UI, να συμπληρώνουν φόρμες και να ταξινομούν αρχεία, εκτελώντας απλές εντολές σε φυσική γλώσσα με ακρίβεια περίπου 90 %.

Έτσι, η Alibaba Qwen 3.5 ανοίγει τον δρόμο για πιο προσιτά, ευέλικτα και ισχυρά ΤΝ-πρακτορεία που μπορούν να λειτουργούν τόσο στο cloud όσο και τοπικά, καλύπτοντας τις αυξανόμενες απαιτήσεις του σύγχρονου χρήστη.

Σχόλια (0)

Μοιραστείτε τη γνώμη σας — παρακαλώ να είστε ευγενικοί και εντός θέματος.

Δεν υπάρχουν ακόμη σχόλια. Αφήστε ένα σχόλιο και μοιραστείτε τη γνώμη σας!

Για να αφήσετε σχόλιο, παρακαλώ συνδεθείτε.

Συνδεθείτε για να σχολιάσετε