Το Anthropic Claude‑σύστημα από 16 AI-ανθρώπους δημιούργησε ανεξάρτητα έναν μεταγλωττιστή για τη γλώσσα C.
Στο πλαίσιο του πειράματος η εταιρεία Anthropic συγκέντρωσε ομάδα 16 αυτόνομων AI-αγентов, οι οποίοι μαζί από το μηδέν δημιούργησαν έναν μεταγλωττιστή της γλώσσας C σε Rust. Το αποτέλεσμα είναι μια «καθαρή» υλοποίηση που μπορεί να συντάξει τον πυρήνα Linux 6.19 και να μεταγλωττίσει έργα όπως PostgreSQL, SQLite, Redis, FFmpeg και QEMU, αλλά παραμένει σημαντικά πίσω από το GCC όσον αφορά ποιότητα και αποδοτικότητα.
Πώς έγινε
Βήμα: Προετοιμασία
16 μοντέλα Claude Opus 4.6 εκτελούνται σε ξεχωριστές κοντέινερ Docker χωρίς πρόσβαση στο Διαδίκτυο. Κάθε ένα κλωνοποιεί το κοινό αποθετήριο Git και λαμβάνει εργασίες μέσω lock‑files.
Αυτόνομη σχεδιαστική διαδικασία
Δεν υπάρχει κεντρικός συντονιστής: κάθε agent καθορίζει μόνος του ποιο «φανερό» κομμάτι δουλειάς θα εκτελέσει επόμενα. Σε περίπτωση σύγκρουσης συγχώνευσης ο κώδικας ενσωματώνεται αυτόματα.
Ανάπτυξη
Οι agents ανατίθενται να γράψουν έναν μεταγλωττιστή C από το μηδέν. Η εργασία διήρκε 2 εβδομάδες και απαιτούσε σχεδόν 2000 συνεδρίες Claude Code.
Δοκιμές
Για να μην «επιβαρύνει» το μοντέλο με μεγάλες ερωτήσεις, οι δοκιμές εκτελούνται σε περίληψη (μόνο λίγες γραμμές εξόδου). Για ταχύτερη επεξεργασία προστίθεται γρήγορος τρόπος για 1–10 % των δοκιμών.
Τελικό προϊόν
* Όγκος – περίπου 100 000 γραμμές κώδικα Rust.
* Λειτουργικότητα – μπορεί να συντάξει τον πυρήνα Linux 6.19 σε x86, ARM και RISC‑V· μεταγλωττίζει PostgreSQL, SQLite, Redis, FFmpeg, QEMU· περάτει ~99 % των δοκιμών GCC.
* Περιορισμοί – δεν παράγει 16‑bit μηχανικό κώδικα (για εκτέλεση Linux απαιτείται GCC), ο assembler και ο linker λειτουργούν με σφάλματα, και η απόδοση του κώδικα είναι χαμηλότερη από το GCC. Η ποιότητα του αρχικού Rust κώδικα αφήνει να ζητηθεί καλύτερα σε σύγκριση με την εργασία ενός έμπειρου προγραμματιστή.
Τι κόστισε ο πείραμα
Δείκτης: Κόστος
Tokens Claude API ~\$20 000
Πρόσθετο κόστος (εκπαίδευση μοντέλου, διοργάνωση έργου, δοκιμές) δεν περιλαμβάνεται στο αναφερόμενο ποσό
Μαθήματα και συμπεράσματα
1. Όριο αυτονομίας – καθώς ο κώδικας μεγαλώνει σε ~100 000 γραμμές, οι agents σταματούν να καταλαβαίνουν πλήρως το έργο· αυτό φαίνεται να είναι η ανώτατη όρια για ανεξάρτητο AI.
2. Ανάγκη υποστήριξης – προσπάθειες επέκτασης της λειτουργικότητας συχνά σπάζουν ήδη υπάρχοντα τμήματα κώδικα.
3. Σημασία του περιβάλλοντος ανάπτυξης – η απομόνωση από το Διαδίκτυο και η σωστή ρύθμιση των δοκιμών ήταν κρίσιμες για τη σταθερή λειτουργία των agents.
Συμπέρασμα
Το πείραμα δείχνει ότι οι σύγχρονες AI‑μοντέλα μπορούν να δημιουργήσουν σύνθετα λογισμικά με ελάχιστο έλεγχο. Ωστόσο, δεν έχουν ακόμη την ικανότητα να αντικαταστήσουν πλήρως τους έμπειρους προγραμματιστές: η ποιότητα του κώδικα, η απόδοση και η αξιοπιστία παραμένουν χαμηλότερες από τις παραδοσιακές μεταγλωττίσεις, και το μέγεθος του έργου περιορίζεται σε εκατοντάδες χιλιάδες γραμμές. Είναι ένα σημαντικό βήμα εμπρός, αλλά ακόμη μακριά από πλήρη αυτόνομη ανάπτυξη λογισμικού.
Σχόλια (0)
Μοιραστείτε τη γνώμη σας — παρακαλώ να είστε ευγενικοί και εντός θέματος.
Συνδεθείτε για να σχολιάσετε