Η Google ξεκίνησε το Gemini 3 Deep Think – μια εξελιγμένη υπηρεσία AI για επιστημονικά προβλήματα που συνεχίζει να «ρυθμίζει» τις απαντήσεις σύμφωνα με τα αιτήματα.
Το Google παρουσίασε την ενημερωμένη έκδοση του Gemini 3 Deep Think
Η εταιρεία Google ανακοίνωσε μια νέα σημαντική αναβάθμιση της πλατφόρμας Gemini 3 Deep Think – έναν τεχνητό νοημοσύνη που μπορεί να συλλογίζεται και να επιλύει σύνθετες επιστημονικές-μηχανικές προκλήσεις.
Τι άλλαξε
ΠαράμετρονΝέοΠώς φαίνεταιΣκοπόςΜετάβαση από καθαρή θεωρία σε πρακτική εφαρμογήΕπίλυση προβλημάτων χωρίς σαφείς περιορισμούς, με ελλιπή δεδομέναΔоступΑποθηκεύεται στην εφαρμογή GeminiΟι συνδρομητές του Google AI Ultra μπορούν να το χρησιμοποιήσουν, ενώ μέσω API – μηχανικοί και εταιρείες (απαιτείται αίτηση)Συνεργάτες ανάπτυξηςΕρευνητές-επιστήμονες Συμμετοχική εργασία σε σύνθετα προβλήματα
Προσωπικές επιδόσεις
ΔοκιμήΑποτέλεσμαΣχολιασμόςHumanity’s Last Exam48,4 %Χωρίς εξωτερικά εργαλείαARC‑AGI‑284,6 %Μέτρηση για AI‑assistant Codeforces (Elo)3455Υψηλή βαθμολογία ανάμεσα σε λογισμικές λύσειςIMO 2025Χρυσό μετάλλιοΙσοδυναμία με επίπεδο συμμετοχής διεθνούς ολυμπιάδαςΧημεία/ΦυσικήΉνιαστος αποτέλεσμαΔείχνει γενικευσιμότητα σε διάφορα κλάματαCMT‑Benchmark (θεωρητική φυσική)50,5 %Καλή κατανόηση σύνθετων εννοιών
AI-άγγελος «Aletheia»
Στο εργαστήριο DeepMind του Google δημιούργησαν τον αγγελιο Aletheia βασισμένο στο Gemini 3 Deep Think. Κύρια χαρακτηριστικά:
1. Έλεγχος υποθέσεων – ο αγγελιας εντοπίζει αδυναμίες στις προτεινόμενες λύσεις και τις διορθώνει επαναληπτικά.
2. Αναγνώριση αβεβαιότητας – μπορεί να αναφέρει ότι δεν γνωρίζει την απάντηση.
3. Διεπαφή με εξωτερικές πηγές – χρησιμοποιεί την υπηρεσία αναζήτησης Google και περιήγηση στο διαδίκτυο, αλλά αποφεύγει τη δημιουργία ψευδών συνδέσμων.
Επίπεδα επίτευξης
Το Google διαιρέθηκε τις επιτυχίες του Aletheia σε πέντε επίπεδα:
ΕπίπεδοΠεριγραφήΠαραδείγματα0 – «μικρή καινοτομία»Πλήρης αυτόνομη λειτουργία, τρία προβλήματα του P. Erdős λυμένα (πρώτο επίπεδο)Τρία προβλήματα Erdős1 – «ελάχιστη καινοτομία»Ένα επιπλέον αποτέλεσμα σε αυτόνομη λειτουργίαΗ τέταρτη πρόκληση2 – «κατάλληλη για δημοσίευση»Αποτελέσματα τόσο αυτόνομα όσο και συνεργατικά με άνθρωπο, καθώς και βοηθητικά εργαλείαΔεδομένα προβλήματα3–4 – «σημαντική/μεγαλόσφαιρη διάσπαση»Μέχρι στιγμής δεν έχουν επιτευχθεί—
Πώς αντιμετωπίζει το Aletheia τα προβλήματα του Erdős
* Από 700 ανεπίλυτα προβλήματα του αγγελιας, λυθήκαν 13.
* Ωστόσο μόνο 4 από αυτά είναι πραγματικά νέα – τα υπόλοιπα είναι ήδη γνωστά στην επιστημονική κοινότητα.
* Από τις 212 προτεινόμενες λύσεις μόλις το 6,5 % ήταν ουσιαστικά σωστές· το 68,5 % περιείχε θεμελιώδη λάθη και το 31,5 % – ερμηνεύθηκαν λανθασμένα.
Οι προγραμματιστές επισημαίνουν ότι το AI τείνει να «αναδιατυπώνει την ερώτηση έτσι ώστε να απαντήσει πιο εύκολα», και παραμένει «πολύ ευάλωτο σε λάθη συγκριτικά με τους ανθρώπους». Στο τέλος, δεν μπορεί ακόμη να αντικαταστήσει τους μαθηματικούς.
Συνολικά: Το Gemini 3 Deep Think και ο αγγελιας του Aletheia δείχνουν εντυπωσιακά αποτελέσματα σε διάφορους επιστημονικούς τομείς, αλλά διατηρούν σημαντικά όρια στην ακρίβεια και αξιοπιστία των λύσεων. Το Google συνεχίζει να εργάζεται για τη βελτίωση της ικανότητας του AI στη βαθιά συλλογιστική και τον έλεγχο των δικών του συμπερασμάτων.
Σχόλια (0)
Μοιραστείτε τη γνώμη σας — παρακαλώ να είστε ευγενικοί και εντός θέματος.
Συνδεθείτε για να σχολιάσετε