Η τεχνητή νοημοσύνη έδειξε χαμηλή αποτελεσματικότητα στις αθλητικές στοιχηματισμούς, έχοντας χάσει όλα τα χρήματα σε αγώνες της Αγγλικής Πρεμιέρας.

Η τεχνητή νοημοσύνη έδειξε χαμηλή αποτελεσματικότητα στις αθλητικές στοιχηματισμούς, έχοντας χάσει όλα τα χρήματα σε αγώνες της Αγγλικής Πρεμιέρας.

2 hardware

Σύντομη περίληψη του αποτελέσματος της πειραματικής δοκιμής

Η νεοσύστατη εταιρεία *General Reasoning* διεξήγαγε μια δοκιμή με τίτλο KellyBench, στην οποία αξιολογήθηκαν οκτώ κορυφαία συστήματα AI (Google Gemini 3.1 Pro, OpenAI ChatGPT‑4, Anthropic Claude Opus 4.6, xAI Grok 4.20 κ.ά.) για την ικανότητά τους να στοιχηματίζουν κατά τη διάρκεια της αγωνιστικής σεζόν του Αγγλικού Πρεμιέρα Λίγκ 2023–2024.

Κάθε πράκτορα παρείχαν πλήρη στατιστική περιγραφή όλων των ομάδων και προηγούμενων αγώνων, αλλά η πρόσβαση στο διαδίκτυο απαγορεύεται – τα μοντέλα μπορούσαν να χρησιμοποιήσουν μόνο τα δεδομένα που είχαν λάβει εκ των προτέρων.

Πώς διεξήχθη η δοκιμή

1. Τρεις προσπάθειες: κάθε σύστημα είχε τη δυνατότητα να κάνει τρεις σειρές στοιχημάτων για την σεζόν.
2. Στοιχήματα: αποτελέσματα αγώνων (νίκη/ισοπαλία/ηττάση) και αριθμός γκολ.
3. Στόχος: μεγιστοποίηση κέρδους, διαχείριση κινδύνου.

Ποιος νίκησε και ποιος έχασε

Σύστημα AIΜέσο αποτέλεσμαΣχόλιο
Anthropic Claude Opus 4.611 % (σχεδόν μη εφικτό σε μία προσπάθεια)Ο πιο «ειλικρινής» συμμετέχων, αλλά εξακολουθούσε να χάνει χρήματα
Google Gemini 3.1 Pro+34 % στην πρώτη προσπάθεια, έπειτα λήγει η επιχείρησή τουΑρχικά κέρδος, μετά ζημία
xAI Grok 4.20Λήγει αμέσως, δεν ολοκλήρωσε τις επόμενες δύο προσπάθειεςΟ πιο αδύναμος από όλους

Στο τέλος κάθε μοντέλο έχασε χρήματα για τη σεζόν, και μερικά ακόμη «καταρρεύθηκαν» εντελώς. Αυτό επιβεβαιώνει τα συμπεράσματα των ερευνητών: ακόμα και οι πιο προχωρημένες AI αντιμετωπίζουν δυσκολίες στην μακροχρόνια πρόβλεψη στον πραγματικό κόσμο.

Τι σημαίνει για το μέλλον της AI

- Οι ανησυχίες για την αντικατάσταση του ανθρώπου φαίνονται ακόμη υπερβολικές.
- Τα τρέχοντα benchmarks συχνά χρησιμοποιούν «στατικά» συνθήκες που δεν αντανακλούν τον χάος και τη δυσκολία της πραγματικής ζωής.
- Αν και η AI έχει ήδη επιτυχίες σε εργασίες όπως η συγγραφή κώδικα, στη πλειοψηφία άλλων ανθρώπινων δραστηριοτήτων παραμένει περιορισμένη.

Έτσι, το πείραμα KellyBench δείχνει ότι η AI δεν είναι ακόμη έτοιμη να ανταγωνιστεί τον άνθρωπο σε δυναμικές, απρόβλεπτες εργασίες όπως οι αθλητικές προβλέψεις.

Σχόλια (0)

Μοιραστείτε τη γνώμη σας — παρακαλώ να είστε ευγενικοί και εντός θέματος.

Δεν υπάρχουν ακόμη σχόλια. Αφήστε ένα σχόλιο και μοιραστείτε τη γνώμη σας!

Για να αφήσετε σχόλιο, παρακαλώ συνδεθείτε.

Συνδεθείτε για να σχολιάσετε