ΗΠΑ: Σημαντικές αναταράξεις προκαλεί στον χώρο της τεχνητής νοημοσύνης η απόφαση της κυβέρνησης των Ηνωμένων Πολιτειών να ζητήσει την άμεση αναστολή πρόσβασης στα μοντέλα Fable 5 και Mythos 5 της Anthropic, επικαλούμενη λόγους εθνικής ασφάλειας.
Σύμφωνα με ανακοίνωση της εταιρείας, η αμερικανική κυβέρνηση εξέδωσε οδηγία ελέγχου εξαγωγών, βάσει της οποίας απαγορεύεται η πρόσβαση στα συγκεκριμένα μοντέλα από οποιονδήποτε ξένο υπήκοο, είτε βρίσκεται εντός είτε εκτός ΗΠΑ. Η απαγόρευση αφορά ακόμη και ξένους υπηκόους που εργάζονται στην ίδια την Anthropic.
Η εταιρεία αναφέρει ότι, προκειμένου να συμμορφωθεί με την κυβερνητική εντολή, υποχρεώνεται να απενεργοποιήσει άμεσα τα Fable 5 και Mythos 5 για όλους τους πελάτες της. Διευκρινίζει, πάντως, ότι η πρόσβαση στα υπόλοιπα μοντέλα της Anthropic δεν επηρεάζεται.
Η Anthropic σημειώνει ότι έλαβε τη σχετική οδηγία σήμερα στις 5:21 μ.μ. ώρα Ανατολικής Ακτής των ΗΠΑ. Όπως επισημαίνει, η επιστολή της κυβέρνησης δεν περιλάμβανε συγκεκριμένες λεπτομέρειες για την ανησυχία εθνικής ασφάλειας που επικαλείται.
Κατά την εταιρεία, η υπόθεση φαίνεται να συνδέεται με πιθανή μέθοδο παράκαμψης των δικλίδων ασφαλείας, γνωστή ως «jailbreak», στο μοντέλο Fable 5. Η Anthropic αναφέρει ότι εξέτασε επίδειξη της συγκεκριμένης τεχνικής, η οποία χρησιμοποιήθηκε για τον εντοπισμό μικρού αριθμού ήδη γνωστών και περιορισμένης σημασίας ευπαθειών λογισμικού.
Η εταιρεία υποστηρίζει ότι οι συγκεκριμένες ευπάθειες ήταν σχετικά απλές και ότι αντίστοιχα ευρήματα μπορούν να εντοπιστούν και από άλλα δημόσια διαθέσιμα μοντέλα τεχνητής νοημοσύνης, χωρίς να απαιτείται κάποια ιδιαίτερη μέθοδος παράκαμψης.
Στην ανακοίνωσή της, η Anthropic υπερασπίζεται τις δικλίδες ασφαλείας του Fable 5, τονίζοντας ότι πριν από την κυκλοφορία του μοντέλου πραγματοποιήθηκαν χιλιάδες ώρες δοκιμών ασφαλείας σε συνεργασία με την κυβέρνηση των ΗΠΑ, το βρετανικό AISI, ανεξάρτητους οργανισμούς και εσωτερικές ομάδες της εταιρείας.
Όπως αναφέρει, οι δοκιμές έδειξαν ότι οι μηχανισμοί ασφαλείας του Fable είναι σημαντικά πιο αποτελεσματικοί από εκείνους προηγούμενων μοντέλων που έχουν διατεθεί στην αγορά. Η Anthropic υπογραμμίζει επίσης ότι, μέχρι σήμερα, κανένας δοκιμαστής δεν έχει εντοπίσει «καθολικό jailbreak», δηλαδή μια μέθοδο που θα μπορούσε να παρακάμψει ευρέως τις δικλίδες ασφαλείας του μοντέλου.
Παράλληλα, η εταιρεία αναγνωρίζει ότι η απόλυτη προστασία από τεχνικές jailbreak πιθανότατα δεν είναι εφικτή σήμερα για κανέναν πάροχο μοντέλων τεχνητής νοημοσύνης. Για τον λόγο αυτό, όπως εξηγεί, έχει υιοθετήσει στρατηγική «άμυνας σε βάθος», με στόχο οι πιθανές παρακάμψεις να είναι είτε πολύ περιορισμένες είτε ιδιαίτερα δύσκολες και δαπανηρές στην ανάπτυξή τους.
Η Anthropic αναφέρει ακόμη ότι η πολιτική διατήρησης δεδομένων πελατών για 30 ημέρες στο Fable 5 εφαρμόστηκε ακριβώς για να μπορεί η εταιρεία να εντοπίζει, να ερευνά και να περιορίζει πιθανές απόπειρες κατάχρησης.
Ιδιαίτερη αίσθηση προκαλεί η αναφορά της εταιρείας ότι, μέχρι στιγμής, η κυβέρνηση έχει παρουσιάσει μόνο προφορικά στοιχεία για ένα πιθανό περιορισμένο jailbreak. Σύμφωνα με την Anthropic, η τεχνική αυτή ουσιαστικά αφορούσε αίτημα προς το μοντέλο να διαβάσει συγκεκριμένη βάση κώδικα και να διορθώσει αδυναμίες λογισμικού.
Η εταιρεία υποστηρίζει ότι το επίπεδο δυνατοτήτων που παρουσιάστηκε στην επίμαχη αναφορά είναι ήδη διαθέσιμο και από άλλα μοντέλα, μεταξύ των οποίων και το GPT-5.5 της OpenAI, και χρησιμοποιείται καθημερινά από επαγγελματίες κυβερνοασφάλειας για την προστασία συστημάτων.
Παρότι η Anthropic δηλώνει ότι συμμορφώνεται με τη νομική οδηγία της αμερικανικής κυβέρνησης, εκφράζει ξεκάθαρα τη διαφωνία της με την απόφαση. Όπως τονίζει, ένα περιορισμένο πιθανό jailbreak δεν θα έπρεπε να αποτελεί λόγο ανάκλησης ενός εμπορικού μοντέλου που χρησιμοποιείται από εκατοντάδες εκατομμύρια ανθρώπους.
Η εταιρεία προειδοποιεί ότι, εάν ένα τέτοιο πρότυπο εφαρμοστεί συνολικά στον κλάδο, θα μπορούσε ουσιαστικά να οδηγήσει σε «πάγωμα» νέων κυκλοφοριών μοντέλων από όλους τους μεγάλους παρόχους τεχνητής νοημοσύνης.
Η Anthropic καταλήγει σημειώνοντας ότι οι κυβερνήσεις θα πρέπει πράγματι να έχουν τη δυνατότητα να εμποδίζουν μη ασφαλείς διαθέσεις μοντέλων, αλλά μόνο μέσα από μια διαδικασία θεσμικά κατοχυρωμένη, διαφανή, δίκαιη, σαφή και βασισμένη σε τεχνικά δεδομένα. Κατά την εταιρεία, η συγκεκριμένη ενέργεια δεν ανταποκρίνεται σε αυτές τις αρχές.
Κλείνοντας, η Anthropic ζητά συγγνώμη από τους πελάτες της για την αναστάτωση, εκφράζοντας την εκτίμηση ότι πρόκειται για παρεξήγηση και ότι εργάζεται για την αποκατάσταση της πρόσβασης το συντομότερο δυνατό.
Σχόλια αναγνωστών
Τα σχόλια δημοσιεύονται κατόπιν έγκρισης.