Chính phủ Mỹ yêu cầu Anthropic ngừng hoạt động hai mô hình AI mạnh nhất vì lo ngại an ninh
Chính phủ Mỹ vừa ra lệnh cho Anthropic vô hiệu hóa quyền truy cập vào hai mô hình AI tiên tiến nhất là Claude Fable 5 và Claude Mythos 5, viện dẫn các rủi ro về an ninh quốc gia và khả năng khai thác...
Chính phủ Mỹ vừa ban hành lệnh yêu cầu Anthropic ngay lập tức dừng hoạt động của hai mô hình AI mạnh nhất hiện nay là Claude Fable 5 và Claude Mythos 5. Quyết định này được đưa ra dựa trên những lo ngại về an ninh quốc gia, buộc Anthropic phải vô hiệu hóa quyền truy cập của người dùng trên toàn cầu, thay vì chỉ giới hạn ở các đối tượng nước ngoài như các quy định kiểm soát xuất khẩu thông thường.
Tại sao Mythos và Fable 5 lại bị đưa vào tầm ngắm?
Mythos được coi là mô hình AI có năng lực vượt trội nhất của Anthropic. Kể từ khi giới thiệu vào tháng 4, mô hình này đã bị kiểm soát chặt chẽ do khả năng phát hiện các vulnerability (lỗ hổng) trong phần mềm cực kỳ hiệu quả. Thay vì phát hành rộng rãi, Anthropic đã triển khai dự án Project Glasswing, chia sẻ quyền truy cập cho khoảng 50 tổ chức được kiểm duyệt như Apple, Google, Microsoft và CrowdStrike để phục vụ mục đích phòng thủ an ninh mạng.
Trong khi đó, Fable 5 được ra mắt cách đây vài ngày như một phiên bản thương mại hóa của Mythos, tích hợp các cơ chế bảo vệ (guardrails) để ngăn chặn việc khai thác trong các lĩnh vực rủi ro cao như sinh học hay tấn công mạng.
Tranh cãi về rủi ro jailbreak
Mặc dù chính phủ Mỹ coi đây là hành động kiểm soát xuất khẩu, Anthropic cho biết nguyên nhân sâu xa xuất phát từ một cáo buộc về khả năng jailbreak trên Fable 5. Phía Anthropic phản bác rằng bằng chứng mà chính phủ đưa ra chỉ là một trường hợp jailbreak hẹp, không mang tính phổ quát, và khả năng này vốn đã tồn tại ở nhiều mô hình AI khác như GPT-5.5 của OpenAI. Công ty khẳng định các hệ thống phân loại độc lập của họ vẫn hoạt động hiệu quả để ngăn chặn các đầu ra nguy hiểm.
Anthropic bày tỏ sự thất vọng trước quyết định này, cho rằng việc thu hồi một mô hình thương mại chỉ vì một lỗ hổng tiềm ẩn nhỏ sẽ tạo ra tiền lệ xấu, có khả năng làm đình trệ toàn bộ quá trình triển khai các mô hình AI tiên phong trong tương lai.
Sự việc này cũng gợi nhắc lại những bình luận trước đó của Sam Altman (OpenAI), người từng chỉ trích chiến lược truyền thông của Anthropic là “tiếp thị dựa trên nỗi sợ hãi”. Việc Anthropic liên tục nhấn mạnh rằng mô hình của họ “cực kỳ nguy hiểm” dường như đã vô tình thu hút sự chú ý đặc biệt từ phía chính phủ, dẫn đến hệ quả là chính những công cụ mà họ dày công bảo vệ lại trở thành mục tiêu bị đình chỉ hoạt động.
Nguồn tham khảo: TechCrunch



No Comment! Be the first one.