Anthropic ra mắt Claude Sonnet 5: Tối ưu chi phí cho các tác vụ AI tự hành
Anthropic vừa giới thiệu Claude Sonnet 5, phiên bản nâng cấp tập trung vào khả năng thực thi tác vụ tự hành với chi phí vận hành thấp hơn, đặt ra tiêu chuẩn mới cho các mô hình AI tầm...
Trong bối cảnh các công ty phát triển mô hình nền tảng đang chạy đua tích hợp khả năng “agentic” (tự hành), Anthropic đã chính thức công bố Claude Sonnet 5. Đây là phiên bản nâng cấp mạnh mẽ của dòng mô hình tầm trung, được thiết kế để thực hiện các tác vụ phức tạp một cách tự chủ.
Bước tiến về khả năng tự hành
Theo Anthropic, Sonnet 5 có khả năng lập kế hoạch, sử dụng các công cụ như trình duyệt web và terminal, đồng thời vận hành độc lập ở mức độ mà trước đây chỉ các mô hình lớn và đắt đỏ mới thực hiện được. Động thái này cho thấy khả năng tự hành đang trở thành tiêu chuẩn bắt buộc tại mọi phân khúc giá.
Điểm khác biệt hiện nay không còn nằm ở việc mô hình nào thông minh nhất, mà là mô hình nào có thể thực hiện công việc với chi phí thấp nhất và độ tin cậy cao nhất mà không cần sự can thiệp liên tục của con người.
Hiệu suất và chi phí
Claude Sonnet 5 mang lại hiệu suất tiệm cận với dòng Opus 4.8 nhưng với mức chi phí tối ưu hơn. Trong giai đoạn ra mắt đến hết ngày 31/8, mức giá là 2 USD cho mỗi triệu input tokens và 10 USD cho mỗi triệu output tokens. Sau thời điểm này, giá sẽ điều chỉnh lên 3 USD và 15 USD tương ứng.
So với người tiền nhiệm Sonnet 4.6, phiên bản mới cải thiện đáng kể khả năng lập luận, sử dụng công cụ, lập trình phần mềm và xử lý tri thức. Trong các bài kiểm tra, Sonnet 5 cho thấy khả năng tự kiểm tra kết quả đầu ra mà không cần nhắc nhở, giúp hoàn thành các quy trình công việc phức tạp từ đầu đến cuối mà không bị gián đoạn.
Cải thiện về an toàn và bảo mật
Về khía cạnh an toàn, Anthropic cho biết Sonnet 5 giảm thiểu đáng kể các hành vi không mong muốn, như việc hợp tác với các yêu cầu độc hại hoặc bị lừa dối. Mô hình này có khả năng từ chối các yêu cầu nguy hiểm tốt hơn và chống lại các nỗ lực prompt-injection (tấn công tiêm nhiễm câu lệnh). Ngoài ra, tỷ lệ hallucination (ảo giác) và hành vi nịnh bợ người dùng cũng thấp hơn so với phiên bản trước.
Tuy nhiên, Anthropic vẫn lưu ý rằng đối với các tác vụ đòi hỏi độ chính xác cực cao hoặc các công việc liên quan đến an ninh mạng phức tạp, dòng Opus 4.8 vẫn là lựa chọn ưu tiên. Sự kết hợp giữa Sonnet 5 và Opus 4.8 cho phép các nhà phát triển linh hoạt điều chỉnh giữa chi phí và hiệu năng tùy theo nhu cầu thực tế.
Nguồn tham khảo: TechCrunch



No Comment! Be the first one.