OpenAI ra mắt chip AI tùy chỉnh đầu tiên mang tên Jalapeño, hợp tác cùng Broadcom
OpenAI vừa chính thức giới thiệu Jalapeño, bộ vi xử lý tùy chỉnh đầu tiên được thiết kế cho các tác vụ inference, đánh dấu bước tiến quan trọng trong việc giảm phụ thuộc vào GPU của...
OpenAI vừa công bố bộ vi xử lý chuyên dụng cho tác vụ inference đầu tiên của hãng, được phát triển và sản xuất thông qua sự hợp tác chiến lược với Broadcom. Con chip này có tên mã là Jalapeño, được tối ưu hóa đặc biệt để đáp ứng các yêu cầu khắt khe từ hệ thống inference của OpenAI. Đáng chú ý, chính các mô hình AI của OpenAI đã đóng góp một phần quan trọng trong quá trình thiết kế con chip này.
Mặc dù hiện tại Jalapeño vẫn đang trong giai đoạn thử nghiệm, nhưng các kết quả ban đầu cho thấy hiệu suất trên mỗi watt (performance-per-watt) vượt trội đáng kể so với các giải pháp hiện có trên thị trường. Việc tự phát triển chip được kỳ vọng sẽ giúp OpenAI giảm bớt sự phụ thuộc vào GPU của Nvidia, tương tự như cách Google và Amazon đã thực hiện với các dòng chip tăng tốc AI (AI accelerators) của riêng họ.
Theo Greg Brockman, Chủ tịch của OpenAI, chiến lược này xuất phát từ sự thấu hiểu sâu sắc về các khối lượng công việc (workload) đặc thù. Thay vì sử dụng phần cứng đại trà, OpenAI tập trung vào việc xây dựng các giải pháp phần cứng chuyên biệt để đẩy nhanh tốc độ xử lý cho những tác vụ đang bị giới hạn về hiệu năng.
Jalapeño được thiết kế chuyên biệt cho quá trình inference — giai đoạn chạy các mô hình AI đã được huấn luyện để phản hồi lệnh từ người dùng. OpenAI nhấn mạnh rằng con chip này giúp giảm đáng kể chi phí vận hành khi chạy các mô hình lập trình thời gian thực. Đối với các tác vụ đòi hỏi tài nguyên tính toán khổng lồ như pre-training, OpenAI nhiều khả năng vẫn sẽ tiếp tục duy trì sự phụ thuộc vào hạ tầng phần cứng của Nvidia.
Động thái này cho thấy tham vọng của OpenAI trong việc kiểm soát toàn bộ hệ sinh thái công nghệ, từ kiến trúc chip, nhân (kernel), hệ thống bộ nhớ, mạng lưới, cho đến hệ thống triển khai và trải nghiệm người dùng. Bằng cách tối ưu hóa đồng bộ trên toàn bộ các lớp của stack công nghệ, OpenAI hướng tới mục tiêu làm cho các mô hình AI của mình trở nên nhanh hơn, tin cậy hơn và tiết kiệm chi phí hơn cho người dùng cuối.
Nguồn tham khảo: TechCrunch

No Comment! Be the first one.