Cloudflare tăng cường năng lực hạ tầng AI với đội ngũ từ Ensemble AI
Cloudflare chính thức chào đón đội ngũ chuyên gia từ Ensemble AI để đẩy mạnh tối ưu hóa hạ tầng, giúp các nhà phát triển triển khai mô hình AI hiệu quả và tiết kiệm chi phí hơn trên quy mô toàn...
Cloudflare vừa thông báo về việc chiêu mộ đội ngũ chủ chốt từ Ensemble AI – một startup nổi bật trong lĩnh vực tối ưu hóa mô hình AI. Động thái này nhằm mục tiêu đẩy nhanh tiến độ phát triển hạ tầng AI, giúp các nhà phát triển vận hành những mô hình phức tạp một cách hiệu quả và tiết kiệm hơn trên quy mô lớn.
Tối ưu hóa mô hình AI từ kiến trúc
Được thành lập vào năm 2023 tại San Francisco, Ensemble AI đã tập trung giải quyết bài toán cốt lõi của ngành AI: làm sao để các mô hình lớn trở nên nhanh hơn, nhỏ gọn hơn và tối ưu chi phí mà không làm giảm chất lượng. Thay vì chỉ dựa vào các kỹ thuật quantization (lượng tử hóa) thông thường, đội ngũ này đã nghiên cứu các khối xây dựng mới giúp mạng thần kinh (neural networks) trở nên tinh gọn ngay từ cấp độ kiến trúc.
Một trong những thành tựu nổi bật của họ là NdLinear – giải pháp thay thế trực tiếp cho các lớp tuyến tính tiêu chuẩn trong các mô hình transformer. NdLinear cho phép mô hình giữ lại các cấu trúc dữ liệu quan trọng (như các đầu, kênh hoặc chiều không gian) trong khi vẫn giảm đáng kể số lượng tham số và khối lượng tính toán. Ngoài ra, họ còn phát triển NdLinear-LoRA, một phương pháp tinh chỉnh (fine-tuning) hiệu quả giúp giảm thiểu số lượng tham số cần huấn luyện cho các mô hình ngôn ngữ lớn.
Nâng cấp nền tảng Workers AI
Đối với Cloudflare, chi phí inference (suy luận) là một trong những rào cản lớn nhất đối với các ứng dụng AI. Việc tích hợp chuyên môn từ Ensemble AI sẽ giúp Cloudflare củng cố nền tảng Workers AI, vốn cung cấp khả năng chạy inference trên GPU serverless thông qua mạng lưới toàn cầu của hãng.
Đội ngũ mới sẽ phối hợp cùng các kỹ sư hiện tại của Cloudflare để tối ưu hóa hiệu suất GPU, cải thiện bộ nhớ và tăng cường khả năng triển khai các mô hình AI thế hệ mới. Những nỗ lực này sẽ bổ sung cho các công nghệ hiện có của Cloudflare như engine suy luận Infire và kỹ thuật nén tensor Unweight.
Tầm nhìn tương lai
Trong bối cảnh AI đang chuyển dịch từ các tác vụ tạo văn bản đơn thuần sang các hệ thống đa phương thức (multimodal), tác nhân tự hành (agents) và học tăng cường (reinforcement learning), nhu cầu về một hạ tầng chạy AI tin cậy, chi phí thấp và gần với người dùng cuối trở nên cấp thiết hơn bao giờ hết. Cloudflare kỳ vọng sự kết hợp này sẽ giúp các nhà phát triển vượt qua những rào cản về chi phí và độ phức tạp vận hành, từ đó thúc đẩy làn sóng ứng dụng AI tiếp theo trên nền tảng của hãng.
Nguồn tham khảo: Cloudflare Blog



No Comment! Be the first one.