Patronus AI huy động 50 triệu USD để phát triển môi trường giả lập kiểm thử AI agents
Startup Patronus AI vừa gọi vốn thành công 50 triệu USD nhằm xây dựng các 'thế giới kỹ thuật số' giúp kiểm thử khả năng thực thi của các AI agents trong môi trường thực...
Khi các AI agents ngày càng trở nên tinh vi, chuyển mình từ việc trả lời câu hỏi sang tự động thực hiện các tác vụ phức tạp, nhu cầu đảm bảo độ tin cậy của chúng trở nên cấp thiết hơn bao giờ hết. Trước khi các doanh nghiệp có thể tin tưởng giao phó những công việc như đặt lịch trình hay phân tích tài chính cho AI, các nhà phát triển cần một phương pháp kiểm thử toàn diện hơn là các bài benchmark truyền thống.
Patronus AI, startup được thành lập vào năm 2023 bởi các cựu nghiên cứu viên từ Meta AI là Anand Kannappan và Rebecca Qian, đang giải quyết bài toán này bằng cách xây dựng các môi trường giả lập kỹ thuật số. Tại đây, các AI agents sẽ được đưa vào những kịch bản thực tế để đánh giá hiệu suất.
Công nghệ cốt lõi của Patronus là các “mô hình thế giới kỹ thuật số” (digital world models), cho phép tái tạo các trang web và hệ thống nội bộ. Trong môi trường này, các agents được stress-test thông qua kỹ thuật reinforcement learning, nơi hệ thống liên tục đưa ra các phản hồi thưởng cho những tác vụ hoàn thành đúng và phạt khi xảy ra lỗi. Cách tiếp cận này tương tự như cách Waymo huấn luyện xe tự lái trong các môi trường giả lập để đối mặt với những tình huống nguy hiểm hiếm gặp.
Glenn Solomon, Giám đốc điều hành tại Notable Capital, cho biết nhu cầu đối với các môi trường giả lập của Patronus đang tăng vọt. Startup này đã ghi nhận doanh thu tăng gấp 15 lần trong năm qua, dẫn đến vòng gọi vốn Series B trị giá 50 triệu USD do Greenfield Partners dẫn đầu, với sự tham gia của Notable Capital, Lightspeed, Datadog và Samsung. Tổng số vốn huy động của công ty hiện đã đạt 70 triệu USD.
Hiện tại, Patronus tập trung vào các lĩnh vực có thể kiểm chứng được như kỹ thuật phần mềm và tài chính. Tuy nhiên, tầm nhìn của Kannappan là mở rộng sang các lĩnh vực phức tạp hơn, nơi việc xác minh hành vi của AI khó khăn hơn nhiều. Điểm khác biệt của Patronus so với các đối thủ là khả năng tự động hóa hoàn toàn quy trình đánh giá, loại bỏ sự can thiệp của con người trong quá trình kiểm thử hành vi của agents.
Nguồn tham khảo: TechCrunch

No Comment! Be the first one.