Patronus AI залучила $50 млн на створення “цифрових світів” для тестування ШІ

Ключові деталі:

  • Стартап Patronus AI, заснований колишніми дослідниками Meta AI, розробляє симуляційні цифрові середовища для тестування продуктивності ШІ-агентів.
  • Компанія залучила $50 мільйонів у рамках раунду фінансування Series B, загальна сума інвестицій досягла $70 мільйонів.
  • Patronus AI використовує “цифрові моделі світу” для створення реплік вебсайтів та систем, тестуючи агентів за допомогою навчання з підкріпленням.
Patronus AI залучила $50 млн на створення "цифрових світів" для тестування ШІ 2

Штучний інтелект виходить на новий рівень: агенти вже не просто відповідають на запитання, а самостійно виконують складні багатоетапні завдання.

Однак, перш ніж довірити цим системам бронювання подорожей чи фінансовий аналіз від імені користувачів, розробники моделей та стартапи, що створюють таких агентів, прагнуть забезпечити їхню надійність у найрізноманітніших сценаріях.

ШІ-лабораторії часто використовують бенчмарки для демонстрації можливостей своїх моделей. Проте високий бал, навіть у тестах, орієнтованих на агентів, не гарантує, що ШІ зможе коректно впоратися з різноманітними складними реальними завданнями.

Patronus AI, стартап, заснований у 2023 році колишніми дослідниками Meta AI Анандом Каннаппаном та Ребеккою Цянь, допомагає розробникам моделей та компаніям удосконалювати їх. Для цього компанія створює симульовані цифрові середовища, де оцінюється ефективність роботи агентів.

Компанія, що базується в Сан-Франциско, безсумнівно, вирішує актуальну проблему. За словами Гленна Соломона, керуючого директора Notable Capital, практично кожна передова ШІ-лабораторія та багато стартапів вже є їхніми клієнтами, а попит на симуляційні середовища Patronus він описує як майже ненаситний.

Доходи Patronus зросли в 15 разів за останній рік, що стимулювало значний інтерес інвесторів. У четвер компанія оголосила про залучення $50 мільйонів у рамках раунду Series B під керівництвом Greenfield Partners, за участю Notable Capital, Lightspeed, Datadog та Samsung. Загальна сума фінансування компанії тепер становить $70 мільйонів.

Patronus використовує так звані “цифрові моделі світу” для створення копій вебсайтів та внутрішніх систем. У цих симульованих середовищах агенти проходять стрес-тестування після навчання за допомогою методу навчання з підкріпленням, який послідовно винагороджує успішне виконання завдань і карає за помилки.

ШІ-лабораторії вбачають велику цінність у цих цифрових симуляціях, оскільки вони дають агентам можливість спробувати різні, іноді непередбачувані сценарії. Компанія порівнює свій підхід із тренуванням автономних автомобілів: спочатку створюються синтетичні світи для перевірки автомобілів у рідкісних екстремальних умовах, таких як сильна погода або дитина, що вибігає на дорогу за м’ячем.

Відмінність полягає в тому, що ШІ-агенти часто шукають “швидкі шляхи”, що призводить до неправильного виконання завдання. “Patronus чудово виявляє такі скорочення та гарантує, що моделі несуть відповідальність”, – зазначив Соломон.

Наразі Patronus надає свої симульовані цифрові світи для завдань у сфері програмної інженерії та фінансів, але це лише початок, за словами Каннаппана.

«Сьогодні ми зосереджені на перевірених завданнях, які можна одразу ж оцінити. Але існує безліч інших сфер, де перевірка є дуже складною або взагалі неможливою», – сказав він.

Те, що процеси є перевіреними, не означає, що вони прості. «Ми хочемо створювати середовища, в яких агент може працювати 10 годин, 10 днів або навіть 10 тижнів», – додав Каннаппан.

Щодо конкурентів, Patronus вважає, що в основному конкурує з внутрішніми командами, які самі створюють ШІ-лабораторії для оцінки поведінки агентів. Хоча компанії, що працюють з людськими даними, як-от Mercor та Surge, допомагають розробникам моделей із навчанням з підкріпленням, Patronus діє інакше, оцінюючи поведінку агентів без будь-якого втручання людини.

Джерело новини: techcrunch.com

Поділитися новиною:TelegramViberFacebook
No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *