AI-стартап Probably залучив $9 млн на створення надійнішого штучного інтелекту

Ключові деталі:

Стартап Probably отримав $9 млн інвестицій від Andreessen Horowitz для боротьби з “галюцинаціями” у великих мовних моделях (LLM).
Компанія розробляє систему “механічного костюма даних” для перевірки результатів LLM за допомогою детермінованих валідаторів, що дозволяє досягти високої точності.
Підхід Probably дозволяє використовувати менші, ефективніші моделі ШІ, знижуючи витрати на обчислення та відкриваючи можливості для застосування у сферах, що вимагають високої точності.

AI-стартап Probably залучив $9 млн на створення надійнішого штучного інтелекту 2

Із зростанням потужності великих мовних моделей (LLM) проблема “галюцинацій” залишається стійкою перешкодою. Помилки трапляються навіть у найінтелектуальніших системах, і хоча існують методи їх виявлення, індустрія все ще шукає оптимальні рішення.

Компанія Probably, яка щойно залучила $9 мільйонів на початковому етапі від Andreessen Horowitz, прагне впровадити більш надійний підхід до виявлення та усунення цих помилок.

Як зазначає засновник Пітер Еліас (на фото вище), мета компанії – запобігти потраплянню “галюцинацій” та простих фактичних помилок до кінцевого користувача, досягнувши рівня точності 99,99%, що є стандартом для детермінованих систем, але значно складнішим для реалізації в штучному інтелекті. Виявляється, досягнення такого рівня точності з LLM вимагає переосмислення багатьох фундаментальних засад інженерії ШІ.

Перший продукт Probably – це інструмент для наукової обробки даних (data science), розроблений для швидкого отримання відповідей зі складних наборів даних. Кожен результат супроводжується посиланням на джерело та аудиторським відстеженням процесу його генерації, що стає все більш поширеною практикою серед інструментів ШІ.

Однак, щоб уникнути потрапляння помилок у ці підсумки, була створена складна система “обв’язки”, яку Еліас описує як “механічний костюм даних”. Первинні відповіді LLM перевіряються детермінованою системою валідації, яка відхиляє будь-які результати, що не відповідають вихідним даним. Важливо, що LLM була навчена працювати у взаємодії з валідатором, а вся система оптимізована для швидких і точних відповідей, заявляє компанія.

“Ми зрозуміли, що чим кращою є наша інженерія ‘обв’язки’, тим менш потужною може бути сама модель,” – зазначає Еліас. “Якщо ви можете достатньо точно налаштувати контекст, моделі не доводиться докладати надмірних зусиль, щоб зробити правильний вибір. По суті, це завдання зі зменшення невизначеності”.

Це дозволяє інструменту Probably для наукової обробки даних працювати на значно менших моделях ШІ. Еліас стверджує, що поточна версія використовує модель, яка “на чотири класи слабша за передові моделі”. Це означає, що вона може працювати на локальному обладнанні (настільному комп’ютері, а не в дата-центрі), що суттєво знижує витрати на токени, пов’язані з використанням ШІ.

Це вельми актуальна пропозиція в час зростання витрат на токени та перегляду бюджетів на ШІ багатьма клієнтами. Ідея Еліаса не обмежується наукою про дані, оскільки той самий двигун може бути розширений для охоплення таких сфер, як бухгалтерський облік або медичні послуги – будь-яких “сфер, чутливих до точності”, як каже Еліас.

“Я вважаю дуже цікавим, що великі ШІ-лабораторії навіть не намагалися це зробити,” – коментує Еліас. “Їх стимули спрямовані проти цього, адже вони заробляють більше, чим частіше користувачам доводиться виправляти модель”.

Оригінал статті: techcrunch.com

Поділитися новиною:Telegram Viber Facebook

Читайте також:

No votes yet.

Please wait...

Читайте також:

Залишити відповідьСкасувати відповідь