Agenci statyczni są już martwi. Niech żyje nauka przez całe życie.

Po prostu wyślij tłumaczenie. Nie dodawaj żadnych komentarzy, wyjaśnień ani metatekstu:

Era statycznej sztucznej inteligencji dobiegła końca. A przynajmniej Trajectory ma taką nadzieję.

Koledzy z dużych firm – Google, Apple, OpenAI – bazują na jednym pomyśle: realnych danych do modeli szkoleniowych. W tym tygodniu uruchomili projekt Trajectory, którego celem było stworzenie pętli uczenia się pomiędzy błędami użytkowników a ulepszaniem modeli. Nie ma już potrzeby jednorazowego szkolenia – po prostu licz na najlepsze.

Trajektoria zebrała 15 milionów dolarów. To pierwsza runda finansowania. Wartość projektu wynosi 115 milionów dolarów. Konwent przejął wiodącą rolę w tym procesie. W finansowaniu uczestniczyły firmy Bessemer i Radical VC. Główni inwestorzy to Jafe Dean, główny naukowiec w Google DeepMind i Fei-Fei Li, „matka sztucznej inteligencji”. Zdolność kredytowa projektu jest wysoka.

Ronak Malde jest dyrektorem generalnym. Pracował w Windsurf, a następnie w trakcie trudnego procesu rekrutacyjnego o wartości 2,4 miliarda dolarów przeniósł się do DeepMind. Jej współzałożycielami są Arjun Karanam z zespołu Vision Pro firmy Apple i Michael Elabd, wcześniej pracownik działu robotyki DeepMind. Zespół składa się z jedenastu osób. Ambicje są świetne.

Uważają, że branża nie funkcjonuje prawidłowo. Dlaczego?

Ponieważ agenci wywiadu przestają się uczyć po zakończeniu procesu uczenia się. OpenAI, Anthropic, Google tworzą potężne modele, które mogą więcej niż ludzie. Ale co się stanie po uruchomieniu? Model pozostaje statyczny. Ten sam model, który zawiódł we wtorek, zawiedzie w piątek.

„Nawet najpotężniejsi agenci wywiadu są dziś statyczni.”

Malde przytacza przykład asystentów kodowania, takich jak Cursor. Wykorzystują dane użytkownika do ciągłego uczenia modeli. Dlatego rozwój sztucznej inteligencji następuje bardzo szybko. Nie tylko siła podstawowych modeli, ale także możliwość ciągłego uczenia się. Trajectory chce zastosować tę zasadę w innych obszarach: obsługi klienta, sprzedaży, prawa.

Ale to trudne. Kod musi działać lub nie. Opcja binarna. Jeśli żądanie przetworzenia zostanie wysłane do bota, nie jest jasne. Sukces jest nieprzewidywalny. Karanam przyjmuje do wiadomości to wyzwanie. Trajektoria pomaga firmom określić wskaźniki sukcesu. Nie zaczynasz od GPT-4. Zaczynasz od otwartego modelu, który można wyszkolić do konkretnego zadania.

Weźmy na przykład Decagona. Tworzą agentów wywiadowczych, którzy wspierają klientów. Gdy bot zawiedzie, zapisują tę obserwację. W przyszłym tygodniu będą trenować model na podstawie tych informacji. Nowy model nie powtarza błędu. Twierdzą, że te modele są lepsze od tradycyjnych.

Menedżerom podoba się ten pomysł. W dzisiejszych czasach, aby wdrożyć sztuczną inteligencję, trzeba zatrudnić specjalistów. Piękni konsultanci, którzy będą monitorować komponent techniczny. OpenAI i Anthropic tworzą zespoły, które wykonają tę pracę. Elabd nie wyraża na to zgody. Chce, żeby program uczył się sam. Nie ma potrzeby zatrudniania specjalistów do konserwacji. Wystarczy podłączyć model. Nauczy się i stanie się lepsza.

Czy to naprawdę jest ciągłe uczenie się? Krytycy mogą przewrócić oczami. Aktualizacje pojawiają się co tydzień. Jednak pomiędzy tymi aktualizacjami model pozostaje statyczny. Jest to nauka przerywana. Nie na stałe.

Elabd to lekceważy. Mówi, że cotygodniowe aktualizacje to dopiero początek. Celem są codzienne aktualizacje, nawet cogodzinne. Wyobraża sobie świat, w którym firmy nie tworzą jednego wielkiego modelu dla wszystkich pracowników. Tworzą osobne modele dla każdego pracownika. Spersonalizowane, adaptacyjne, istotne.

Brzmi ryzykownie. Ale która opcja zostanie wybrana?

Na razie musimy poczekać do następnej cotygodniowej aktualizacji, aby się o tym przekonać.

попередня статтяRandki już nie działają, więc aplikacje zaczynają płacić za benzynę
наступна статтяDave Ramsey o kredytach hipotecznych: prawda o spłacie kredytu hipotecznego