TL;DR MODE

Sakana AI wprowadza Marlin – agent badawczy dla firm generujący raporty do 100 stron w oparciu o AB-MCTS

1 lipca 2026 10:04Wyświetlenia: 43·ISTOTNE

W skrócie

Sakana AI wypuściła swój pierwszy produkt komercyjny — Marlin — autonomicznego agenta badawczego dla przedsiębiorstw, który w ciągu do 8 godzin generuje raporty liczące do 100 stron wraz z prezentacją slajdów.
Sercem systemu jest algorytm AB-MCTS (Adaptive Branching Monte Carlo Tree Search), który w eksperymentach na zbiorze ARC-AGI-2 — łącząc modele o4-mini, Gemini 2.5 Pro i DeepSeek-R1 — rozwiązał około 27,5% zadań wobec około 23% osiąganych przez sam model o4-mini.
Wśród partnerów strategicznych Marlina znalazły się MUFG oraz Citigroup, który objął udział inwestycyjny w Sakana AI.

Tokijska firma Sakana AI wypuściła swój pierwszy produkt komercyjny — Sakana Marlin — autonomicznego agenta badawczego skierowanego do przedsiębiorstw. Zespół Sakana pozycjonuje go jako wirtualnego dyrektora ds. strategii (Virtual CSO). To nie chatbot odpowiadający w sekundy, lecz narzędzie do głębokiej analizy, które potrafi pracować samodzielnie przez wiele godzin marktechpost.com.

Czym jest Sakana Marlin

Marlin to agent badawczy klasy B2B, nie asystent konwersacyjny. Użytkownik podaje mu jeden temat lub pytanie, a system samodzielnie planuje hipotezy, przeszukuje źródła i weryfikuje ustalenia. Pojedyncza sesja może trwać do około 8 godzin i w tym czasie agent wysyła setki, a nawet tysiące zapytań do modeli językowych marktechpost.com.

Efektem pracy jest materiał przygotowany z myślą o osobach decyzyjnych. Japońska wersja komunikatu mówi o raportach liczących dziesiątki stron, angielska — o dokumentach sięgających do około 100 stron. Podczas prasowego pokazu na żywo raporty liczyły 60–100 stron i zawierały 60–80 cytowanych źródeł. Każdy raport składa się z części głównej, bibliografii i załączników. Do generowania slajdów prezentacyjnych Marlin wykorzystuje modele generowania obrazów marktechpost.com.

Przed oficjalnym startem Sakana przeprowadziła zamkniętą betę w kwietniu 2026 roku, w której udział wzięło około 300 specjalistów testujących system na rzeczywistych zadaniach — obejmowały one formułowanie strategii, badania rynku, analizę ryzyka i analizę konkurencji marktechpost.com.

AB-MCTS: szerej czy głębiej?

Technologicznym fundamentem Marlina jest algorytm AB-MCTS (Adaptive Branching Monte Carlo Tree Search), wywodzący się z wcześniejszych badań Sakana opublikowanych pod tytułem „Wider or Deeper? Scaling LLM Inference-Time Compute with Adaptive Branching Tree Search" marktechpost.com.

AB-MCTS traktuje rozumowanie jako problem przeszukiwania drzewa. Na każdym kroku algorytm podejmuje jedną decyzję:

iść szerzej — wygenerować nową odpowiedź-kandydatkę,
iść głębiej — dopracować już istniejącą, obiecującą odpowiedź.

Standardowe metody wielokrotnego próbkowania działają wyłącznie „wszerz" równolegle, licząc, że jedna z odpowiedzi okaże się trafna. AB-MCTS adaptacyjnie wybiera kierunek w zależności od bieżącego stanu wyszukiwania marktechpost.com.

Wariant wielomodelowy dodaje trzecią możliwość: przekierowanie danego kroku do zupełnie innego modelu językowego. W eksperymentach Sakana na zbiorze ARC-AGI-2 takie podejście przyniosło wymierne korzyści — połączenie modeli o4-mini, Gemini 2.5 Pro i DeepSeek-R1 rozwiązało około 27,5% zadań, podczas gdy sam model o4-mini osiągał wynik około 23%. Marlin stosuje tę samą adaptacyjną strategię wyszukiwania do długoterminowych zadań badawczych marktechpost.com.

Drugim kluczowym elementem systemu jest automatyzacja przepływu pracy zaczerpnięta z projektu AI Scientist firmy Sakana — inicjatywy demonstrującej autonomiczne odkrycia naukowe, której wyniki zostały opublikowane w czasopiśmie „Nature" marktechpost.com.

Marlin na tle konkurencji

Marlin konkuruje głębokością analizy, nie szybkością. Typowe narzędzia do pogłębionego wyszukiwania odpowiadają w ciągu minut lub kilkudziesięciu minut. Marlin celowo poświęca wiele godzin, by podnieść jakość wyników. Poniższe zestawienie pokazuje przybliżone czasy działania — nie są to oficjalne dane producentów marktechpost.com:

| Narzędzie | Typowy czas działania | Format wyjścia | Główny odbiorca | |---|---|---|---| | Sakana Marlin | Do ok. 8 godzin | Raport (dziesiątki do ok. 100 stron) + slajdy | Zespoły strategiczne w przedsiębiorstwach | | OpenAI Deep Research | Ok. kilku do kilkudziesięciu minut | Raport tekstowy z cytatami | Użytkownicy ogólni i profesjonalni | | Perplexity Deep Research | Ok. kilku minut | Odpowiedź tekstowa z cytatami | Użytkownicy ogólni | | Google Gemini Deep Research | Ok. kilku minut | Raport tekstowy z cytatami | Użytkownicy ogólni i biznesowi |

Kompromis jest tu wyraźny: użytkownik czeka dłużej i płaci za każdą sesję, w zamian otrzymując znacznie obszerniejszy i głębiej udokumentowany materiał marktechpost.com.

Co to oznacza

Pojawienie się Marlina sygnalizuje wyraźny podział rynku narzędzi AI do badań: z jednej strony szybkie asystenty odpowiadające w minuty, z drugiej — agenty działające godzinami i dostarczające materiał gotowy do prezentacji zarządowi. Sakana świadomie celuje w tę drugą niszę, oferując produkt, który ma zastąpić tygodnie pracy analityków strategicznych.

Dla polskich firm i działów strategii oznacza to, że tego rodzaju narzędzia zaczynają wychodzić poza fazę eksperymentalną i trafiają do oferty komercyjnej z konkretnymi zastosowaniami: analizą rynku, oceną ryzyka czy badaniem konkurencji. Partnerstwa z instytucjami finansowymi tej rangi co MUFG i Citigroup sugerują, że sektor bankowy i doradczy będzie wśród pierwszych, którzy wdrożą podobne rozwiązania na szeroką skalę marktechpost.com.

Warto też zwrócić uwagę na architekturę techniczną: AB-MCTS pokazuje, że łączenie kilku modeli językowych w ramach jednego przepływu wnioskowania może dawać lepsze wyniki niż poleganie na jednym, nawet bardzo mocnym modelu. To podejście — orkiestracja wielu modeli zamiast wyścigu o jeden najlepszy — może stać się dominującym wzorcem w kolejnych generacjach agentów AI dla przedsiębiorstw marktechpost.com.

Szerszy kontekst

Sakana AI uruchomiło Marlin 15 czerwca 2026 roku – autonomicznego agenta badawczego B2B, który nie tylko generuje odpowiedzi. Analizuje problem w oparciu o setki do tysięcy iteracyjnych zapytań, działając przez maksymalnie osiem godzin przed dostarczeniem końcowego wyniku. Sakana AI podaje, że system produkuje raporty liczące od 60 do 100 stron, cytując od 60 do 80 źródeł, zgodnie z opisem produktu firmy.

techjacksolutions.com

Należy koniecznie zaznaczyć, że Sakana Marlin zdecydowanie nie jest narzędziem dla ogólnych konsumentów; jest to komercyjna oferta oprogramowania jako usługi (SaaS) ograniczona do podmiotów korporacyjnych, organizacji i jednoosobowych działalności gospodarczych.

venturebeat.com

Marlin to nie kolejny asystent do głębokiego badania. Jest bezpośrednim wdrożeniem produkcyjnym kluczowych przełomów naszego zespołu, w tym naszej pracy nad AB-MCTS (wyróżnienie NeurIPS 2025) oraz The AI Scientist (opublikowanego w Nature). Zamiast generować tekst w sekundy, skupiamy się na długoterminowym, próbkooszczędnym rozumowaniu. Marlin skaluje obliczenia w czasie wnioskowania, aby wykonywać do 8 godzin ciągłego, autonomicznego rozumowania. Formułuje hipotezy, nawiguje po sieci, rozwiązuje sprzeczności i dostarcza wyczerpujące, eksperckie raporty strategiczne oraz ustrukturyzowane slajdy.

x.com

Połączenie modeli o4-mini, Gemini 2.5 Pro i DeepSeek-R1 rozwiązało około 27,5% zadań. Sam model o4-mini rozwiązał około 23%. Marlin stosuje to samo adaptacyjne przeszukiwanie do długoterminowych badań.

marktechpost.com

Analiza

Sakana Marlin to pierwszy komercyjny produkt tokijskiego laboratorium, które dotychczas było znane wyłącznie z publikacji naukowych — w tym pracy o AB-MCTS wyróżnionej jako Spotlight na NeurIPS 2025 oraz projektu AI Scientist opublikowanego w „Nature" (wg x.com). Przejście od badań do produktu SaaS dla przedsiębiorstw jest tu krokiem strategicznym: Sakana nie próbuje konkurować z OpenAI czy Google na polu szybkości, lecz zajmuje niszę wielogodzinnej, głębokiej analizy strategicznej, której wynikiem jest materiał gotowy do prezentacji zarządowi. Warto podkreślić, że choć fundamenty techniczne AB-MCTS są niezależnie weryfikowalne jako opublikowane badania, to twierdzenia o jakości raportów generowanych przez Marlina pozostają na razie wyłącznie deklaracjami producenta — żadne niezależne dane porównawcze jeszcze nie istnieją (wg techjacksolutions.com).

Kluczowym elementem architektury jest wielomodelowa orkiestracja: AB-MCTS nie polega na jednym modelu granicznym, lecz dynamicznie kieruje kolejne kroki wnioskowania do różnych systemów — o4-mini, Gemini 2.5 Pro lub DeepSeek-R1 — w zależności od tego, który w danym momencie rokuje lepiej. Bayesowski mechanizm decyzyjny rozstrzyga, czy warto eksplorować nową gałąź hipotez, czy dopracowywać już obiecującą ścieżkę (wg venturebeat.com). W eksperymentach na zbiorze ARC-AGI-2 takie podejście podniosło skuteczność z około 23% dla samego o4-mini do około 27,5% dla kombinacji trzech modeli. To istotny sygnał dla całej branży: przewaga konkurencyjna w kolejnej generacji agentów dla przedsiębiorstw może wynikać nie z posiadania najlepszego pojedynczego modelu, lecz z umiejętności ich inteligentnego łączenia.

Dla rynku polskiego i szerzej europejskiego znaczenie Marlina leży przede wszystkim w tym, że wyznacza nowy punkt odniesienia dla kategorii „ultra deep research" jako oferty komercyjnej, a nie eksperymentu. Produkt jest dostępny wyłącznie dla podmiotów korporacyjnych w modelu SaaS (wg venturebeat.com), co oznacza, że jego wdrożenie wymaga świadomej decyzji zakupowej, a nie jedynie rejestracji konta. Działy strategii, analitycy ryzyka i zespoły M&A w bankach czy firmach doradczych będą naturalnymi pierwszymi odbiorcami — szczególnie że Sakana już na etapie zamkniętej bety w kwietniu 2026 roku testowała system właśnie na zadaniach z zakresu analizy konkurencji, badań rynku i oceny ryzyka.

Opracowanie: Klonika.pl

Źródła

Powiązane newsy

Zdjęcie: Murun. E · Pexels