DeepSeek to dopiero początek. Alibaba wypuszcza swoją AI – Qwen 2.5

Chińska firma DeepSeek zaskoczyła świat, wprowadzając na rynek swój model sztucznej inteligencji. R1, bo tak został nazwany, wyróżnia się wysoką efektywnością i niskimi kosztami. Media określiły go jako bezpośrednią konkurencję dla ChataGPT. Jednak Chińczycy nie poprzestają na jednym rozwiązaniu. Swoją własną AI planuje wypuścić także Alibaba.

DeepSeek – przełom w chińskiej sztucznej inteligencji

W 2023 roku Liang Wenfeng, współzałożyciel funduszu hedgingowego High-Flyer, założył firmę DeepSeek. Zaledwie dwa lata później jego zespół zaprezentował model sztucznej inteligencji, którego koszt produkcji wyniósł ok. 6 mln dolarów. To zaledwie ułamek wydatków ponoszonych przez amerykańskie firmy technologiczne, takie jak OpenAI czy Meta, co pokazuje rosnącą konkurencyjność chińskiej AI.

Sukces DeepSeek wywołał poruszenie na globalnych rynkach finansowych. Inwestorzy zaczęli kwestionować konieczność ogromnych inwestycji w infrastrukturę obliczeniową. Doprowadziło to do spadku wartości akcji amerykańskich gigantów technologicznych (w przypadku Nvidii o ok. 17 proc.). DeepSeek stał się poważnym konkurentem dla OpenAI i innych liderów w branży AI.

Jednak chińska sztuczna inteligencja nie jest doskonała. Użytkownicy wskazują, że unika odpowiedzi na pytania związane z polityką Chin, co sugeruje obecność mechanizmów cenzury wbudowanych w system.

Polecamy: Masz nowe powiadomienie. Ludzie sami kręcą na siebie cyfrowy bat

Qwen 2.5. Odpowiedź Alibaby

DeepSeek nie jest jedyną chińską AI. Własny model opracowała również firma Alibaba. Jej sztuczna inteligencja, Qwen 2.5, według komunikatu opublikowanego na platformie WeChat ma mieć lepsze osiągi niż rozwiązania konkurencji. Nad własną AI pracuje także ByteDance, właściciel TikToka. Co łączy Qwen i projekt ByteDance? Przekonanie, że przewyższają możliwościami swoje zachodnie odpowiedniki. Czy rzeczywiście tak jest? Trudno powiedzieć. Wiadomo na pewno, że nakłady na działanie ChataGPT są astronomiczne.

Szacuje się, że dzienne koszty operacyjne ChataGPT wynoszą ok. 700 tys. dolarów. Obejmują one wydatki na infrastrukturę serwerową oraz zużycie energii elektrycznej. Tak wysokie sumy wynikają z konieczności wykorzystania zaawansowanego sprzętu, takiego jak serwery wyposażone w procesory graficzne, oraz z dużego zużycia energii podczas przetwarzania danych. Ponadto każde zapytanie do ChataGPT to oddzielny wydatek.

Qwen: ściana kart graficznych
Fot. BrianPenny / Pixabay

Efektywność kosztowa modelu DeepSeek-R1

Koszty operacyjne związane z działaniem modelu DeepSeek-R1 są znacznie niższe niż w przypadku innych modeli AI. Cena przetwarzania 1 mln tokenów wejściowych wynosi 0,55 dolara, a 1 mln tokenów wyjściowych – 2,19 dolara.

Tokeny to jednostki tekstu, na które model dzieli dane wejściowe i wyjściowe podczas przetwarzania języka naturalnego. Mogą to być pojedyncze słowa, fragmenty słów lub znaki interpunkcyjne – zależy to od sposobu tokenizacji stosowanego przez dany model.

Niektóre źródła sugerują jednak, że podawane koszty opracowania chińskiej AI mogą nie uwzględniać wszystkich wydatków, takich jak wczesne badania i eksperymenty. Może to oznaczać, że rzeczywiste nakłady finansowe były wyższe. Nie znamy na przykład kosztów opracowania modelu AI Alibaby. Wiadomo jedynie, że został on wytrenowany na ponad 20 bln tokenów. Sugeruje to, że firma zainwestowała znaczące środki w zasoby obliczeniowe niezbędne do jego rozwoju.

Generowanie każdej odpowiedzi przez model ChatGPT wiąże się z konkretnymi kosztami operacyjnymi. Szacuje się, że pojedyncze zapytanie kosztuje średnio ok. 0,36 dolara. Te koszty obejmują zużycie energii elektrycznej oraz wykorzystanie zaawansowanej infrastruktury serwerowej niezbędnej do przetwarzania i generowania odpowiedzi.

Sukces DeepSeek pokazuje, że możliwe jest opracowanie konkurencyjnych modeli przy znacznie niższych nakładach. Być może OpenAI i inne firmy z branży będą musiały obniżyć ceny.

„OpenAI będzie musiało obniżyć ceny, aby pozostać konkurencyjne, ale trudno wyobrazić sobie osiągnięcie rentowności w tych okolicznościach. Oczywiście ostatecznie [przedsiębiorstwo] opracuje tańsze modele, ale znaczna część struktury kosztów dotyczy siły roboczej, na której trudno będzie zaoszczędzić. Ciężko też sobie wyobrazić, w jaki sposób firma osiągnie swój wzniosły cel 100 mld dolarów przychodów przy obniżkach cen zamiast podwyżek; może to spowodować, że inwestorzy będą wzbraniać się przed przyznaniem OpenAI setek miliardów dolarów dodatkowego finansowania, które według niego samego są potrzebne” – pisał Anthony Schiavo, analityk w firmie badawczej Lux Research.

Polecamy: AI w pracy to codzienność millenialsów. To oni napędzają rewolucję

Opublikowano przez

Mateusz Tomanek

Autor


Krakus z urodzenia, wyboru i zamiłowania. Uprawiał dziennikarstwo radiowe, telewizyjne, by ostatecznie oddać się pisaniu dla Holistic.news. W dzień dziennikarz naukowy, w nocy zaprawiony muzyk, tekściarz i kompozytor. Jeśli nie siedzi przed komputerem, to zapewne ma koncert. W jego kręgu zainteresowań znajduje się technologia, ekologia i historia. Nie boi się podejmować nowych tematów, ponieważ uważa, że trzeba uczyć się przez całe życie.

Chcesz być na bieżąco?

Zapisz się na naszą listę mailingową. Będziemy wysyłać Ci powiadomienia o nowych treściach w naszym serwisie i podcastach.
W każdej chwili możesz zrezygnować!

Nie udało się zapisać Twojej subskrypcji. Proszę spróbuj ponownie.
Twoja subskrypcja powiodła się.