DeepSeek-V4 może zmienić globalny wyścig modeli AI
Nowe, otwartoźródłowe modele V4 firmy DeepSeek łączą obsługę długiego kontekstu ze znacznie niższą ceną, co wzmacnia pozycję chińskiego startupu w globalnym wyścigu AI. Premiera sygnalizuje również zwrot w kierunku sprzętu Huawei, gdy Chiny dążą do zmniejszenia zależności od Nvidii.

Nowo uruchomiony model AI firmy DeepSeek pokazuje, w jaki sposób koncentracja chińskiego startupu na otwartym oprogramowaniu i niższych kosztach może pomóc Chinom w postępach w geopolitycznym wyścigu AI, zwłaszcza gdy dostawca zaczyna uniezależniać się od amerykańskiego giganta w dziedzinie chipów AI, firmy Nvidia.
DeepSeek udostępnił DeepSeek-V4 w wersji preview 24 kwietnia. Model open source może przetwarzać dłuższe prompty niż poprzednie modele DeepSeek. Jest to również najważniejsza premiera startupu od czasu wprowadzenia modelu R1 w styczniu 2025 roku, który zaskoczył rynek AI swoimi zdolnościami rozumowania i niską ceną.
DeepSeek-V4 występuje w dwóch wersjach: V4-Pro oraz V4-Flash. V4-Pro jest większy i posiada łącznie 1,6 biliona parametrów, natomiast V4-Flash to wersja o wysokiej szybkości działania z 284 miliardami parametrów. Obie wersje obsługują kontekst o długości do 1 miliona tokenów, co czyni je porównywalnymi w scenariuszach długiego kontekstu z Google Gemini i Claude firmy Anthropic. Modele są projektowane z myślą o długoterminowym rozumowaniu, programowaniu oraz przepływach pracy agentowych.
Czynnik kosztowy
DeepSeek pozycjonuje V4 jako tańszą alternatywę dla wiodących modeli frontier.
- V4-Pro: 1,74 USD za milion tokenów wejściowych i 3,48 USD za milion tokenów wyjściowych
- V4-Flash: 0,14 USD za milion tokenów wejściowych i 0,28 USD za milion tokenów wyjściowych
Dla porównania:
- Gemini 3.1 Pro: 2 USD za milion tokenów wejściowych i 12 USD za milion tokenów wyjściowych
- GPT 5.5: 5 USD za milion tokenów wejściowych i 30 USD za milion tokenów wyjściowych
- Claude Opus 4.7: 5 USD za milion tokenów wejściowych i 25 USD za milion tokenów wyjściowych
"Ceny tokenów stanowią jedną trzecią cen laboratoriów frontier" — powiedział Kashyap Kompella, dyrektor generalny RPA2AI Research. "Taki poziom cen może zmienić zachowania zakupowe."
Kompella dodał, że choć modele DeepSeek mogą pozostawać w tyle za rozwiązaniami frontier od OpenAI, Google czy Anthropic o trzy do sześciu miesięcy, luka wydajnościowa może mieć mniejsze znaczenie, jeśli różnica kosztów jest znacząca.
"Przedsiębiorstwa nie zawsze potrzebują absolutnie najlepszego modelu do wszystkich zastosowań" — powiedział Kompella. "Potrzebują wystarczająco dobrej wydajności, przewidywalnych kosztów i kontroli. DeepSeek zmusza zachodnie laboratoria frontier do innowacji w zakresie kosztów, a nie tylko możliwości modeli."
Odchodzenie od Nvidii
Seria V4 oznacza również istotną zmianę w strategii sprzętowej DeepSeek. Modele są zoptymalizowane pod kątem wnioskowania na superwęźle Ascend chińskiego producenta chipów Huawei. Wcześniejsze modele, takie jak V3, były trenowane na układach Nvidia H800. Donosi się, że V4-Flash jest częściowo trenowany na sprzęcie Huawei, podczas gdy V4-Pro nadal polegał na Nvidii ze względu na swoje rozległe wymagania obliczeniowe.
Partnerstwo przynosi korzyści obu firmom, według Lian Jye Su, analityka w Omdia, oddziale Informa TechTarget. Huawei miał trudności z uzyskaniem większej popularności dla własnej serii modeli Pangu.
"Możliwość natywnego wsparcia DeepSeek i zaprezentowania całkiem rozsądnej wydajności to bardzo zaawansowane osiągnięcie" — powiedział Su. "Pozwala to Chinom zyskać nieco większy szacunek ze strony innych dostawców."
Su dodał, że kraje przyjazne Chinom mogą stać się bardziej otwarte na przyjmowanie innych chińskich produktów, biorąc pod uwagę, że Chiny wydają się przezwyciężać ograniczenia i restrykcje w porównaniu z sytuacją sprzed 12 miesięcy. Zauważył jednak, że Huawei nadal pozostaje w tyle za Nvidią i szerszym globalnym ekosystemem AI w zakresie produkcji chipów i rozwoju oprogramowania.
Zaangażowanie w open source
Przywiązanie DeepSeek do open source ma również znaczenie geopolityczne. Podczas gdy amerykańscy dostawcy, tacy jak Meta i OpenAI, wcześniej przyjmowali podejście open source, w dużej mierze od niego odeszli. Open source może stanowić główny wyróżnik DeepSeek.
"Open source pomaga im przyciągać deweloperów, budować zaufanie i tworzyć ekosystem" — powiedział Kompella, dodając, że jest to również korzystne na rynku chińskim.
Inni chińscy dostawcy, w tym Alibaba, Kimi, Qwen i Minimax, również oferują modele z otwartymi wagami. Su określił open source jako zasadniczo strategię komercyjną, ale stwierdził, że jest ona wpisana w podejście DeepSeek, a nie stanowi tymczasowej taktyki przed przejściem na modele zamknięte.
Open source daje również Chinom szansę wrażliwym cenowo rynkom poza USA.
"Pozwala to również Chinom wpływać na globalne rynki AI bez konieczności posiadania każdej warstwy aplikacyjnej" — powiedział Kompella.
Stopniowe odchodzenie DeepSeek od Nvidii wpisuje się w szerszy cel chińskiego rządu, jakim jest ograniczenie zależności od zachodnich dostawców. Jednak zachodnie przedsiębiorstwa pozostają ostrożne.
"W obozie zachodnim istnieją obecnie poważne zastrzeżenia wobec przyjmowania jakichkolwiek rozwiązań open source z Chin" — powiedział Su. "Duże przedsiębiorstwa, zwłaszcza z sektorów krytycznych, w dużej mierze sprzeciwiają się wyborowi chińskich modeli lub całkowicie ich unikają, głównie ze względu na kontrolę ze strony rządów."
Mimo to dla przedsiębiorstw już korzystających z produktów Huawei modele V4 mogą być warte rozważenia. Dla pozostałych połączenie niskich kosztów i strategii open source DeepSeek może mieć wpływ na kształtowanie kolejnej fazy globalnej konkurencji w dziedzinie AI.
"Globalny wyścig AI dotyczy tego, kto potrafi dostarczać inteligencję na dużą skalę, przy niskich kosztach, w oparciu o suwerenny stos technologiczny" — powiedział Kompella.