Zaskakująco niedrogie modele AI Deepseeka rzuca wyzwanie gigantom branżowym. Chiński startup twierdzi, że wyszkolił swoje potężne głębokie miejsce V3
za zaledwie 6 milionów dolarów, wykorzystując tylko 2048 GPU, znacząco podcinając konkurentów. To pozornie tani koszty zaprzecza jednak znacznie większej inwestycji.
Innowacyjna architektura Deepseek V3 przyczynia się do jej wydajności. Kluczowe technologie obejmują prognozę wielofunkcyjną (MTP) do jednoczesnej prognozy słów, mieszanki ekspertów (MOE) z wykorzystaniem 256
s oraz wielopogowałą utajoną uwagę (MLA) w celu zwiększenia skupienia się na kluczowych elementach zdań.
obraz: engame.com
Jednak bliższe spojrzenie ujawnia znaczną inwestycję w infrastrukturę. Semianaliza odkryła wykorzystanie Deepeek w wysokości około 50 000 GPU Nvidia Hopper, o łącznej wartości kosztów serwera około 1,6 miliarda dolarów i 944 miliony dolarów na wydatki operacyjne. Kontrastuje to ostro z początkowym roszczeniem o koszty szkolenia w wysokości 6 milionów dolarów, które uwzględnia tylko korzystanie z GPU przed treningiem, z wyłączeniem badań, udoskonalania, przetwarzania danych i ogólnej infrastruktury.
Sukces Deepseek wynika z jego niezależnej struktury, umożliwiając szybkie innowacje i wydajne alokacja zasobów. Firma, spółka zależna od funduszu hedgingowego o wysokiej zawartości flyer, jest właścicielem swoich centrów danych, w przeciwieństwie do konkurentów w chmurze. Ponadto jego wysokie pensje przyciągają najlepsze talenty chińskich uniwersytetów. Całkowita inwestycja Deepseek w rozwój sztucznej inteligencji przekracza 500 milionów dolarów.
Podczas gdy „przyjazne budżecie” roszczenia Deepseeka jest mylące, jego opłacalność w stosunku do konkurentów pozostaje godna uwagi. Model firmy R1 kosztował 5 milionów dolarów na szkolenie, w porównaniu do 100 milionów dolarów Chatgpt4. Przykład Deepseek pokazuje potencjał dobrze finansowanej, zwinnej firmy AI do skutecznego konkurowania z uznanymi graczami, pomimo przesadzania jej początkowych roszczeń kosztów. Rzeczywistość jest znaczącą inwestycją, postępem technologicznym i wykwalifikowana siła robocza są kluczem do jej sukcesu.