Tammikuun 27. päivänä 2025 rahoitusmarkkinoita ja tekoälyalaa ravisteli järistys. Kiinalainen startup-yritys DeepSeek on kehittänyt avoimen lähdekoodin kustannustehokkaan tekoälymallin, joka on saanut jotkut analyytikot skeptisiksi, mutta joka saattaa uhata satojen miljardien sijoituksia tekoälyinfrastruktuuriin.
Uusi uhka tekoälyjättiläisille?
Start-up-yritys DeepSeek esitteli hiljattain DeepSeek-V3-mallinsa, joka on älykäs avustaja pystyen kilpailemaan markkinoiden parhaiden ratkaisujen, kuten OpenAI:n ChatGPT:n, kanssa. Suorituskyvyn lisäksi tämän mallin erottaa muista sen huomattavan alhaiset kehityskustannukset, jotka ovat arviolta 5-6 miljoonaa dollaria - murto-osa länsimaisten yritysten, kuten OpenAI:n tai Metan, investoimista summista. Vaikutus osakemarkkinoihin oli välitön, sillä se vaikutti Nvidian (-17 % ja lähes 600 miljardin dollarin menetys markkina-arvossa) ja Broadcomin (-17 %) kaltaisten puolijohdejättien lisäksi myös palveluntarjoajiin, kuten Oracleen (-14 %), ja datakeskusten infrastruktuurin tarjoajiin, kuten Cisco (-5 %).
Avoimen lähdekoodin malli, joka voi sekoittaa pakan uudelleen.
Yksi DeepSeek-V3:n silmiinpistävimmistä piirteistä on sen avoimuus. Toisin kuin useimmat kilpailijansa, DeepSeek on päättänyt antaa mallinsa vapaasti käytettäväksi ja muokattavaksi yhden avoimimmista avoimen lähdekoodin lisenssin mukaisesti. Tämä päätös voi muuttaa tekoälyekosysteemiä radikaalisti mahdollistaen sen, että monet toimijat Kiinan rajojen ulkopuolella voivat hyötyä tästä teknologisesta läpimurrosta. Historialliset ennakkotapaukset (IBM:n PC-yhteensopivat standardit 1980-luvulla, Mozilla Firefox -verkkoselain 2000-luvulla, Android-käyttöjärjestelmä 2010-luvulla) osoittavat, että avoimet arkkitehtuurit ovat usein edistäneet innovointia ja vähentäneet samalla uusien tulokkaiden markkinoille pääsyn esteitä.
AI-suorituskykymallit kyseenalaistettu
DeepSeekin ilmoitus kyseenalaistaa vallitsevan oletuksen, jonka mukaan tekoälymallien suorituskyky paranee parametrien, mallin harjoitteluun käytettävän datan ja laskentatehon lisääntyessä. Jos DeepSeekin malli vahvistuu ja se otetaan laajasti käyttöön alalla, suuri osa tällä hetkellä rakennettavasta massiivisesta tekoälyinfrastruktuurista voisi päätyä ylikapasiteetiksi, mikä aiheuttaisi hintojen laskua ja tekoälyinvestointistrategioiden uudelleenarviointia. Puolijohde-, pilvipalvelu- ja datakeskusteollisuudelle panokset ovat suuret. Huippuluokan laitteiden kysynnän väheneminen voi aiheuttaa ylikapasiteettikriisin, joka johtaa koko tekoälyn arvoketjun uudelleenarviointiin.
Osakemarkkinat: suurempi lyhyen aikavälin volatiliteetti
Lyhyellä aikavälillä markkinoiden pitäisi varautua epävakauteen, kun sijoittajat arvioivat tekoälyyn osallistuvien yritysten arvostukset uudelleen. Nvidian, Broadcomin ja ASML:n kaltaisten teknologiajättien, jotka ovat huippuluokan puolijohdeteknologioiden huipputoimittajia, arvo saattaa laskea pysyvästi. Riskit eivät kuitenkaan rajoitu vain pörssiyhtiöihin. Myös pääomasijoitusrahastoihin ja institutionaalisiin sijoittajiin, jotka ovat viime vuosina sijoittaneet paljon tekoälyyn, kohdistuu paineita. Meidän on kuitenkin eriytettävä vaikutukset ajallisesti. Vaikka korjausliike on lyhyellä aikavälillä väistämätön, se voi keskipitkällä aikavälillä luoda suotuisamman ympäristön innovoinnille, koska se edistää edullisempia ja kohdennetumpia tekoälymalleja.
Geopolitiikka: haaste USAn vaikutukselle
DeepSeekiä mainostetaan Yhdysvaltojen ja Kiinan välisen teknologisen kilpailun taustalla. Sen perustaja Liang Wenfeng ylläpitää tekoälykeskusta Hangzhoussa, Kiinassa, ja hän tapasi äskettäin Kiinan pääministerin Li Qiangin. DeepSeekin säästeliäs lähestymistapa ja sen saama mediahuomio voidaankin nähdä strategisena vastauksena Kiinan kasvaviin rajoituksiin saada Yhdysvalloista kehittynyttä teknologiaa. Halvemmat tekoälymallit vähentäisivät merkittävästi Yhdysvaltojen rajoitusten vaikutusta Kiinan tekoälyekosysteemiin, joka on historiallisesti nojautunut vahvasti yhdysvaltalaiseen teknologiaan (DeepSeekin sanotaan itse koulutetun Nvidian edistyksellisillä, mutta ei huippuluokan siruilla). Niistä voisi olla hyötyä myös sellaisille maailman alueille, kuten Euroopalle, jotka ovat erittäin kiinnostuneita tekoälysovelluksista mutta joiden tekoälyinfrastruktuuri on rajallinen.
Näiden ensimmäisten ilmoitusten lisäksi meidän on kuitenkin kyseenalaistettava DeepSeekin mahdolliset rajoitukset, erityisesti aliarvioidut kustannukset, jotka liittyvät tietojen puhdistamiseen, verkkolaitteisiin, energiankulutukseen, tekoälyinsinöörien palkkoihin ja avoimen lähdekoodin resursseihin. Näin ollen mallin rakentamisen kokonaiskustannukset ovat todennäköisesti väitettyä korkeammat.