
De nieuwe generatie taalmodellen van DeepSeek, de Chinese startup uit Hangzhou, is uitgegroeid tot een van de meest besproken ontwikkelingen op het gebied van kunstmatige intelligentie. Hun serie DeepSeek V4 barst in In een tijd van overvloed aan aanbiedingen en beloftes, maar met een zeer duidelijke boodschap: het bieden van topniveau op het gebied van redenering en agenten, met een enorm contextvenster en, bovenal, met aanzienlijk lagere gebruikskosten dan de Amerikaanse concurrenten.
Deze lancering is geen op zichzelf staande gebeurtenis. Het vindt slechts enkele dagen na plaats. nieuwe versies van ChatGPT en andere gesloten modellenEn te midden van China's voortdurende inspanningen om zijn technologische afhankelijkheid van het Westen te verminderen, combineert DeepSeek V4 een open source strategieAgressieve prijsstelling en een nauwe samenwerking met Huawei op hardwaregebied zouden de machtsverhoudingen kunnen veranderen voor Europese bedrijven die op zoek zijn naar goedkopere en beter beheersbare alternatieven.
Wat is DeepSeek V4 en hoe is het gebouwd?
De DeepSeek V4-familie bestaat uit Mixture-of-Experts (MoE) taalmodellen Ontworpen om zeer efficiënt te zijn in langetermijncontexten. Het bedrijf spreekt over een hoofdmodel met ongeveer 1 biljoen totale parameterswaarbij slechts een fractie in elk token wordt geactiveerd, en een nog ambitieuzere versie, V4-Pro, die het hoogste niveau bereikt. 1,6 biljoen parameters, met ongeveer 49.000 miljard aan activa per zoekopdracht.
De sleutel tot DeepSeek's MoE-aanpak is dat, hoewel het totale aantal parameters enorm is, er slechts tientallen miljarden worden geactiveerd bij elke inferentiestap. Dit maakt het mogelijk om... De kosten van computergebruik en geheugen drastisch verlagen. vergeleken met dichte modellen van vergelijkbare grootte. Sommige technische documenten vermelden ongeveer 37.000 miljard actieve parameters per token In een van de varianten sluit dit aan bij het idee van extreme efficiëntie zonder in te leveren op prestaties.
Twee varianten: V4-Pro en V4-Flash voor verschillende behoeften.
DeepSeek heeft zijn aanbod onderverdeeld in twee hoofdmodellen: V4-Pro en V4-FlashDe V4-Pro is het topmodel, met de eerder genoemde 1,6 biljoen parameters en een focus op diepgaand redeneren, wereldwijde kennis en handelingsvermogenmet name bij programmeer- en complexe analysetaken.
Van haar kant, De V4-Flash wordt gepresenteerd als de lichte en snelle versie.Het heeft in totaal ongeveer 284.000 miljard parameters en ongeveer 13.000 miljard actieve parameters, en het houdt ook een contextvenster bij. tot één miljoen tokensHet is ontworpen voor grootschalige implementaties, waarbij de kosten per token, latentie en schaalbaarheid belangrijker zijn dan het maximaliseren van de prestatieverbeteringen.
Deze Pro/Flash-dualiteit heeft meer dan Een commerciële strategie die verder gaat dan louter technische differentiatie.V4-Pro is gericht op grote bedrijven, laboratoria en toepassingen waar de hoogst mogelijke prestaties vereist zijn; V4-Flash daarentegen is bedoeld als het "werkpaard" voor mkb's, startups en grootschalige dienstverlening die behoefte hebben aan competente en betaalbare AI.
De context van een miljoen tokens: welke veranderingen in het daadwerkelijke gebruik?
Een van de meest opvallende kenmerken van DeepSeek V4 is zijn ultralang contextvenster van maximaal één miljoen tokensDit is aanzienlijk meer dan de 128.000 tokens die gebruikelijk zijn in veel huidige bedrijfsmodellen. In de praktijk betekent dit dat je kunt werken met honderdduizenden woorden in één zoekopdracht: complete technische handleidingen, grote code repositories, juridische of historische klantenservicegegevens, zonder dat deze hoeven te worden opgesplitst.
Naast het figuur kan deze bredere context Verminder de kosten en fouten die ontstaan ​​door het splitsen van documenten.Er zijn minder API-aanroepen nodig, er is minder risico op informatieverlies tussen scans en het ontwerp van producten die afhankelijk zijn van grote hoeveelheden tekst wordt aanzienlijk vereenvoudigd. DeepSeek presenteert het model niet zozeer als een simpele chatbot, maar als een projectassistent of een agent die in staat is taken te plannen en in de juiste volgorde uit te voeren op grote datasets.
In Europa en Spanje is dit soort context bijzonder interessant voor sectoren zoals juridische, financiële, advies-, openbare administratie- of gezondheidszorgsectorwaarbij het gebruikelijk is om zeer uitgebreide documentatie te verwerken. De uitdaging zal zijn om te controleren of het model die capaciteit behoudt. redelijke latentie en een echt concurrerende prijs per miljoen tokens. in productieomgevingen.
Redeneervermogen en agenten: de gok om te concurreren met gesloten systemen
DeepSeek beweert dat de V4-Pro Het presteert beter dan de meeste huidige cabrioletmodellen. Bij tests van algemene kennis en redeneervermogen blijft het slechts iets achter bij enkele van de beste closed-source modellen, zoals de nieuwste versies van Gemini. Op het gebied van geavanceerd redeneervermogen claimt het bedrijf gelijkwaardig te zijn aan premium oplossingen van OpenAI en Anthropic.
Op het gebied van agenten en gekoppelde takenDeepSeek V4 is ontworpen om meer te zijn dan alleen een tekstgenerator. Het bedrijf gebruikt V4-Pro intern al voor Computerondersteund programmeren, workflowautomatisering en complexe analyses, met het idee dat het model subtaken op een relatief autonome manier kan plannen, uitvoeren en verifiëren.
Voor Spaanse bedrijven die zich bezighouden met procesautomatisering, softwareontwikkeling of data-intensieve backofficeDe combinatie van sterke argumentatie, een lange context en lage kosten kan aantrekkelijk zijn. Het werkelijke volwassenheidsniveau van V4-agenten en hun robuustheid in het Spaans Dit zijn aspecten die nog door onafhankelijke tests moeten worden geëvalueerd.
Open source versus gesloten modellen: de impact voor Europa
De V4-serie wordt gepresenteerd als open model met vroege toegangDeepSeek heeft V4-Pro en V4-Flash uitgebracht op platforms zoals Hugging Face in previewmodus, waardoor testen mogelijk is zowel in de eigen chat als via de API. Sommige varianten vermelden een MIT-achtige licentie Dit zou de weg vrijmaken voor lokale downloads en implementaties zonder de gebruikelijke beperkingen van veel bedrijfsmodellen.
Deze aanpak gaat rechtstreeks in tegen de strategie van gesloten Silicon Valley-modellenEn gezien de aanhoudende discussies over hoe open source, waar toegang vaak is gekoppeld aan API-contracten, specifieke cloudproviders en hogere prijzen, afgesloten moet worden, zouden veel Europese bedrijven hun afhankelijkheid van Amerikaanse leveranciers wel eens kunnen heroverwegen als DeepSeek V4 bevestigt dat het prestatieverschil tussen open en gesloten source vrijwel nihil is geworden.
In de EU-regelgeving, die gekenmerkt wordt door de AI-wetgeving en strikte eisen met betrekking tot datasoevereiniteitHet beschikken over krachtige modellen die zowel lokaal als in Europese clouds kunnen draaien zonder de controle over de informatie te verliezen, wordt een cruciale factor. Chinese open source roept echter ook politieke en vertrouwensvraagstukken op die overheden en grote bedrijven zorgvuldig zullen moeten overwegen.
Alliantie met Huawei en alternatieve hardware voor NVIDIA
Een van de meest delicate onderdelen van DeepSeek V4 is de wijziging in de hardwarebasisNa controverses over het gebruik van NVIDIA H800 GPU's en zelfs beschuldigingen over het gebruik van verboden Blackwell-chips, heeft het bedrijf de banden met Huawei aangehaald om zijn blootstelling aan Amerikaanse sancties te verminderen.
Kort na de aankondiging van V4 maakte Huawei officieel bekend dat het zijn Ascend-chips en supernode-systemen om de inferentietaken van DeepSeek uit te voeren. Daarbij springen de accelerators eruit. Atlas 350 aangedreven door Ascend 950PR-processorsdie specifiek zijn geoptimaliseerd voor dit type MoE-model en die al worden verkocht als lokaal alternatief voor op NVIDIA gebaseerde infrastructuur.
In de technische documentatie van V4 wordt melding gemaakt van de ontwikkeling van Kernels aangepast voor zowel Huawei-hardware als NVIDIA GPU's.Deze dubbele compatibiliteit zou het bedrijf in staat stellen potentiële westerse blokkades te overleven en tegelijkertijd te profiteren van de kracht van het Chinese chipecosysteem. Voor Europa opent deze stap de deur naar een krachtig AI-aanbod dat niet volledig afhankelijk is van de Noord-Amerikaanse toeleveringsketen, hoewel het gebruik van hardware uit China ook onder de loep zal worden genomen vanuit het perspectief van... cyberbeveiliging en strategische afhankelijkheid.
Prijsstrategie: de impact op de kosten per miljoen tokens
DeepSeek heeft zich lange tijd gepositioneerd als de "goedkope redenering" optieHet bedrijf deed dit al met zijn R1-model en versterkt deze toezegging nu met V4. Volgens schattingen van het bedrijf zelf en van API-aanbieders die het model al testen, zouden de inferentiekosten ongeveer kunnen bedragen. $0,30 per miljoen tokens, aanzienlijk lager dan wat veel premium westerse diensten in rekening brengen.
DeepSeek stelt bovendien dat voor de Flash-variant het volgende geldt: Het zal vergelijkbare tarieven hanteren als het V2-model. Gelanceerd in 2024, en heeft zelfs gehint op mogelijke prijsstijgingen. in de tweede helft van 2026 nog verder dalen....naarmate de Ascend 950PR supernodes van Huawei op grote schaal worden ingezet. Deze aankondiging heeft onmiddellijke gevolgen gehad voor de De Chinese aandelenmarkt geeft een impuls aan lokale halfgeleiderbedrijven..
In de praktijk betekent deze prijsstructuur dat een Spaans bedrijf dat omvangrijke juridische documenten, financiële overzichten of grote hoeveelheden klantinteracties verwerkt, kan blijven opereren met veel hogere marges in vergelijking met de resultaten die met duurdere API's zijn behaald. Het valt echter nog te bezien of deze tarieven standhouden zodra V4 de previewfase verlaat en of een deel van de besparingen teniet wordt gedaan door grotere implementatiecomplexiteit vergeleken met meer volwassen diensten.
Beschikbaarheid, ontwikkelingsstatus en toegang vanuit Europa
DeepSeek V4 is, volgens het bedrijf zelf, in "Voorbeeldmodus" of vroege toegangDe V4-Pro-variant en de lichtere versie ervan kunnen al worden getest via de officiële DeepSeek-chat en via de API, terwijl sommige externe aanbieders, zoals externe platformen die testnodes aanbiedenZe zijn begonnen ontwikkelaars beperkte toegang te geven.
De routekaart van het bedrijf heeft bepaalde problemen ondervonden. vertragingen ten opzichte van de aanvankelijk gelekte datumswat erop wees dat volledige releases in de eerste helft van 2026 zouden plaatsvinden. Desondanks zijn er in de praktijk al V4-modellen beschikbaar in openbare repositories, die klaar zijn om te worden getest en ingezet in laboratoriumomgevingen.
Voor Europese en Spaanse organisaties is de toegang momenteel gericht op Openbare API's, downloads vanuit open source-repositories en testen op internationale cloudsImplementatie op interne infrastructuur is afhankelijk van de beschikbaarheid van compatibele GPU's of, indien nodig, goedgekeurde Chinese hardware. Dit kan echter in strijd zijn met interne beveiligings- en wettelijke voorschriften.
Implicaties voor startups en bedrijven in Spanje en Europa
Voor het ondernemerslandschap van Spanje en andere EU-landen vertegenwoordigt DeepSeek V4 een mogelijke democratisering van de toegang tot modellen op bedrijfsniveauMet veel lagere kosten per miljoen tokens en de mogelijkheid tot lokale uitvoering kunnen projecten die voorheen aanzienlijke financieringsrondes nodig hadden om de kosten voor API's en GPU's te dekken, nu met beperktere middelen prototypes op hoog niveau ontwikkelen.
In sectoren zoals fintech, legaltech, digitale gezondheidszorg of data-analyseHet vermogen om enorme hoeveelheden data te verwerken en gegevens te beheren binnen infrastructuren die door het bedrijf zelf worden beheerd, kan een wereld van verschil maken als het gaat om het behalen van de gestelde doelen. Europese gegevensbeschermingsvoorschriftenDe overheersing van Engels en Chinees in officiële documenten, evenals de prioriteit die aan deze talen wordt gegeven in het onderwijs, suggereert echter dat de Het Spaans vereist nog wat bijschaven. om echt concurrerende prestaties te leveren.
Een andere vraag is de volwassenheid van het ecosysteem van de tools rond DeepSeek V4. In tegenstelling tot modellen zoals Llama of GPT, die open source frameworksVersie 4 biedt vanaf het begin minder ondersteuning. Bedrijven met kleine technische teams zullen moeten beoordelen of ze die integratiecurve aankunnen of dat ze liever wachten tot de omgeving meer is ingeburgerd.
Geopolitieke en regelgevende dimensie: AI als een nieuw wrijvingsveld.
De opkomst van V4 vindt plaats in een context waarin AI is een instrument van economische en strategische macht.Een open en concurrerend Chinees model zet de westerse opvatting van technologisch leiderschap onder druk en zorgt voor extra spanning in de discussie over... technologische afhankelijkheden en wereldwijde standaarden.
Terwijl China de uitdaging aangaat met een industriële capaciteit, eigen chips en snelle implementatieEuropa neigt ernaar de regelgeving en de eisen op het gebied van transparantie, veiligheid en ethiek te versterken. De mogelijkheid dat open modellen van Chinese oorsprong wereldwijde maatstaven zouden kunnen worden, zou Europese regeringen ertoe kunnen aanzetten om... Verhoog de wettelijke firewallsBijvoorbeeld bij overheidsaanbestedingen of in cruciale sectoren.
Dit zou kunnen leiden tot een De AI-markt is gefragmenteerd in blokken.In deze context moeten Spaanse en Europese bedrijven kiezen tussen Amerikaanse modellen die sterk gebonden zijn aan hun eigen gebruiksregels, Europese oplossingen die nog in ontwikkeling zijn, en krachtige Chinese voorstellen met een complexe geopolitieke component. DeepSeek V4, met zijn combinatie van open source, lage kosten en Huawei-ondersteuning, bevindt zich midden in dit debat.
Al met al lijkt DeepSeek V4 een van de meest serieuze kanshebbers te worden voor Het toegankelijk maken van geavanceerde taalmodellen voor open source en een scherpe prijsstelling.Het enorme contextvenster, de samenwerking met alternatieve hardware naast NVIDIA en de focus op agents en redenering maken het een optie om nauwlettend in de gaten te houden vanuit Spanje en de rest van Europa; de werkelijke impact zal afhangen van de prestaties in de praktijk, de daadwerkelijke ondersteuning in Spanje en de mate waarin bedrijven bereid zijn een belangrijk onderdeel van hun AI-infrastructuur uit het Chinese technologie-ecosysteem te integreren.