Op de eerste dag van het Chinese maanjaar kondigde Alibaba een nieuwe versie van zijn Qwen 2.5 AI-model aan, met de bewering dat het superieur is aan DeepSeek-V3, een recent geprezen model in de AI-industrie.
De vergelijking
Alibaba’s officiële WeChat-account meldde dat Qwen 2.5-Max de prestaties van bijna alle andere AI-modellen overtreft, waaronder:
- GPT-4o van OpenAI
- DeepSeek-V3
- Llama-3.1-405B van Meta
Deze aankondiging volgde op de lancering van DeepSeek’s AI-assistent (DeepSeek-V3) op 10 januari en hun R1-model op 20 januari. De release van DeepSeek’s R1-model had al een impact op Amerikaanse technologieaandelen, met Nvidia als opvallend voorbeeld, door te beweren dat ze hun model ontwikkelden met slechts $6 miljard, in vergelijking met de miljarden die Amerikaanse techbedrijven uitgeven aan AI-ontwikkeling.
Qwen 2.5-VL: De nieuwe generatie
Alibaba’s nieuwste model, Qwen 2.5-VL, kan een breed scala aan taken uitvoeren:
- Tekst- en beeldanalyse: Het model kan video’s interpreteren, bestanden parseren, objecten in afbeeldingen tellen en zelfs een computer bedienen.
- Prestatietests: Qwen 2.5-VL overtreft volgens interne benchmarking GPT-4o, Claude 3.5 Sonnet van Anthropic, en Gemini 2.0 Flash van Google op gebieden zoals videobegrip, wiskunde, documentanalyse, en vraag-antwoord evaluaties.
Qwen 2.5-VL is beschikbaar voor testen in de Qwen Chat-app en kan worden gedownload van Hugging Face. Het model is in staat om grafieken, afbeeldingen te analyseren, gegevens uit facturen en formulieren te halen, en video’s van meerdere uren te begrijpen. Het herkent ook intellectuele eigendommen uit films en tv-series, evenals diverse producten.
Beperkingen en regulering
De Chinese internetregulator houdt toezicht op AI-modellen ontwikkeld in China om ervoor te zorgen dat ze in lijn zijn met “kernwaarden van socialisme”, wat betekent dat Qwen 2.5-VL beperkingen heeft in wat het kan bespreken in de Qwen Chat-app. Verschillende Chinese AI-bedrijven, waaronder Ernie, vermijden ook controversiële of gevoelige onderwerpen.
Interactie met software
Een opmerkelijke functie van Qwen 2.5-VL is de mogelijkheid om te communiceren met software op zowel pc’s als mobiele apparaten. Demonstraties door Hugging Face-technici toonden aan dat het model apps kan bedienen, zoals een vlucht boeken via de Booking.com-app, hoewel de prestaties op benchmarks die een echte computeromgeving simuleren, minder indrukwekkend waren.
Licentie en beschikbaarheid
De kleinere modellen in de Qwen 2.5-VL serie, Qwen2.5-VL-3B en Qwen2.5-VL-7B, zijn beschikbaar onder permissieve licenties, terwijl het vlaggenschipmodel, Qwen2.5-VL-7B, een aangepaste licentie van Alibaba heeft die vereist dat grote gebruikers toestemming vragen voor commerciële implementatie.
Deze ontwikkeling onderstreept de voortdurende race in AI-innovatie, waarbij Chinese techreuzen zoals Alibaba en DeepSeek elkaar uitdagen en tegelijkertijd de wereldwijde AI-markt beïnvloeden.