Google heeft onlangs zijn meest geavanceerde AI-model, Gemini 1.5 Pro, beschikbaar gesteld voor het grote publiek, nadat het vorige maand als bètaversie voor ontwikkelaars werd uitgebracht.
Gemini 1.5 Pro van Google kan veel complexere taken uitvoeren dan eerdere AI-modellen. Het model kan bijvoorbeeld complete tekst bibliotheken analyseren, Hollywood-films van speelfilmlengte verwerken en bijna een hele dag aan audiogegevens doorzoeken. Dit is twintig keer meer data dan OpenAI’s GPT-4o aankan en bijna tien keer zoveel informatie als Anthropic’s Claude 3.5 Sonnet kan beheren.
Volgens Google is het doel van Gemini 1.5 Pro om snellere en goedkopere tools aan AI-ontwikkelaars te bieden. Dit moet nieuwe gebruiksmogelijkheden, extra productiebetrouwbaarheid en hogere betrouwbaarheid mogelijk maken.
In mei werd het model voor het eerst gepresenteerd, waarbij video’s werden getoond van bètatesters die de mogelijkheden van Gemini 1.5 Pro benutten. Zo voedde machine learning-ingenieur Lukas Atkins het model met de volledige Python-bibliotheek en stelde vragen om een probleem op te lossen. “Het was perfect,” zei hij in de video. “Het kon specifieke verwijzingen naar opmerkingen in de code en specifieke verzoeken van mensen vinden.”
Een andere bètatester filmde zijn hele boekenplank en Gemini creëerde een database van alle boeken die hij bezat—een taak die vrijwel onmogelijk is voor traditionele AI-chatbots.
Gemma 2 veroverd de open source-wereld
Google heeft zijn invloed uitgebreid in de open source gemeenschap door vandaag Gemma 2 27B te lanceren. Dit open source grote taalmodel heeft snel de toppositie ingenomen als het model met de hoogste kwaliteit reacties, volgens de ranglijst van LLM Arena.
Volgens Google levert Gemma 2 “prestaties van topklasse, werkt het met ongelooflijke snelheid op verschillende hardware en integreert het moeiteloos met andere AI-tools.” Het model is ontworpen om te concurreren met modellen die “meer dan twee keer zo groot zijn,” aldus het bedrijf.
Hoewel de licentie voor Gemma 2 gratis toegang en herdistributie toestaat, verschilt deze nog steeds van traditionele open-source licenties zoals MIT of Apache. Het model is beschikbaar in zowel 27B als de kleinere 9B versies en is bedoeld om AI-implementaties toegankelijker en budgetvriendelijker te maken.
Dit is belangrijk voor zowel gewone als zakelijke gebruikers, omdat een krachtig open model zoals Gemma zeer aanpasbaar is, in tegenstelling tot gesloten modellen. Gebruikers kunnen hun modellen afstemmen op specifieke taken en hun gegevens beschermen door de modellen lokaal uit te voeren.
Een voorbeeld hiervan is Microsoft’s kleine taalmodel Phi-3, dat specifiek is afgestemd op wiskundige problemen en in dat opzicht grotere modellen zoals Llama-3 en zelfs Gemma 2 zelf kan overtreffen.
Gemma 2 is nu beschikbaar in Google AI Studio, met modelgewichten die te downloaden zijn van Kaggle en Hugging Face Models. Ontwikkelaars kunnen de krachtige Gemini 1.5 Pro testen op Vertex AI.