Hem
Artificiell Intelligens Utbildning
Google AI Utbildning
Gemini AI Utbildning
Multimodal Applications with Gemini 3: Vision, Audio, Video & Text Träningskurs

Multimodal Applications with Gemini 3: Vision, Audio, Video & Text Träningskurs

Gemini 3 är en multimodell AI-plattform som kan bearbeta och resonera över bilder, video, ljud och text.

Denna instruktörsledda träningskurs (online eller platsbaserad) riktas till mellannivåpraktiker som vill utforma och bygga applikationer som tar tillvara på Gemini 3:s multimodella intelligens.

Vid kursens avslutning kommer deltagarna att få förmågan att:

Integrera Gemini 3 multimodella slutpunkter i verkliga arbetsflöden.
Bearbeta och tolka visuella, ljud-, video- och textinmatningar i enhetliga pipelines.
Bygga interaktiva prototyper med multimodella anvisningar.
Optimera multimodella utdata för prestanda, noggrannhet och användbarhet.

Kursformat

Guidad undervisning med demonstrationer.
Scenario-baserade övningar och praktiska övningspass.
Praktisk implementation i live-utvecklingsmiljöer.

Kursanpassningsalternativ

För anpassat innehåll eller projektbaserad träningskurser, kontakta oss för att ordna det.

Tack för att du skickade din fråga! En av våra teammedlemmar kontaktar dig snart.

Tack för att du skickade din bokning! En av våra teammedlemmar kontaktar dig snart.

Kursplan

Introduktion till Gemini 3 Multimodalitet

Kapaciteter över text, bilder, ljud och video
Modellval och slutpunktsoversikt
Nyckelkoncept i multimodellt resonemang

Arbeta med text och strukturerade inmatningar

Strategier för anvisningar vid textgenerering
Metadata, kontextfönster och embeddings
Textbaserad orchestration av multimodella uppgifter

Bildförståelse och visuella arbetsflöden

Bildanalys och tolkning med Gemini 3
Skapa verktyg för visuell sökning och etikettning
Bygga interaktioner mellan bilder och text

Bearbetning av ljudinmatningar

Taligenkänning och transkriberingar
Detektion och tolkning av ljudhändelser
Integrera ljud med text- och visuella inmatningar

Videointelligens och scenanalys

Ram för ram och kontinuerlig videoreasoning
Bygga verktyg för sammanfattning och highlight-extraktion
Video-baserad automation och innehållsarbetsflöden

Utforma multimodella applikationsarkitekturer

Kombinera flera inmatningstyper i ett enda pipeline
Latens, kostnader och beräkningsaspekter
Bästa praxis för skalbara multimodella system

Prototypa multimodella applikationer

Praktisk skapande av multimodella prototyper
Snabbiteration med prompt engineering
Testa och förfinna användarupplevelseflöden

Distribuera multimodella lösningar

Distribueringsstrategier och miljöinställningar
Övervaka realvärldens prestanda
Säkerhets- och kompliancöverväganden

Sammanfattning och nästa steg

Krav

Kunskap om moderna AI-koncept
Erfarenhet av Python eller JavaScript
Kännedom om REST-API:er

Målgrupp

Designers
Innehållsskapare
Tekniska produktteam

14 Timmar

Antal deltagare

Online

Klassrum

Välj Plats

Vänligen välj ett Föreläsningssal

Pris per deltagare

Öppna Utbildningskurser kräver 5+ deltagare.

Multimodal Applications with Gemini 3: Vision, Audio, Video & Text Träningskurs - Bokning

Fullständigt namn *

E-post *

Telefonnummer *

Jobbtitel

Företagsnamn

Adress 1 *

Stad *

Län / Provins

Land *

Postnummer *

Startdatum

Moms-ID

Datum är beroende av tillgänglighet och äger rum mellan 09:30 och 16:30.

Betalning *

Banköverföring (Faktura, EK)

Debetkort / Kreditkort

Bokningssammanfattning

Antal deltagare: —
Kurstimmar: 14 Timmar
Totalpris: —

Kommentarer

Villkor *

Jag är en auktoriserad representant för ovan nämnda kund och önskar boka de ovan nämnda kurserna eller tjänsterna i enlighet med NobleProgs villkor och personuppgiftspolicy.

Informera mig om rabatter och erbjudanden

Läs vår integritetspolicy för att se hur vi använder dina uppgifter

Multimodal Applications with Gemini 3: Vision, Audio, Video & Text Träningskurs - Fråga

Fullständigt namn *

E-post *

Telefonnummer *

Antal deltagare

Företagsnamn

Företagsadress

Hur vill du delta på kursen?

Kundlokaler

Online

Klassrum

Kommentarer

Informera mig om rabatter och erbjudanden

Läs vår integritetspolicy för att se hur vi använder dina uppgifter

Multimodal Applications with Gemini 3: Vision, Audio, Video & Text - Konsultfråga

Fullständigt namn *

Telefonnummer *

E-post *

Företagsnamn

Konsulttäcke *

Konsulmål

Vem kommer konsulten att arbeta med?

Konsultbrådskap *

Kommentarer

Informera mig om rabatter och erbjudanden

Läs vår integritetspolicy för att se hur vi använder dina uppgifter

Vittnesmål (1)

Flöde, känsla och ämne i presentationen

Lukasz Kowalczyk - Allegro Sp. z o.o.

Kurs - Google Gemini AI for Data Analysis

Maskintolkat

Kommande Kurser

Multimodal Applications with Gemini 3: Vision, Audio, Video & Text

2026-08-26 09:30

14 timmar

Malmö, Stadskärna

2000 EUR (Online)

2400 EUR (Klassrum)

Multimodal Applications with Gemini 3: Vision, Audio, Video & Text

2026-09-09 09:30

14 timmar

Göteborg

2000 EUR (Online)

2400 EUR (Klassrum)

Multimodal Applications with Gemini 3: Vision, Audio, Video & Text

2026-09-23 09:30

14 timmar

Västerås

2000 EUR (Online)

2400 EUR (Klassrum)

Multimodal Applications with Gemini 3: Vision, Audio, Video & Text

2026-10-07 09:30

14 timmar

Örebro, City Center

2000 EUR (Online)

2400 EUR (Klassrum)

Relaterade Kurser

Agentutveckling med Gemini 3 och Google Antigravity

21 Timmar

Google Antigravity är en agentutvecklingsmiljö som är utformad för att skapa autonoma agenter som kan planera, resonera, koda och agera genom Gemini 3:s multimodala möjligheter.

Denna instruktörsvägledade, live-träning (online eller på plats) riktar sig till tekniska experter på avancerat nivå som önskar designa, bygga och distribuera autonoma agenter med hjälp av Gemini 3 och Antigravity-miljön.

Efter att ha slutfört denna träning kommer deltagarna vara förberedda på att:

Bygga autonoma arbetsflöden som använder Gemini 3 för resonemang, planering och exekvering.
Utveckla agenter i Antigravity som kan analysera uppgifter, skriva kod och interagera med verktyg.
Integrera Gemini-drivna agenter med företagssystem och API:er.
Optimera agentbeteende, säkerhet och pålitlighet i komplexa miljöer.

Kursformat

Expertdemonstrationer kombinerade med interaktiva diskussioner.
Handpåleken med utveckling av autonoma agenter.
Praktisk implementation med Antigravity, Gemini 3 och stödjande molntjänster.

Kurstillpassningsalternativ

Om din grupp behöver domänspecifika agentbeteenden eller anpassade integreringar, kontakta oss för att anpassa programmet.

LÄS MER...

Bygga AI-applikationer på enhet med Nano Banana

14 Timmar

Nano Banana är en specialiserad modell optimerad för snabb och effektiv AI-körning på enheten.

Denna instruktörsledda, liveutbildning (online eller platsbaserad) riktar sig till mellannivåpraktiker som vill utforma och distribuera AI-drivna mobilapplikationer med Nano Banana utan att bero av molninfrastruktur.

Vid avslutande av detta program bör deltagarna kunna:

Implementera Nano Banana-modeller direkt på mobila enheter.
Optimera AI-arbetsbelastningar för prestanda och energieffektivitet.
Integrera text- och bildgenererande funktioner i mobilapplikationer.
Felsöka, mäta och förbättra inferenspipelines på enheten.

Kursformat

Instruktörsledda demonstrationer och samarbetsdiskussioner.
Praktiska övningar fokuserade på verklivsanvändningsfall.
Hands-on utveckling och testning i en live mobilmiljö.

Kursanpassningsalternativ

Om du behöver en anpassad version av denna kurs, kontakta oss för att diskutera anpassningsalternativ.

LÄS MER...

Optimera AI-modeller för kantdistribuering med Nano Banana

14 Timmar

Nano Banana är ett lättviktigt AI-ramverk som är utformat för att accelerera och komprimera modeller för effektiv distribuering på enheter och vid kanten.

Detta instruktörledda, liveutbildning (online eller lokalt) riktas till mellan- till avanceradnivås professionella som vill optimera, komprimera och distribuera AI-modeller för kanten med hjälp av Nano Banana.

Vid slutet av programmet kommer deltagarna att kunna:

Tillämpa komprimerings- och kvantiseringsmetoder på AI-modeller.
Försnabba inferensprestanda för kantenheter.
Konvertera och distribuera modeller med Nano Bananas verktygslinje.
Utvärdera motstridigheter mellan noggrannhet, latens och resursanvändning.

Kursformat

Instruktörledda tekniska sessioner och vägledande diskussioner.
Praktiska övningar med verkliga kant-AI-scenarier.
Praktisk implementering i en konfigurerad live-miljö.

Kurstillpassningsalternativ

För anpassat innehåll eller organisationsspecifika anpassningar, kontakta oss för att ordna en anpassad version av denna kurs.

LÄS MER...

Deep-Think Mode Mastery: Advanced Reasoning with Gemini 3

14 Timmar

Gemini 3 är ett avancerat multimodalt AI-system som är utformat för att stödja djup resonemang, högkontextuella uppgifter och långformade analytiska arbetsflöden.

Detta instruktörledande, liveutbildning (online eller på plats) är riktat till avanceradnivåprofessionals som önskar använda Deep-Think Mode för att genomföra komplex analys, modellering och strategisk planering.

Genom att slutföra denna kurs kommer deltagarna att vara utrustade för att:

Använda Deep-Think Mode för att lösa komplexa, flernivåproblem.
Utforma resonemangsleder som inkluderar långkontextanalys.
Optimera frågor för iterativa, flerstegsresonemanuppgifter.
Integrera Deep-Think-förmågor i forsknings- eller produktionarbetsflöden.

Kursformat

Experterledna presentationer med verkliga exempel.
Händelsebaserade resonemangsövningar och strukturerade uppgifter.
Tillämpad utveckling med liveexperimentmiljöer.

Kursanpassningsalternativ

Anpassade sessioner eller domän-specifika djupresonemangsprojekt kan arrangeras efter begäran.

LÄS MER...

Gemini 3 för företag: resonemang, planering och multimodala arbetsflöden

14 Timmar

Gemini 3 är en multimodal AI-modell som är utformad för att resonera över text, bilder och strukturerade inmatningar för att stödja komplexa företagsarbetsflöden.

Detta instruktörsledda, liveutbildning (online eller på plats) riktas till mellannivåprofiler som vill bygga resonemangsdrivna och multimodala arbetsflöden med Gemini 3 i företagsmiljöer.

Efter att ha avslutat denna kurs kommer deltagarna att ha färdigheterna för att:

Använda Gemini 3:s resonemangsförmåga i företagsplanering och beslutsarbetsflöden.
Utforma multimodala processer som innehåller text, bilder, dokument och tabellformad data.
Utveckla företagsarbetsflöden med AI Studio och Vertex AI-verktyg.
Optimerar utdata genom prompt-injektion och iterativ förfiningstekniker.

Kursformat

Vejledande demonstreringar som stöds av expertförklaringar.
Praktiska övningar med fokus på arbetsflödesdesign och multimodala uppgifter.
Händerbaserat experiment i AI Studio eller Vertex AI-miljöer.

Kursanpassningsalternativ

Om ditt företag behöver anpassade arbetsflödesscenarior eller dataintegrationsexempel, kontakta oss för att anpassa utbildningen.

LÄS MER...

Gemini 3 i Google Sök och Kunskapsarbete: Använda AI-läge för produktivitet

14 Timmar

Gemini 3 är ett AI-drivet system som förbättrar Googles sökfunktioner och arbetsplatsproduktivitet genom AI-läge.

Detta ledaregenomfört, liveutbildning (online eller på plats) riktas till nybörjarnivåanvändare som vill utnyttja Gemini 3 för att förenkla forskning, planering, analys och dagligt kunskapsarbete.

Under denna utbildning kommer deltagarna att få de färdigheter som krävs för att:

Använda Gemini 3 i AI-läge för att snabba upp forskningen och upptäckta information.
Tillämpa Gemini-assisterade arbetsflöden för att sammanfatta innehåll och extrahera insikter.
Integrera Gemini 3-funktioner i vardagliga produktivitetsuppgifter.
Anta bästa praxis för ansvarsfull och pålitlig användning av AI-verktyg.

Kursformat

Ledaregenomförda presentationer och demonstrationer.
Strukturerade praktiska övningar för färdighetsutveckling.
Verklivsanvendelser med live-sökning och produktivitets-scenarier.

Kursanpassningsalternativ

För anpassad utbildning som anpassas till era arbetsflöden, kontakta oss för att diskutera anpassningsalternativ.

LÄS MER...

Introduktion till Google Gemini AI

14 Timmar

Denna instruktörsledda, levande utbildning (online eller på plats) riktar sig till utvecklare på grundnivå till mellan nivå som vill integrera AI-funktioner i sina applikationer med hjälp av Google Gemini AI.

Efter avslutad utbildning kommer deltagarna att kunna:

Förstå grunderna i stora språkmodeller.
Installera och använda Google Gemini AI för olika AI-uppgifter.
Implementera text-till-text och bild-till-text-omvandlingar.
Bygga grundläggande AI-drivna applikationer.
Undersöka avancerade funktioner och anpassningsalternativ i Google Gemini AI.

LÄS MER...

Google Gemini AI för innehållsskapande

14 Timmar

Denna lärareledda, live-utbildning på plats (online eller på plats) riktar sig till mellanavancerade innehållsskapare som vill använda Google Gemini AI för att förbättra kvaliteten och effektiviteten i sitt innehåll.

Efter avslutad utbildning kommer deltagarna att kunna:

Förstå rollen för AI i innehållsskapande.
Inställa och använda Google Gemini AI för att generera och optimera innehåll.
Använda text-till-text-omvandlingar för att skapa kreativt och originellt innehåll.
Implementera SEO-strategier med hjälp av AI-drivna insikter.
Analysera innehållsprestanda och anpassa strategier med hjälp av Gemini AI.

LÄS MER...

Google Gemini AI för Transformativ Kundservice

14 Timmar

Denna instruktörsledda, live-utbildning (online eller på plats) vänder sig till kundtjänstprofessionella på mellannivå som vill implementera Google Gemini AI i sina kundtjänstoperationer.

Vid slutet av denna utbildning kommer deltagarna att kunna:

Förstå AI:s påverkan på kundtjänst.
Installera Google Gemini AI för att automatisera och personifiera kundinteraktioner.
Använda text-till-text och bild-till-text-omvandlingar för att förbättra tjänsteffektiviteten.
Utveckla AI-drivna strategier för analys av kundfeedback i realtid.
Uppleva avancerade funktioner för att skapa en smidig kundtjänstupplevelse.

LÄS MER...

Google Gemini AI för Data Analysis

21 Timmar

Denna instruktörsledda, liveutbildning (online eller på plats) riktar sig till nybörjare till mellan- nivåanalytiker och affärsprofessionella som vill utföra komplexa dataanalysuppgifter mer intuitivt över olika branscher med hjälp av Google Gemini AI.

Efter avslutad utbildning kommer deltagarna att kunna:

Förstå grunderna i Google Gemini AI.
Koppla ihop olika datakällor med Gemini AI.
Undersöka data med hjälp av naturliga språkfrågor.
Analysera mönster i data och dra slutsatser.
Skapa övertygande data visualiseringar.
Kommunicera data driven insikter effektivt.

LÄS MER...

Kom igång med Google Gemini AI

14 Timmar

Google Gemini AI är en nyckfull språkmodell som erbjuder avancerade AI-funktioner såsom naturlig språkförståelse, textgenerering och multimodal bearbetning. Detta gör det möjligt för utvecklare att skapa intelligenta och sammanhangsmedvetna program.

Denna instruktörsledda, liveutbildning (online eller på plats) riktar sig till nybörjar- till mellannivåutvecklare som vill praktiskt tillämpa AI-koncept med Google Gemini AI genom hästfotprojekt, realvärldsexempel och samarbetsövningar.

Till slutet av denna utbildning kommer deltagarna att kunna:

Konfigurera och använda Google Gemini AI och relaterade verktyg på ett effektivt sätt.
Utveckla AI-drivna program med text- och bildinmatning.
Nyttja NotebookLM för praktiska AI-arbetsflöden och dokumentbasert resonemang.
Samverka i små grupper för att utforma och distribuera fungerande AI-prototyper.

Kursformat

Interaktiv föreläsning och vägledande diskussion.
Hästfotlaborationer och samarbetsprojekt.
Praktiska uppgifter med Google Gemini AI och NotebookLM.

Kursanpassningsalternativ

För att begära en anpassad utbildning för denna kurs, kontakta oss för att arrangera.

LÄS MER...

Intermediate Gemini AI för offentlig sektor

16 Timmar

Denna instruktörsledda, live-utbildning på Sverige (online eller på plats) riktar sig till medelavancerade offentligsektorsprofessionella som vill använda Gemini för att generera högkvalitativt innehåll, hjälpa till med forskning och öka produktiviteten genom mer avancerade AI-interaktioner.

Efter denna utbildning kommer deltagarna att kunna:

Skapa mer effektiva och anpassade anvisningar för specifika användningsfall.
Generera originellt och kreativt innehåll med hjälp av Gemini.
Sammanfatta och jämföra komplex information med precision.
Använda Gemini för brainstorming, planering och organisering av idéer effektivt.

LÄS MER...

Introduktion till Nano Banana: Lätta LLM-modeller för applikationer i verkligheten

7 Timmar

Nano Banana är ett ramverk för lätta stora språkmodeller, designat för effektiv och kostnadseffektiv användning i praktiska tillämpningar på olika enheter och inom företagsmiljöer.

Detta instruktionsledda, levande utbildning (online eller på plats) riktar sig till professionella på nybarnivå som vill förstå hur lätta LLM-modeller kan distribueras för praktiska, på enheten och kostnadseffektiva tillämpningar.

I slutet av denna kurs kommer deltagarna att kunna:

Förklara de grundläggande koncepten bakom lätta LLM-modeller och Nano Banana.
Identifiera lämpliga användningsområden för distribuerade AI-lösningar med låga kostnader på enheten.
Utvärdera Nano Bananas förmågor för affärs- och IT-scenarier.
Göra informerade beslut om integrationsvägar i deras organisation.

Kursformat

Instruktörens förklaringar kompletteras med interaktiv dialog.
Praktiska övningar för att förstärka de viktigaste koncepten.
Hantverksmässig utforskning av lätta LLM-förmågor.

Kursanpassningsalternativ

För skräddarsydda versioner av denna utbildning, vänligen kontakta oss för att anpassa programmet.

LÄS MER...

Nano Banana för Android-utvecklare: Lättvikts AI-integration

14 Timmar

Nano Banana är ett lättnyttjat AI-framework som är utformat för effektiv modellkörning på enhet för Android.

Detta instruktörsledda, liveutbildning (online eller på plats) är riktad till nybörjande till mellannivå Android-utvecklare som vill integrera optimerade AI-funktioner direkt i mobilapplikationer.

Efter att ha avslutat denna utbildning kommer deltagarna att kunna:

Integrera Nano Banana SDK till Android Studio-projekt.
Implementera realtids AI-inferens med hjälp av Nano Banana-API:er.
Optimera modellprestanda för begränsade mobilmiljöer.
Tillämpa bästa metoder för säker, integritetsskyddande AI på enheten.

Kursformat

Guiderade presentationer och samarbetsdiskussioner.
Praktiska programmerövningar för att fastställa kärnkunskaper.
Praktiskt implementering med hjälp av verkliga Android-exempel.

Kursanpassningsalternativ

För anpassade versioner av denna kurs, vänligen kontakta oss för att ordna ett anpassat program.

LÄS MER...

Privacy-Preserving AI on Mobile Devices with Nano Banana

14 Timmar

Nano Banana är en lokalt körbar AI-ramverk som utformats för att köra modeller lokalt samtidigt som den upprätthåller strikt integritet och kompliance med regler.

Detta instruktörsledda live-träning (online eller på plats) riktas till nybörjare- till mellannivåprofesionella som vill implementera integritetsbevarande AI-funktioner på mobila enheter med Nano Banana för reglerade eller känsliga miljöer.

Vid avslutet av detta träningsscenarium kommer deltagarna att kunna:

Bygga mobilapplikationer som bearbetar data privat lokalt på enheten.
Integrera Nano Banana för att möjliggöra komplianthaft AI-arbetsflöde.
Tillämpa integritetsförbättrande tekniker som anonymisering och säker bearbetning.
Utvärdera och mildra integritetsrisker under utvecklingen av mobil AI.

Kursformat

Vägledande instruktion som stöds av diskussion och frågor-och-svar.
Praktiska övningar med fokus på integritetsbevarande mobil AI-scenarier.
Händerbördsimplementering i en verklig utvecklingsmiljö.

Kurstillpassningsalternativ

För organisationsspecifika behov eller sektorspecifika komplianceämnar, vänligen kontakta oss för att anpassa detta program.

LÄS MER...

Multimodal Applications with Gemini 3: Vision, Audio, Video & Text Träningskurs

Kursplan

Krav

Vittnesmål (1)

Lukasz Kowalczyk - Allegro Sp. z o.o.

Kurs - Google Gemini AI for Data Analysis

Kommande Kurser

Multimodal Applications with Gemini 3: Vision, Audio, Video & Text

Multimodal Applications with Gemini 3: Vision, Audio, Video & Text

Multimodal Applications with Gemini 3: Vision, Audio, Video & Text

Multimodal Applications with Gemini 3: Vision, Audio, Video & Text

Relaterade Kategorier

Denna webbplats i andra länder/regioner

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites