Kursplan

Introduktion till Multimodal LLMs i Vertex AI

  • Översikt över multimodal förmåga i Vertex AI
  • Gemini-modeller och stödda modaliteter
  • Användningsfall i företag och forskning

Konfigurering av Utvecklingsmiljö

  • Konfigurering av Vertex AI för multimodal arbetsflöde
  • Arbeta med dataset över modaliteter
  • Hands-on lab: miljöuppsättning och datasetförberedelse

Långa Kontextfönster och Avancerad Resonemang

  • Förstå arbetsflöde med lång kontext
  • Användningsfall i planering och beslutsfattande
  • Hands-on lab: implementering av långkontextanalys

Design av Cross-Modal Arbetsflöden

  • Kombinera text-, ljud- och bildanalys
  • Keda multimodal steg i pipelines
  • Hands-on lab: design av en multimodal pipeline

Arbete med Gemini API-parametrar

  • Konfigurering av multimodal in- och utdata
  • Optimering av inferens och effektivitet
  • Hands-on lab: justering av Gemini API-parametrar

Avancerade Applikationer och Integreringar

  • Interaktiva multimodala agenter och assistenter
  • Integrering av externa APIer och verktyg
  • Hands-on lab: byggande av en multimodal applikation

Utvärdering och Iteration

  • Testning av multimodal prestanda
  • Mått för noggrannhet, överensstämmelse och förskjutning
  • Hands-on lab: utvärdering av multimodala arbetsflöden

Sammanfattning och Nästa Steg

Krav

  • Skicklighet i Python-programmering
  • Erfarenhet av utveckling av maskininlärningsmodeller
  • Kännedom om multimodal data (text, ljud, bild)

Målgrupp

  • AI-forskare
  • Avancerade utvecklare
  • ML-vetenskapsmän
 14 timmar

Antal deltagare


Pris per deltagare

Kommande Kurser

Relaterade Kategorier