Kursplan

Införandet

  • Vad är Large Language Models (LLMs)?
  • LLM:er jämfört med traditionella NLP-modeller
  • Översikt över LLM:s funktioner och arkitektur
  • Utmaningar och begränsningar för LLM:er

Förstå LLM:er

  • Livscykeln för en LLM
  • Hur LLM:er fungerar
  • Huvudkomponenterna i en LLM: kodare, avkodare, uppmärksamhet, inbäddningar, etc.

Komma igång

  • Konfigurera utvecklingsmiljön
  • Installera en LLM som ett utvecklingsverktyg, t.ex. Google Colab, Hugging Face

Arbeta med LLM:er

  • Utforska tillgängliga LLM-alternativ
  • Skapa och använda en LLM
  • Finjustera en LLM på en anpassad datauppsättning

Sammanfattning av text

  • Förstå uppgiften med textsammanfattning och dess tillämpningar
  • Använda en LLM för extraktiv och abstrakt textsammanfattning
  • Utvärdera kvaliteten på de genererade sammanfattningarna med hjälp av mätvärden som ROUGE, BLEU osv.

Svar på frågor

  • Förstå uppgiften att svara på frågor och dess tillämpningar
  • Använda en LLM för frågesvar med öppen domän och stängd domän
  • Utvärdera noggrannheten i de genererade svaren med hjälp av mätvärden som F1, EM, etc.

Generering av text

  • Förstå uppgiften med textgenerering och dess tillämpningar
  • Använda en LLM för villkorlig och ovillkorlig textgenerering
  • Styra stilen, tonen och innehållet i de genererade texterna med hjälp av parametrar som temperatur, top-k, top-p, etc.

Integrera LLM:er med andra ramverk och plattformar

  • Använda LLM:er med PyTorch eller TensorFlow
  • Använda LLM:er med Flask eller Streamlit
  • Använda LLM:er med Google Cloud eller AWS

Felsökning

  • Förstå de vanligaste felen och buggarna i LLM:er
  • Använda TensorBoard för att övervaka och visualisera träningsprocessen
  • Använda PyTorch Lightning för att förenkla träningskoden och förbättra prestationen
  • Använda Hugging Face datauppsättningar för att läsa in och förbearbeta data

Sammanfattning och nästa steg

Krav

    En förståelse för naturlig språkbehandling och djupinlärning Erfarenhet av Python och PyTorch eller TensorFlow Basic programmeringserfarenhet

Publik

    Utvecklare NLP entusiaster Data scientists
 14 timmar

Antal deltagare



Price per participant

Relaterade Kurser

Relaterade Kategorier