GPU-programmering - OpenCL vs CUDA vs ROCm Träningskurs

GPU-programmering är en teknik som utnyttjar den parallella processeringskraften i GPUn för att accelerera program som kräver högpresterande beräkningar, såsom artificiell intelligens, spel, grafik och vetenskapliga beräkningar. Det finns flera ramverk som möjliggör GPU-programmering, var och en med sina egna fördelar och nackdelar. OpenCL är ett öppet standardiserat ramverk som kan användas för att programmera CPU:er, GPU:er och andra enheter från olika leverantörer, medan CUDA är specifikt för NVIDIA-GPU:er. ROCm är en plattform som stöder GPU-programmering på AMD-GPU:er och erbjuder även kompatibilitet med CUDA och OpenCL.

Denna handledarledd, live-träning (online eller lokalt) riktas till utvecklare på nybörjarnivå till mellannivå som vill använda olika ramverk för GPU-programmering och jämföra deras egenskaper, prestanda och kompatibilitet.

Efter denna träning kommer deltagarna att kunna:

Sätta upp ett utvecklingsmiljö som inkluderar OpenCL SDK, CUDA Toolkit, ROCm Platform, en enhet som stöder OpenCL, CUDA eller ROCm, och Visual Studio Code.
Skapa ett grundläggande GPU-program som utför vektoraddition med OpenCL, CUDA och ROCm, och jämföra syntaksen, strukturen och körningen för varje ramverk.
Använda de respektive API:erna för att fråga enhetsinformation, allokera och deallokera minne på enheten, kopiera data mellan värd och enhet, starta kärnor och synkronisera trådar.
Använda de respektive språken för att skriva kärnor som körs på enheten och manipulera data.
Använda de respektive inbyggda funktionerna, variablerna och biblioteken för att utföra vanliga uppgifter och operationer.
Använda de respektive minutrymmen, som globalt, lokalt, konstant och privat, för att optimera datatransferer och minnesåtkomster.
Använda de respektive körningsmodellerna för att styra trådar, block och rutnät som definierar parallellismen.
Felsöka och testa GPU-program med verktyg som CodeXL, CUDA-GDB, CUDA-MEMCHECK och NVIDIA Nsight.
Optimerar GPU-program med tekniker som sammanfogning, cachning, förhandsladdning och profilering.

Kursformat

Interaktiv föreläsning och diskussion.
Många övningar och praktiska uppgifter.
Praktiskt implementering i en live-lab-miljö.

Kursanpassningsalternativ

För att begära en anpassad utbildning för denna kurs, kontakta oss för att ordna.

Tack för att du skickade din fråga! En av våra teammedlemmar kontaktar dig snart.

Tack för att du skickade din bokning! En av våra teammedlemmar kontaktar dig snart.

Kommande Kurser

GPU-programmering - OpenCL vs CUDA vs ROCm

2025-12-29 09:30

28 timmar

Linköping

4000 EUR (Online)

4800 EUR (Klassrum)

GPU-programmering - OpenCL vs CUDA vs ROCm

2026-01-12 09:30

28 timmar

Stockholm, Hötorget

4000 EUR (Online)

4800 EUR (Klassrum)

GPU-programmering - OpenCL vs CUDA vs ROCm

2026-01-26 09:30

28 timmar

Uppsala

4000 EUR (Online)

5200 EUR (Klassrum)

GPU-programmering - OpenCL vs CUDA vs ROCm

2026-02-09 09:30

28 timmar

Malmö, Stadskärna

4000 EUR (Online)

4800 EUR (Klassrum)

GPU-programmering - OpenCL vs CUDA vs ROCm Träningskurs

Kursplan

Krav

Kommande Kurser

GPU-programmering - OpenCL vs CUDA vs ROCm

GPU-programmering - OpenCL vs CUDA vs ROCm

GPU-programmering - OpenCL vs CUDA vs ROCm

GPU-programmering - OpenCL vs CUDA vs ROCm

Relaterade Kategorier

Denna webbplats i andra länder/regioner

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

GPU-programmering - OpenCL vs CUDA vs ROCm Träningskurs

Kursplan

Krav

Kommande Kurser

GPU-programmering - OpenCL vs CUDA vs ROCm

GPU-programmering - OpenCL vs CUDA vs ROCm

GPU-programmering - OpenCL vs CUDA vs ROCm

GPU-programmering - OpenCL vs CUDA vs ROCm

Relaterade Kurser

Utveckla AI-applikationer med Huawei Ascend och CANN

Innan AI-modeller med CANN och Ascend AI-processorer

GPU Programming på Biren AI Accelerators

Cambricon MLU Development with BANGPy and Neuware

Introduktion till CANN för AI-ramverksutvecklare

CANN for Edge AI Deployment

Förståelse av Huaweis AI-bearbetningsstack: Från CANN till MindSpore

Optimering av neurala nätverksprestanda med CANN SDK

SDK för Ascend och NLP-pipelines

Skapa anpassade AI-operatörer med CANN TIK och TVM

Migrating CUDA Applications to Chinese GPU Architectures

Performance Optimization on Ascend, Biren, and Cambricon

Relaterade Kategorier

GPU

Denna webbplats i andra länder/regioner

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites