- Podstawowe profilowanie kernela:
- uruchomienie najbardziej podstawowej implementacji sumy dwóch wektorów z konfiguracją 1 bloku i liczby wątków równej długości wektora,
- zebranie podstawowych miar: czas wykonania, liczba cykli, wykorzystanie pamięci.
- Wpływ liczby bloków i wątków:
- należy sprawdzić jak liczby wątków w blokach (wielokrotności liczby 32) wpływają na miary wydajności z punktu 1.
- Analiza obciążenia kernelami:
- zbadanie konfiguracji liczby wątków i bloków z punktu 2,
- cel: sprawdzenie jak wpływają one na miarę achieved_occupancy.
- Analiza czasu wykonania kernela:
- zbadanie konfiguracji liczby wątków i bloków z punktu 2,
- cel: sprawdzenie jak wpływają one na miarę duration.
- Analiza wydajności wykonania warp’ów:
- zbadanie konfiguracji liczby wątków i bloków z punktu 2,
- cel: sprawdzenie jak wpływają one na miary warps_active oraz warp_execution_efficiency.