Profilowanie kodu

Podstawowe profilowanie kernela:
1. uruchomienie najbardziej podstawowej implementacji sumy dwóch wektorów z konfiguracją 1 bloku i liczby wątków równej długości wektora,
2. zebranie podstawowych miar: czas wykonania, liczba cykli, wykorzystanie pamięci.
Wpływ liczby bloków i wątków:
1. należy sprawdzić jak liczby wątków w blokach (wielokrotności liczby 32) wpływają na miary wydajności z punktu 1.
Analiza obciążenia kernelami:
1. zbadanie konfiguracji liczby wątków i bloków z punktu 2,
2. cel: sprawdzenie jak wpływają one na miarę achieved_occupancy.
Analiza czasu wykonania kernela:
1. zbadanie konfiguracji liczby wątków i bloków z punktu 2,
2. cel: sprawdzenie jak wpływają one na miarę duration.
Analiza wydajności wykonania warp’ów:
1. zbadanie konfiguracji liczby wątków i bloków z punktu 2,
2. cel: sprawdzenie jak wpływają one na miary warps_active oraz warp_execution_efficiency.