1. Podstawowe profilowanie kernela:
    1. uruchomienie najbardziej podstawowej implementacji sumy dwóch wektorów z konfiguracją 1 bloku i liczby wątków równej długości wektora,
    2. zebranie podstawowych miar: czas wykonania, liczba cykli, wykorzystanie pamięci.
  2. Wpływ liczby bloków i wątków:
    1. należy sprawdzić jak liczby wątków w blokach (wielokrotności liczby 32) wpływają na miary wydajności z punktu 1.
  3. Analiza obciążenia kernelami:
    1. zbadanie konfiguracji liczby wątków i bloków z punktu 2,
    2. cel: sprawdzenie jak wpływają one na miarę achieved_occupancy.
  4. Analiza czasu wykonania kernela:
    1. zbadanie konfiguracji liczby wątków i bloków z punktu 2,
    2. cel: sprawdzenie jak wpływają one na miarę duration.
  5. Analiza wydajności wykonania warp’ów:
    1. zbadanie konfiguracji liczby wątków i bloków z punktu 2,
    2. cel: sprawdzenie jak wpływają one na miary warps_active oraz warp_execution_efficiency.