- Tensorflow
- Mnożenie dwóch dużych macierzy (4096x4096) i pomiar czasu na GPU. Zbadać różnicę wydajności względem CPU.
- Implementacja iloczynu skalarnego dwóch wektorów.
- Wyznaczenie normy Frobeniusa dużej macierzy (np. 10000x10000).
- Symulacja 1000 mnożeń macierzy i agregacja wyników w jedną macierz sumaryczną.
- PyTorch
- Implementacja warunkowego mnożenia macierzy – tylko tam, gdzie suma elementów w wierszu > próg.
- Porównanie GPU vs CPU dla operacji: A^T * A, gdzie A to duża macierz pseudolosowa.
- JAX
- Wektoryzacja operacji podnoszenia do potęgi i sumowania dla wektora zawierającego milion liczb.
- Porównanie efektywności funkcji
jax.vmap z pętlą for dla sumowania wektorów.
- Numba
- Implementacja funkcji CUDA do równoległego mnożenia wektorów i porównanie jej z biblioteką NumPy.