Używam API WMMA CUDA, aby pomnożyć fragmenty na GTX 1660 Ti. Ten GPU nie ma rdzeni Tensora, ale kiedy patrzę na Sass generowany dla mojego Kodeksu, widzę instrukcje HMMA.1688.f32, które są instrukcjami firmy Tensor Core! Jak to może się zdarzyć?

Istotna informacja:

0
rm95 14 marzec 2021, 09:34

1 odpowiedź

Najlepsza odpowiedź

W przypadku kompatybilności binarnej kodu, członkowie rodziny tururingowej "Non-Tensor-rdzeni" ma Sprzęt w SM przetwarzanie instrukcji rdzenia Tensora, choć w stosunkowo niskiej przepustowości, w porównaniu do jednostki rdzeniowej Tensor.

1
Robert Crovella 14 marzec 2021, 14:15