Эффективные методы реализации моделей ИИ
FPU-расширение поверх целочисленного ядра
3 раунда
Dot product
OFP8 E4M3 входы, float16 аккумулятор.
y = Wx
Matmul = набор dot product'ов. Двойной цикл, row-major.
exp(x) без инструкции
ISA не поддерживает exp.