MUL_D
LOAD(d + i, MUL_D);
MUL(mul, MUL_D);
STORE(d + i, MUL_D);
LOAD(d + i + MUL_STRIDE, MUL_D);
STORE(d + i + MUL_STRIDE, MUL_D);