MUL_STRIDE
for (i = 0; i < size / sizeof (v_t); i += (2 * MUL_STRIDE)) {
LOAD(d + i + MUL_STRIDE, MUL_D);
STORE(d + i + MUL_STRIDE, MUL_D);