ADD_STRIDE
for (i = 0; i < size / sizeof (v_t); i += (2 * ADD_STRIDE)) {
LOAD(dst + i + ADD_STRIDE, ADD_D);
XOR_ACC(src + i + ADD_STRIDE, ADD_D);
STORE(dst + i + ADD_STRIDE, ADD_D);