MUL_LAST_2
emit_mul(nfp_prog, dst_hi, MUL_TYPE_STEP_32x32, MUL_LAST_2,
if (step == MUL_LAST || step == MUL_LAST_2) {