__lmulq
prod.q = __lmulq(u0, v0);
low.q = __lmulq(u0, v0);
static longlong_t __lmulq(ulong_t, ulong_t);