TLOOP
TLOOP(*(word *)(void *)dst = *(const word *)(const void *)src;
TLOOP(*dst++ = *src++);
TLOOP(src -= wsize; dst -= wsize;
TLOOP(*--dst = *--src);
TLOOP(*(word *)dst = *(const word *)src; src += wsize;
TLOOP(*dst++ = *src++);
TLOOP(src -= wsize; dst -= wsize;
TLOOP(*--dst = *--src);