crypto_load_be32toh
ctr = crypto_load_be32toh(&iv[12]);
s0 = crypto_load_be32toh(&in[0 * 4]) ^ rk[0];
s1 = crypto_load_be32toh(&in[1 * 4]) ^ rk[1];
s2 = crypto_load_be32toh(&in[2 * 4]) ^ rk[2];
s3 = crypto_load_be32toh(&in[3 * 4]) ^ rk[3];
rk[0] = crypto_load_be32toh(&userKey[0 * 4]);
rk[1] = crypto_load_be32toh(&userKey[1 * 4]);
rk[2] = crypto_load_be32toh(&userKey[2 * 4]);
rk[3] = crypto_load_be32toh(&userKey[3 * 4]);
rk[4] = crypto_load_be32toh(&userKey[4 * 4]);
rk[5] = crypto_load_be32toh(&userKey[5 * 4]);
rk[6] = crypto_load_be32toh(&userKey[6 * 4]);
rk[7] = crypto_load_be32toh(&userKey[7 * 4]);
s0 = crypto_load_be32toh(&in[0 * 4]) ^ rk[0];
s1 = crypto_load_be32toh(&in[1 * 4]) ^ rk[1];
s2 = crypto_load_be32toh(&in[2 * 4]) ^ rk[2];
s3 = crypto_load_be32toh(&in[3 * 4]) ^ rk[3];
ctr32 = crypto_load_be32toh(&ivec[12]);
X0 = crypto_load_be32toh(&in[0 * 4]);
X1 = crypto_load_be32toh(&in[1 * 4]);
X2 = crypto_load_be32toh(&in[2 * 4]);
X3 = crypto_load_be32toh(&in[3 * 4]);
X4 = crypto_load_be32toh(&in[4 * 4]);
X5 = crypto_load_be32toh(&in[5 * 4]);
X6 = crypto_load_be32toh(&in[6 * 4]);
X7 = crypto_load_be32toh(&in[7 * 4]);
X8 = crypto_load_be32toh(&in[8 * 4]);
X9 = crypto_load_be32toh(&in[9 * 4]);
X10 = crypto_load_be32toh(&in[10 * 4]);
X11 = crypto_load_be32toh(&in[11 * 4]);
X12 = crypto_load_be32toh(&in[12 * 4]);
X13 = crypto_load_be32toh(&in[13 * 4]);
X14 = crypto_load_be32toh(&in[14 * 4]);
X15 = crypto_load_be32toh(&in[15 * 4]);
X[0] = crypto_load_be32toh(&in[0 * 4]);
X[1] = crypto_load_be32toh(&in[1 * 4]);
X[2] = crypto_load_be32toh(&in[2 * 4]);
X[3] = crypto_load_be32toh(&in[3 * 4]);
X[4] = crypto_load_be32toh(&in[4 * 4]);
X[5] = crypto_load_be32toh(&in[5 * 4]);
X[6] = crypto_load_be32toh(&in[6 * 4]);
X[7] = crypto_load_be32toh(&in[7 * 4]);
X[8] = crypto_load_be32toh(&in[8 * 4]);
X[9] = crypto_load_be32toh(&in[9 * 4]);
X[10] = crypto_load_be32toh(&in[10 * 4]);
X[11] = crypto_load_be32toh(&in[11 * 4]);
X[12] = crypto_load_be32toh(&in[12 * 4]);
X[13] = crypto_load_be32toh(&in[13 * 4]);
X[14] = crypto_load_be32toh(&in[14 * 4]);
X[15] = crypto_load_be32toh(&in[15 * 4]);
W00 = crypto_load_be32toh(&in[0 * 4]);
W01 = crypto_load_be32toh(&in[1 * 4]);
W02 = crypto_load_be32toh(&in[2 * 4]);
W03 = crypto_load_be32toh(&in[3 * 4]);
W04 = crypto_load_be32toh(&in[4 * 4]);
W05 = crypto_load_be32toh(&in[5 * 4]);
W06 = crypto_load_be32toh(&in[6 * 4]);
W07 = crypto_load_be32toh(&in[7 * 4]);
W08 = crypto_load_be32toh(&in[8 * 4]);
W09 = crypto_load_be32toh(&in[9 * 4]);
W10 = crypto_load_be32toh(&in[10 * 4]);
W11 = crypto_load_be32toh(&in[11 * 4]);
W12 = crypto_load_be32toh(&in[12 * 4]);
W13 = crypto_load_be32toh(&in[13 * 4]);
W14 = crypto_load_be32toh(&in[14 * 4]);
W15 = crypto_load_be32toh(&in[15 * 4]);
K[0] = crypto_load_be32toh(&key[0 * 4]) ^ SM4_FK[0];
K[1] = crypto_load_be32toh(&key[1 * 4]) ^ SM4_FK[1];
K[2] = crypto_load_be32toh(&key[2 * 4]) ^ SM4_FK[2];
K[3] = crypto_load_be32toh(&key[3 * 4]) ^ SM4_FK[3];
B0 = crypto_load_be32toh(&in[0 * 4]);
B1 = crypto_load_be32toh(&in[1 * 4]);
B2 = crypto_load_be32toh(&in[2 * 4]);
B3 = crypto_load_be32toh(&in[3 * 4]);
B0 = crypto_load_be32toh(&in[0 * 4]);
B1 = crypto_load_be32toh(&in[1 * 4]);
B2 = crypto_load_be32toh(&in[2 * 4]);
B3 = crypto_load_be32toh(&in[3 * 4]);