当前位置: 首页 > 图文教程 > 开发语言 > VC++ > 由汇编内核的MD5算法编写谈代码优化
由汇编内核的MD5算法编写谈代码优化 下载本文示例工程 开始我们做个实验,先打开两个文档附带的程序,一个工程是MD5C,一个工程是MD5ASM,其中MD5C是从VCKBASE下载的md5算法的标准C语言原代码,MD5ASM是我修改后的md5算法原代码。我给这两个工程的main函数里面都添加了一段回朔代码,用来产生0~99999999的数字,然后用这两个工程里面的可执行文件去对每个数字md5加密。好了,经过一段时间的等待后,就可以看到类似的结果了: 在开始正题之前,大家需要清楚一件事,就是MD5C里面的代码虽然效率不高,但绝对是优秀的,因为它主要在演示md5的算法,用的是纯粹的C,没有添加任何平台相干的代码,而我改写的MD5ASM是只能够运行于x86上的windows系统中。所以速度是以兼容性来交换的。 static void Encode (unsigned char *output, unsigned int *input, unsigned int len){ unsigned int i, j; for (i = 0, j = 0; j < len; i++, j += 4) { output[j] = (unsigned char)(input[i] & 0xff); output[j+1] = (unsigned char)((input[i] >> 8) & 0xff); output[j+2] = (unsigned char)((input[i] >> 16) & 0xff); output[j+3] = (unsigned char)((input[i] >> 24) & 0xff); }} 这是一段将整数数组转换成为字符数组的代码,我们看看它到底做了些什么。假设主函数输入了一个整数0x30313233,那么这个子函数的调用就可以写成下面的样子:Encode (output, input, 1)Input指向一个整数数组,数组的第一个元素是0x30313233,我们接下来看函数转换 i=0,j=0output[0]= (unsigned char)(input[0]& 0xff)=0x33output[1]= (unsigned char)(input[0]& 0xff)=0x32output[2]= (unsigned char)(input[0]& 0xff)=0x31output[3]= (unsigned char)(input[0]& 0xff)=0x30i=0,j=4 跳出循环 output的内存排列顺序为 +--+--+--+--+-- |33|32|31|30| +--+--+--+--+-- ^ output 现在大家注意了,input的排列顺序是什么?由计算机原理可知道,在计算机内部,数据的存放顺序是“高位对应高位,低位对应低位”,0x30313233中的33因为是个位,是低位,所以对应内存单元的最低位,同理30在内存单元的最高位,由此推出0x30313233在数组中的排列顺序为: +--+--+--+--+-- output=(unsigned char *)input;把这个地方叫作算法的优化可能有点牵强,但是算法的优化确实是最为重要的,比如说搜索算法,如果选择不当,可能要丧失很多的效率。 再观察一下MD5C里面的一段代码: static void MD5_memcpy (unsigned char *output, unsigned int *input, unsigned int len){ unsigned int i; for (i = 0; i < len; i++) output[i] = input[i];} 这处的为什么要修改是非常明显的,for循环是非常慢的,我们一般可以把类似的代码替换成为C的库函数或者操作系统的标准函数,如: CopyMemory ()memcpy()这种内存代码你也千万不要尝试自己去实现,那将是一种灾难,在每个操作系统中,内存拷贝可以说是非常频繁的,所以系统的内存拷贝函数基本上都是非常完美的,不信的话你可以自己写一段内存拷贝函数,然后和系统的内 |