|
到一些黑客站点上转转,发现那些最受欢迎、点击次数最多的文章都是一些“教菜鸟使用木马”“入侵初级教程”之类文章,而“Outlook Express HTML邮件超长字节href值缓冲溢出缺陷”“PHP fopen()函数易遭到CRLF Injection攻击”这种文章却乏人问津,尽管这或许才是真正高手所关心的。
现在看雪论坛上后一种文章逐渐增多,当然是因为大家的水平都提高了,但也给刚入门的菜鸟带来了麻烦,来了之后什么也看不懂,在高手看来不是问题的问题常常困扰新手们很长时间:为什么这里是关键跳转,那边是重要CALL?为什么有的CALL要跟进,有的CALL只需带过?我按照高手所写的一步步做下去成功了,可为什么要这样做呢?我想更有不少人好不容易破了一个明码比较的软件,想贴出来又怕为高手所不屑而做罢。
因此我找了一个非常简单的CrackMe(如果你是高手,只静态调试应该就可以搞定了:)),从头到尾仔仔细细地写出了分析过程,在里面加入了些我认为应该注意的地方,希望能对刚入门的朋友有些帮助。我不是什么高手,最多算是破解得熟练一点儿了而已,也许这样才更能了解新手们的难处吧。
这里我用W32Dasm作为静态反汇编的工具,各位可能有用C32Asm或者其他的,基本功能其实应该差不多。
先胡乱输入用户名和注册码,点\"Check the Serial\",看看错误信息是什么(如果出现“注册码正确”的话就别在这儿看了,赶紧买彩票去:D)好出来了,“This serial is *NOT* Valid!! Try again... : UNREGISTERED”。
好了运行W32Dasm把它反汇编,在串式参考(string reference)中找吧,注意当字串较长时有时不能完全显示,这时只要找前面一段就行了,比如这次就是,找到\"This serial is *NOT* Valid!! Try \",就是它了,双击来到引用该字串的地方。(PS:有时错误信息在代码中会不止一次出现,这时只要多次双击就能找到其他的地方。)
下面我要引用代码了(这是在W32DASM里的形式,如果你用OD或SI动态跟踪时形式会略有不同)。不要被这么多代码搞晕了,建议先跳过代码看我的后面的说明,再从代码中对照。
代码:--------------------------------------------------------------------------------
* Possible Reference to Dialog: DialogID_0001, CONTROL_ID:0066, \"\"
|
:004****1085 6A66 push 000****0066 ;输入用户名的文本框ID
:004****1087 53 push ebx ;对话框句柄
* Reference T USER32.GetDlgItem, Ord:0000h
|
:004****1088 E8159C0000 Call 0040ACA2 ;得到文本框句柄
:00***08D 6A64 push 000****0064 ;得到字符串的最大长度
:00***08F 8D9548FFFFFF lea edx, dword ptr [ebp+FFFFFF48]
:004****1095 52 push edx ;EDX是存取字符串的地址
:004****1096 50 push eax ;EAX是上面得到的文本框句柄
* Reference T USER32.GetWindowTextA, Ord:0000h
|
:004****1097 E8129C0000 Call 0040ACAE ;得到用户名,在[ebp+FFFFFF48]
* Possible Reference to Dialog: DialogID_0001, CONTROL_ID:0068, \"\"
|
:00***09C 6A68 push 000****0068 ;同样的操作,输入注册码的文本框ID
:00***09E 53 push ebx
* Reference T USER32.GetDlgItem, Ord:0000h
|
:00***09F E8FE9B0000 Call 0040ACA2
:00***10A4 6A64 push 000****0064
:00***10A6 8D8DE4FEFFFF lea ecx, dword ptr [ebp+FFFFFEE4]
:00***10AC 51 push ecx
:00***10AD 50 push eax
* Reference T USER32.GetWindowTextA, Ord:0000h
|
:00***10AE E8FB9B0000 Call 0040ACAE ;得到注册码,在[ebp+FFFFFEE4]
* Possible Reference to Dialog: DialogID_0001, CONTROL_ID:0067, \"\"
|
:00***10B3 6A67 push 000****0067 ;这个是最下面的提示的文本框的ID
:00***10B5 53 push ebx
7
* Reference T USER32.GetDlgItem, Ord:0000h
|
:00***10B6 E8E79B0000 Call 0040ACA2 ;得到句柄
:00***10BB 8BF0 mov esi, eax ;放在ESI备用
:00***10BD 8D8548FFFFFF lea eax, dword ptr [ebp+FFFFFF48]
:00***10C3 50 push eax ;指向用户名
:00***10C4 E867****0000 call 004****1630 ;得到用户名长度
:00***10C9 59 pop ecx
:00***10CA 8945D8 mov dword ptr [ebp-28], eax ;长度放在[ebp-28]
:00***10CD 8D95E4FEFFFF lea edx, dword ptr [ebp+FFFFFEE4]
:00***10D3 52 push edx ;指向注册码
:00***10D4 E857****0000 call 004****1630 ;得到注册码长度
:00***10D9 59 pop ecx
:00***10DA 68EAB04***00 push 0040B0EA
:00***10DF E84C05***00 call 004****1630
:00***10E4 59 pop ecx
:00***10E5 680EB14***00 push 0040B10E
:00***10EA E841****0000 call 004****1630
:00***10EF 59 pop ecx
:00***10F0 837DD803 cmp dword ptr [ebp-28], 000****0003
:00***10F4 7E7B jle 004****1171 ;用户名长度不能小于等于3
:00***10F6 90 nop
:00***10F7 90 nop
:00***10F8 90 nop
:00***10F9 90 nop
:00***10FA 33C9 xor ecx, ecx
:00***10FC 33D2 xor edx, edx
:00***10FE 33DB xor ebx, ebx
:004****1100 33C0 xor eax, eax
:004****1102 837DD832 cmp dword ptr [ebp-28], 000****0032
:004****1106 7D69 jge 004****1171 ;用户名长度不能大于等于32h
:004****1108 90 nop
:004****1109 90 nop
:00***10A 90 nop
:00***10B 90 nop
* Referenced by a (U)nconditional or (C)onditional Jump at Address:
|:00***11C(C)
|
:00***10C 0FBE840D48FFFFFF movsx eax, byte ptr [ebp+ecx-00***00B8];依次取用户名的字符
:004****1114 41 inc ecx ;ECX为循环变量
:004****1115 33C1 xor eax, ecx ;取的字符与循环变量XOR
:004****1117 03D8 add ebx, eax ;把结果累加到EBX
:004****1119 3B4DD8 cmp ecx, dword ptr [ebp-28] ;循环变量与用户名长度相比
:00***11C 75EE jne 00***10C ;如果未取完就跳回继续
:00***11E 6BC006 imul eax, 000****0006 ;最后一轮计算的结果在EAX, 乘6
:004****1121 C1E307 shl ebx, 07 ;前面累加结果左移7位
:004****1124 03C3 add eax, ebx ;相加
:004****1126 8945C8 mov dword ptr [ebp-38], eax
:004****1129 FF75C8 push [ebp-38] ;把上面结果压栈
* Possible StringData Ref from Data Obj ->\"%lX\"
|
:00***12C 6838B44***00 push 0040B438 ;一个转换的标识
:004****1131 8D8D80FEFFFF lea ecx, dword ptr [ebp+FFFFFE80]
:004****1137 51 push ecx ;存放转换结果的地址
:004****1138 E8873D0000 call 00***04EC4 ;数字转为十六进制字串
:00***13D 83C40C add esp, 00***00C
:004****1140 8D8580FEFFFF lea eax, dword ptr [ebp+FFFFFE80]
:004****1146 50 push eax ;上面转换的字串
:004****1147 8D95E4FEFFFF lea edx, dword ptr [ebp+FFFFFEE4]
:00***14D 52 push edx ;假注册码
* Reference T KERNEL32.lstrcmpA, Ord:0000h
|
:00***14E E8339C0000 Call 0040AD86 ;比较
:004****1153 85C0 test eax, eax
:004****1155 750D jne 004****1164 ;这里就是关键的跳转
* Possible StringData Ref from Data Obj ->\"Congratulations! IF this number \"
->\"comes *FROM YOUR* keygen, Write \"
->\"a tutorial dude ;).\"
|
:004****1157 683CB44***00 push 0040B43C ;指向表示成功的字符串
:00***15C 56 push esi ;ESI还记得么?那个提示文本框的句柄
* Reference T USER32.SetWindowTextA, Ord:0000h
|
:00***15D E8289B0000 Call 0040AC8A ;显示出来
:004****1162 EB18 jmp 00***17C
* Referenced by a (U)nconditional or (C)onditional Jump at Address:
|:004****1155(C)
|
* Possible StringData Ref from Data Obj ->\"This serial is *NOT* Valid!! Try \"
->\"again... : UNREGISTERED\"
|
:004****1164 6890B44***00 push 0040B490 ;开始时停在这句,向上找跳转
:004****1169 56 push esi ;ESI提示文本框的句柄
* Reference T USER32.SetWindowTextA, Ord:0000h
|
:00***16A E81B9B0000 Call 0040AC8A
:00***16F EB0B jmp 00***17C
* Referenced by a (U)nconditional or (C)onditional Jump at Addresses:
|:00***10F4(C), :004****1106(C)
|
* Possible StringData Ref from Data Obj ->\"Name must contain more than 4 \"
->\"chars and less than 50 chars !!\"
|
:004****1171 68C9B44***00 push 0040B4C9 ;用户名不符合要求跳到这里
:004****1176 56 push esi ;ESI提示文本框的句柄
* Reference T USER32.SetWindowTextA, Ord:0000h
|
:004****1177 E80E9B0000 Call 0040AC8A
* Referenced by a (U)nconditional or (C)onditional Jump at Addresses:
|:004****1162(U), :00***16F(U)
|
:00***17C 5F pop edi
:00***17D 5E pop esi
:00***17E 5B pop ebx
:00***17F 8BE5 mov esp, ebp
:004****1181 5D pop ebp ;整理一下返回了
:004****1182 C3 ret
--------------------------------------------------------------------------------双击后光标停在40***64这一句。很明显,如果我们来到这句时我们就死翘翘了,而如果我们的注册码正确的话当然不会来到这一句(废话太多了:p)那么这一句上面就肯定会有一个条件跳转的指令。(这是找爆破点时的基本思想)向上找找看,找到了:
:004****1155 750D jne 004****1164
正好跳到40***64错误信息那一句。呵呵,如果你想爆破的话,只要把750D改成740D(je,把条件反过来,注册码错误就显示正确信息:D)或者改成EB0D(jmp,无条件跳转,不管三七二十一就正确)。
OK,我们不能满足于此啊,咱们看看它的算法是怎样的,也像那些神秘兮兮的高手似的写一个注册机出来。:D
我先给各位补一点课,就是对函数的调用。除了一些DELPHI程序之外,对函数参数的传递大都用堆栈来完成,简单地说就是把函数的各个参数先PUSH进去,然后再CALL这个函数。在函数内部呢,一般[ebp+8]是第一个参数,[ebp+C]是第二个参数,每次多加4依此类推。而函数内部的局部变量常用[ebp-4][ebp-8]...等等。(原因讲起来有点复杂,先记住就行了)函数的返回值在EAX里。
一般来说,软件的判断注册部分都是一个函数,在函数开头最经典的两句就是
push ebp
mov ebp,esp
这和堆栈处理有关,我们菜鸟先不用太明白,知道这通常是一个函数的开始就行了。向上找找有没有丫,找到了没有,在最上面哪(我上面没有列出来)。如果你想完整地判断它的算法的话,一般从这里开始就行了。在这个程序中前面都是一些初始化之类的东东,所以我把前面一部分省略了。(这也是破解时的原则,不要在无关紧要的地方费功夫,在高级语言中,代码有很大部分是机器自动生成的,电脑一行行写代码不知道累,人脑一行行读代码怎么受得了?你的脑袋是几GHz的CPU?常见有些没有破解经验的汇编高手,完全懂得每行代码的意思,就是找不到关键的地方,原来他跟了半天都是在API里转,白做无用功了。)
好了,现在可以动态调试了。我们在开头这里下个断点,一步步向下看,出现了一个CALL GetDlgItem,我们来看一看函数说明(手头一份这个是必需的)
HWND GetDlgItem(
HWND hDlg, // handle of dialog box
int nIDDlgItem // identifier of control
);
呵呵,简单的说这个函数就是让程序确定一个对话框上的控件,第一个参数是对话框的句柄,第二个参数是对话框上某个控件的ID,函数会返回该控件的句柄,这样在下面就可以用这个句柄来操作了。看程序:
代码:--------------------------------------------------------------------------------
* Possible Reference to Dialog: DialogID_0001, CONTROL_ID:0066, \"\"
|
:004****1085 6A66 push 000****0066 ;控件ID
:004****1087 53 push ebx ;对话框句柄
* Reference T USER32.GetDlgItem, Ord:0000h
|
:004****1088 E8159C0000 Call 0040ACA2
--------------------------------------------------------------------------------看见第一行没有,DialogID_0001,CONTROL_ID:0066,压进去了一个66作为第二个参数:控件ID(注意API调用是从右至左,也就是最后面一个参数先PUSH),用 资源查看工具 看看ID为66的是甚么呀,呵呵就是那个输入用户名的文本框嘛。好了,现在我们有文本框的句柄了,存在EAX里。接着向下看,又一个API,是GetWindowText。看看说明:
int GetWindowText(
HWND hWnd, // handle of window or control with text
LPTSTR lpString, // address of buffer for text
int nMaxCount // maximum number of characters to copy
);
从名字也能猜出来了,这个函数就是得到一个窗口类控件的文本。第一个参数是该控件的句柄,第二个是存放得到的文本的缓冲区的地址,第三个参数设定取文本的最大长度。看程序:
代码:--------------------------------------------------------------------------------
:00***08D 6A64 push 000****0064 ;最大长度
:00***08F 8D9548FFFFFF lea edx, dword ptr [ebp+FFFFFF48];把[ebp+FFFFFF48]先放在EDX里
:004****1095 52 push edx ;缓冲区地址[ebp+FFFFFF48]
:004****1096 50 push eax ;EAX?是上面那个API的返回值呀,控件句柄
* Reference T USER32.GetWindowTextA, Ord:0000h
|
:004****1097 E8129C0000 Call 0040ACAE
--------------------------------------------------------------------------------好了,现在 D ebp+FFFFFF48 看看,是不是输入的用户名?(说明,在OLLY或SICE里这个是[ebp-B8]的形式,其实是一样的)
下面有类似的操作,只是控件ID成了68,可想而知就是得到注册码了,注册码放在[ebp+FFFFFEE4]。
呵呵,继续,到了这么几句:
代码:--------------------------------------------------------------------------------
:00***10BD 8D8548FFFFFF lea eax, dword ptr [ebp+FFFFFF48]
:00***10C3 50 push eax
:00***10C4 E867****0000 call 004****1630
--------------------------------------------------------------------------------这是干甚么牙?要不要进4010C4这个CALL 40***30看看?且慢!我前面说过了,不要在无关紧要的地方费力,(啪!一个鸡蛋扔上来:谁知道这里是不是重要啊?)别急嘛,一般来说,先粗略地跟一遍,试着猜猜CALL的作用。如果发现返回值很可疑,再跟进细看也不迟。(这就需要一定的“直觉”了,英文叫“Sence”,台湾老大叫“触机”或者“先死:D”,别担心,破解得多了自然会有这种感觉,这种感觉很难说出来,有时候一见那种阵势就知道关键地方到了)
又扯远了,我们回来看代码。一个CALL,前面有PUSH EAX,很明显是CALL的参数了。(见我前面的说明)看看EAX:lea eax,dword ptr [ebp+FFFFFF48]。[ebp+FFFFFF48]还有没有印象?对了,就是前面API调用中放用户名的地址呀。过了这里后D eax,呵呵不就是咱们的用户名吗,我输入的是“RoBa”,带过这个CALL后看看EAX是什么,嗯~~~~是4。想到什么了?没有?没关系咱们继续看下面:
代码:--------------------------------------------------------------------------------
:00***10C9 59 pop ecx
:00***10CA 8945D8 mov dword ptr [ebp-28], eax ;记住,上面的返回结果在[ebp-28]
:00***10CD 8D95E4FEFFFF lea edx, dword ptr [ebp+FFFFFEE4]
:00***10D3 52 push edx
:00***10D4 E857****0000 call 004****1630
--------------------------------------------------------------------------------
又是一个CALL 40***30,和上面一样的。看看它的参数EDX,[ebp+FFFFFEE4]呵就是假注册码呀,我输的是'876****4321',返回值EAX=8,发现什么没有?对,这个CALL就是求一个字符串的长度嘛,要是跟进去又给费不少时间。向下:
代码:--------------------------------------------------------------------------------
:00***10F0 837DD803 cmp dword ptr [ebp-28], 000****0003
:00***10F4 7E7B jle 004****1171
:004****1102 837DD832 cmp dword ptr [ebp-28], 000****0032
:004****1106 7D69 jge 004****1171
--------------------------------------------------------------------------------
还记得[ebp-28]是什么吗?对,就是用户名的长度,这几句的意思就很明显了,用户名的长度必须大于3小于32h,不然就跳到40***71去了,你可以跟过去看看是什么,呵呵是用户名不符合要求之类的提示。
好了我们来到关键地方喽:
代码:--------------------------------------------------------------------------------
* Referenced by a (U)nconditional or (C)onditional Jump at Address:
|:00***11C(C)
|
:00***10C 0FBE840D48FFFFFF movsx eax, byte ptr [ebp+ecx-00***00B8]
:004****1114 41 inc ecx
:004****1115 33C1 xor eax, ecx
:004****1117 03D8 add ebx, eax
:004****1119 3B4DD8 cmp ecx, dword ptr [ebp-28]
:00***11C 75EE jne 00***10C
--------------------------------------------------------------------------------
呵呵,是不是又晕了?[ebp+ecx-B8]这是啥呀?别着急,车到山前必有路。先 d ebp+ecx-B8看看,哟,不还是咱们的用户名吗?:D 怎么回事?好好想想,ecx现在是0,[ebp-B8]和[ebp+FFFFFF48](记得不?放用户名的地址)不是一回事嘛!(不明白的去补习一下负数的表示方法,我也不知道为什么W32DASM有时候非把-B8写成FFFFFF48)
再仔细看看,movsx eax,byte ptr [ebp+ecx-00***00B8],注意是byte ptr,即以字节的方式读取(就是说每次读出一个字符),而且又加上了个ecx。如果你破解多了的话,应该立刻就明白:关键的地方到了。
这是一个很典型的循环结构,看出来没?ecx就是循环变量了,每执行一次会从用户名中取一个字符,然后ecx加1,这样[ebp+ecx-B8]就指向用户名的下一个字符了。对取出来的字符与循环变量进行XOR运算,把结果累加到EBX。然后循环变量与[ebp-28]也就是用户名长度比较,如果不等于的话也就是还没取完,就返回上去继续取用户名的下一个字符。这样直到取完为止。
代码:--------------------------------------------------------------------------------
:00***11E 6BC006 imul eax, 000****0006 ;EAX其实是上面最后一轮计算的结果,乘6
:004****1121 C1E307 shl ebx, 07 ;EBX是几轮计算累加起来的结果,左移7位
:004****1124 03C3 add eax, ebx ;加起来
:004****1126 8945C8 mov dword ptr [ebp-38], eax
:004****1129 FF75C8 push [ebp-38] ;上面的结果,作为一个参数
* Possible StringData Ref from Data Obj ->\"%lX\"
|
:00***12C 6838B44***00 push 0040B438 ;\"%lX\"有点眼熟哟
:004****1131 8D8D80FEFFFF lea ecx, dword ptr [ebp+FFFFFE80]
:004****1137 51 push ecx ;这是什么呢?
:004****1138 E8873D0000 call 00***04EC4
:00***13D 83C40C add esp, 00***00C
--------------------------------------------------------------------------------
前面几句是继续上面的计算,把EAX*6和EBX左移7位的值加进来,然后结果复制到[ebp-38]这个局部变量里作为下面CALL的一个参数,接着[ebp+FFFFFE80]作第二个参数,然后又一个CALL,还是那样,先别着急跟进去,前后看看有没有可疑之处:
第一个参数[ebp-38],没什么好说的,上面计算的结果。第二个参数指向\"%lX\",这个字串写过C语言的都有印象吧,就是在printf里把一个数字按照大写的16进制方式显示出来所用的标识符,比方说把一个数字255转换成字串“FF”。(在WinAPI里叫wsprintf)第三个参数是什么呢?前面这种形式见多了吧,猜猜!
我们验证一下前面猜想是否正确,我用\"RoBa\"上面算出来的结果是46***30,也就是16进制的B55E,我们跟过这个CALL看看结果如何?什么,结果在哪?聪明的你还没想到吗,上面那第三个参数[ebp+FFFFFE80]就是结果的地址呀。怎么样不出所料吧。
(其实从40***13D这一句add esp,C也能看出来,因为在函数外平衡堆栈的只有这个一个参数数目不定的函数。引申一下,看不懂没关系啦:D )
接着看啦:
代码:--------------------------------------------------------------------------------
:004****1140 8D8580FEFFFF lea eax, dword ptr [ebp+FFFFFE80];眼熟吗,刚才的转换结果呀
:004****1146 50 push eax ;EAX指向上面转换得到的字符串
:004****1147 8D95E4FEFFFF lea edx, dword ptr [ebp+FFFFFEE4];这个很早了,向前面找找是啥
:00***14D 52 push edx ;EDX指向我们输入的假注册码
* Reference T KERNEL32.lstrcmpA, Ord:0000h
|
:00***14E E8339C0000 Call 0040AD86
:004****1153 85C0 test eax, eax
:004****1155 750D jne 004****1164 ;关键跳转哟
--------------------------------------------------------------------------------
哈哈,lstrcmp,什么意思不用我说了吧,当然是STRingCoMPare字符串比较啦。把计算的结果与前面输入的假码比较,相等就OK了。好了,现在把上面的完整的代码过一遍,怎么样,写个注册机不难吧?
代码:--------------------------------------------------------------------------------
#include
#include
#include
void main()
{
int EAX=0,EBX=0,len;
char name[50]={0};
char password[50]={0};
printf(\"Please input your name:\");
scanf(\"%s\",name);
len=strlen(name);
for (int i=0;i--------------------------------------------------------------------------------简单的C程序哟,你也可以用你熟悉的语言写一个。后记:这是一个简单的CRACKME,本来三言两语就能解决的,被我啰啰嗦嗦说了这么一大堆,就是希望能把问题真正地说明白了,希望通过这篇文章让你发现,破解软件乃至写注册机并不是多么困难的事,只要坚持下去,谁都有成为高手的那一天,也希望高手们能够抽时间发一些适合较低水平的文章或者至少对发这种文章的新手多多鼓励。 |
|