一处JS反调试引发的思考

举报
亿人安全 发表于 2023/05/30 15:23:49 2023/05/30
【摘要】 起因白帽子们挖Web漏洞时,JavaScript信息是至关重要的一环从JS中可以得到隐藏接口等信息,然后尝试挖掘越权,SQL注入和上传等洞笔者刚入门时候曾用这种办法挖到了一些CNVD,算是收获颇丰回到主题,审计JS能够获得重要信息,然而并不是所有JS都能直接拿来看很多情况下白帽子们将会面临混淆后的JS,这时候就需要尝试逆向调试分析了最近在研究JS逆向相关的事情,遇到了一处比较有趣的代码也许对...

起因

白帽子们挖Web漏洞时,JavaScript信息是至关重要的一环

从JS中可以得到隐藏接口等信息,然后尝试挖掘越权,SQL注入和上传等洞

笔者刚入门时候曾用这种办法挖到了一些CNVD,算是收获颇丰


回到主题,审计JS能够获得重要信息,然而并不是所有JS都能直接拿来看

很多情况下白帽子们将会面临混淆后的JS,这时候就需要尝试逆向调试分析了


最近在研究JS逆向相关的事情,遇到了一处比较有趣的代码

也许对于大佬来说很简单,不过我不太懂JS,第一次遇到感觉挺有趣的


起因是发现调试该JS时候会发现卡死,但目标网站在正常使用该JS脚本


分析

做全局JavaScript做了一定的分析后,最终跟踪到代码如下

注意到其中有类似正则的地方,所有第一印象这里可能是业务逻辑代码,分析后发现并不是

var _0x578a10 = _0x2ba9['nKWcry'][_0x101b8f];
if (_0x578a10 === undefined) {
   var _0x4b1809 = function (_0x3b1d14) {
       this['YlKlnG'] = _0x3b1d14;
       this['NsTJKl'] = [0x1, 0x0, 0x0];
       this['HILIkx'] = function () {
           return 'newState';
      };
       this['GGmyeM'] = '\x5cw+\x20*\x5c(\x5c)\x20*{\x5cw+\x20*';
       this['VUtdVO'] = '[\x27|\x22].+[\x27|\x22];?\x20*}';
  };
   _0x4b1809['prototype']['OsLPar'] = function () {
       var _0x1403ab = new RegExp(this['GGmyeM'] + this['VUtdVO']);
       var _0x3fadf0 = _0x1403ab['test'](this['HILIkx']['toString']()) ? --this['NsTJKl'][0x1] : --this['NsTJKl'][0x0];
       return this['anWLTR'](_0x3fadf0);
  };
   _0x4b1809['prototype']['anWLTR'] = function (_0x26db32) {
       if (!Boolean(~_0x26db32)) {
           return _0x26db32;
      }
       return this['xTDWoN'](this['YlKlnG']);
  };
   _0x4b1809['prototype']['xTDWoN'] = function (_0x597ca7) {
       for (var _0x3e27c4 = 0x0, _0x192434 = this['NsTJKl']['length']; _0x3e27c4 < _0x192434; _0x3e27c4++) {
           this['NsTJKl']['push'](Math['round'](Math['random']()));
           _0x192434 = this['NsTJKl']['length'];
      }
       return _0x597ca7(this['NsTJKl'][0x0]);
  };
   new _0x4b1809(_0x2ba9)['OsLPar']();
   _0x27941a = _0x2ba9['dzoqWA'](_0x27941a);
   _0x2ba9['nKWcry'][_0x101b8f] = _0x27941a;
} else {
   _0x27941a = _0x578a10;
}
return _0x27941a;


在一开始定义了大函数_0x4b1809

最终这样调用:new _0x4b1809(_0x2ba9)['OsLPar']();

跟入OsLPar函数

function () {
       var _0x1403ab = new RegExp(this['GGmyeM'] + this['VUtdVO']);
       var _0x3fadf0 = _0x1403ab['test'](this['HILIkx']['toString']()) ? --this['NsTJKl'][0x1] : --this['NsTJKl'][0x0];
       return this['anWLTR'](_0x3fadf0);
};


_0x1403ab拼出了一个正则:\x5cw+\x20*\x5c(\x5c)\x20*{\x5cw+\x20*[\x27|\x22].+[\x27|\x22];?\x20*}

化简后为其实就可以看懂了:\w+ *\(\) *{\w+ *['|"].+['|"];? *}

不难猜出,该正则匹配的是:aaa () {aaa'aaa';}这样的字符串,看上去似乎是一个函数调用


照着写一段,验证猜测

var a = new RegExp("\x5cw+\x20*\x5c(\x5c)\x20*{\x5cw+\x20*[\x27|\x22].+[\x27|\x22];?\x20*}");
var b = a.test("function a () {return 'ok';}");
var c = a.test("function a () {return 'ok'; }");
var d = a.test("function a () { return 'ok';}");
console.log(b);// true
console.log(c);// true
console.log(d);// false


得出结论,函数调用的最后分号后可以跟多个空格,但左大括号之后必须跟字符串

这个正则正是导致我卡死的反调试核心代码


回到代码中_0x1403ab['test']等价于上文代码的a.test

var _0x3fadf0 = _0x1403ab['test'](this['HILIkx']['toString']()) ? --this['NsTJKl'][0x1] : --this['NsTJKl'][0x0];
return this['anWLTR'](_0x3fadf0);


函数参数为this['HILIkx']['toString']()

这个参数是正则需要匹配的目标,跟入HILIkx函数发现只是简单的return字符串

this['HILIkx'] = function () {
   return 'newState';
};


注意最后还有一个toString代码,这里的toString不同于Java的方法

这里直接返回的是纯字符串"function () {\n return'newState';\n};"

显然可以得出结论,无法匹配到正则\w+ *\(\) *{\w+ *['|"].+['|"];? *}因此返回false

继续看后面的表达式,如果为true会从NsTJKl数组中移除1否则移除0,暂不分析这里的用途

this['NsTJKl'] = [0x1, 0x0, 0x0];


函数的return会跟入anWLTR函数,传入的_0x26db32一定是false

其中的~是非运算,所以代码最终会进入this['xTDWoN'](this['YlKlnG'])

_0x4b1809['prototype']['anWLTR'] = function (_0x26db32) {
   if (!Boolean(~_0x26db32)) {
       return _0x26db32;
  }
   return this['xTDWoN'](this['YlKlnG']);
};


跟入xTDWoN函数,先不考虑传入的参数,因为参数只会影响到返回值

_0x4b1809['prototype']['xTDWoN'] = function (_0x597ca7) {
   for (var _0x3e27c4 = 0x0, _0x192434 = this['NsTJKl']['length']; _0x3e27c4 < _0x192434; _0x3e27c4++) {
       this['NsTJKl']['push'](Math['round'](Math['random']()));
       _0x192434 = this['NsTJKl']['length'];
  }
   return _0x597ca7(this['NsTJKl'][0x0]);
};


重点关注for循环内容,次数数组this['NsTJKl']['length']长度为2大于0,所以成功进入for循环

将for循环化简如下,发现for循环内会往数组NsTJKl中push一个随机数

然后将数组长度赋值给length,本来进入for循环的条件i<length是满足的,继续加入随机数导致for循环永远满足,也就是死循环

for (var i = 0, length = this['NsTJKl']['length']; i < length; i++) {
   this['NsTJKl']['push'](Math['round'](Math['random']()));
   length = this['NsTJKl']['length'];
}


这里找到了卡死的原因,本质是一处的正则没有匹配到


问题来了,为什么目标网站的正则可以匹配到,但我本地无法匹配到

原因不难,目标网站的JS是压缩后的代码

this['HILIkx'] = function () {return 'newState';};


逆向者在本地尝试做破解的时候,会将代码格式化(无论chrome还是vscode里都会很容易地进行格式化)

格式化后的代码不满足条件,所以会进入死循环


绕过方式其实也简单,还原回压缩格式即可

......
var _0x4b1809 = function (_0x3b1d14) {
   this['YlKlnG'] = _0x3b1d14;
   this['NsTJKl'] = [0x1, 0x0, 0x0];
   this['HILIkx'] = function () {return 'newState';};
   this['GGmyeM'] = '\x5cw+\x20*\x5c(\x5c)\x20*{\x5cw+\x20*';
   this['VUtdVO'] = '[\x27|\x22].+[\x27|\x22];?\x20*}';
};
......


实现

使用node的babel库

npm install @babel/parser


上手写代码

const parser = require("@babel/parser");
const traverse = require("@babel/traverse").default;
const t = require("@babel/types");
const generator = require("@babel/generator").default;
const fs = require("fs");

const jscode = fs.readFileSync("../demo.js", {
   encoding: "utf-8"
});
let ast = parser.parse(jscode);

// 正则初始化
var targetRegex = "\x5cw+\x20*\x5c(\x5c)\x20*{\x5cw+\x20*[\x27|\x22].+[\x27|\x22];?\x20*}";
var initValue = t.newExpression(t.identifier("RegExp"),[
   t.stringLiteral(targetRegex),
]);
var regDec = t.variableDeclaration("var", [t.variableDeclarator(t.identifier("_4ra1n"), initValue)]);

// 用于验证的函数
var tempBlock = t.blockStatement([t.returnStatement(t.stringLiteral("_4ra3n"))]);
var funcExpr = t.functionExpression(t.identifier("_4ra2n"),[],tempBlock);
var funcDec = t.variableDeclaration("var",[t.variableDeclarator(t.identifier("_4ra4n"), funcExpr)]);

// 正则test调用
var tempMem = t.memberExpression(t.identifier("_4ra1n"),t.stringLiteral("test"),true);
var callExpr =  t.callExpression(tempMem,[t.identifier("_4ra4n")]);
var callDec = t.variableDeclaration("var",[t.variableDeclarator(t.identifier("_4ra5n"),callExpr)]);

// 最终if判断和死循环模拟
var tempCallExpr = t.callExpression(t.identifier("Boolean"),[t.identifier("_4ra5n")]);
var tempForBlock = t.blockStatement([t.forStatement(null,null,null,t.blockStatement([]))]);
var unaryExpr = t.unaryExpression("!",tempCallExpr);
var ifState = t.ifStatement(unaryExpr,tempForBlock);

console.log("start");
// 遍历语法树添加
traverse(ast,{
   FunctionDeclaration(path) {
       let blockStatement = path.node.body;
       blockStatement.body.unshift(ifState);
       blockStatement.body.unshift(callDec);
       blockStatement.body.unshift(regDec);
       blockStatement.body.unshift(funcDec);
       path.get("body").replaceWith(blockStatement);
  }
});

let code = generator(ast).code;
fs.writeFile("./demo-new.js", code, (err) => { });


给出一个demo.js文件,简单的一个两数相加函数

function add(a, b) {
   var c = a + b;
   return c;
}


经过笔者自制工具处理后代码如下,给末尾添加调用语句add(1,2);执行该JS文件发现卡死

function add(a, b) {
 var _4ra4n = function _4ra2n() {
   return "_4ra3n";
};

 var _4ra1n = new RegExp("\\w+ *\\(\\) *{\\w+ *['|\"].+['|\"];? *}");

 var _4ra5n = _4ra1n["test"](_4ra4n);

 if (!Boolean(_4ra5n)) {
   for (;;) {}
}

 var c = a + b;
 return c;
}

add(1,2);


使用babel库的压缩代码功能

let code = generator(ast, {
   retainLines: false,
   comments: false,
   compact: true
}).code;


得到如下代码,执行代码后发现没问题

function add(a,b){var _4ra4n=function _4ra2n(){return"_4ra3n";};var _4ra1n=new RegExp("\\w+ *\\(\\) *{\\w+ *['|\"].+['|\"];? *}");var _4ra5n=_4ra1n["test"](_4ra4n);if(!Boolean(_4ra5n)){for(;;){}}var c=a+b;return c;}
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。