Python 爬虫进阶必备 | 某小众电商请求参数加密逻辑分析

举报
xianyuplus 发表于 2021/08/18 16:22:29 2021/08/18
【摘要】 今日网站aHR0cHM6Ly9saXN0Lm1vZ3UuY29tL3NlYXJjaC9nb29kcz9xPSVFNSVCNyVBNSVFOCVBMyU4NSVFOCVBMyVBNA== 加密分析在这个站的页面上按 F12 没有反应,我以为有什么防 debugger 的操作,结果防了个寂寞,啥都不是打开控制台,向下滑动刷新请求,找到页面的请求是下面这个注意:虽然往下滑动可以加载新页面,但是这...

今日网站

aHR0cHM6Ly9saXN0Lm1vZ3UuY29tL3NlYXJjaC9nb29kcz9xPSVFNSVCNyVBNSVFOCVBMyU4NSVFOCVBMyVBNA==

加密分析

在这个站的页面上按 F12 没有反应,我以为有什么防 debugger 的操作,结果防了个寂寞,啥都不是

打开控制台,向下滑动刷新请求,找到页面的请求是下面这个

注意:

虽然往下滑动可以加载新页面,但是这个请求并不是xhr

Networkxhr过滤器下是没有这个请求的,这个请求是个jsonp请求,是由js发起的,在Networkjs过滤器下可以找到这个请求,所以意味着用xhr断点无法调试这个请求。

这个请求的参数如下

一个个检索看看,感觉是比较简单的

提交参数一般逻辑都写在一块,比较好维护,所以可能就会像下面这样检索一个就能把参数找的七七八八

还有一个mw-sign在同一个文件里也能找到

接下来一个个看逻辑,mw-appkey是一个switch逻辑

mw-ttid是一个字符串拼接的操作

this.__ttid = "NMMain@" + [this._type, this._platform, this._version].join("_")
// this._type = "mgj"
// this._platform = "pc"
// this._version = "1.0"

mw-t获取是当前的时间戳

mw-t = String(Date.now())

mw-uuid获取的cookie中的__mgjuuid

那么这个 cookie 是怎么生成的呢?经过分析cookie里的值是set-cookie返回的

// t = __mgjuuid
s = function(t) {
            var e = document.cookie.match(new RegExp("(^| )" + t + "=([^;]*)(;|$)"));
            return null !== e ? decodeURIComponent(e[2]) : ""
}

mw-h5-os是一个固定值unkown

完成以上这些值的获取之后,合并到并传入到buildQuery方法中

e.headers["mw-sign"] = z(this.buildQuery(e))

这里的buildQuery是将e的内容用&拼接,然后将结果传入z

经过buildQuery得到的值如下

100028&pc-search-wall&unknown&1628739222904&NMMain@mgj_pc_1.0&c6603e42-558f-45b7-8423-9c7cba8990df&mwp.pagani.search&19&694b9a6ca4529f328a60392d782ec9a5&8f6d59b5ec26d24c15b05a608b1389da_1628668322693

将这串值传入z,得到的值是下面这串

这串值就很简单啦,长度为 32 ,估计是hash相关的算法,对于1632的长度密文大家要有一定的敏感度

放到网站上验证一下想法

md5的结果完全一致,所以z的逻辑就是一个md5算法。

以上就是本次的全部内容了,咱们下次再会~

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。