Python爬虫:js的btoa和atob和pythonBase64编码解码比对分析

举报
彭世瑜 发表于 2021/08/13 23:31:10 2021/08/13
【摘要】 比对js和py的Base64编码解码,探求一个共通之处 javascript代码 对英文字符进行base64编码解码 var str = 'javascript'; // 编码 btoa(str) // "amF2YXNjcmlwdA==" // 解码 atob("amF2YXNjcmlwdA==") // "javascript" 1234567 对中...

比对js和py的Base64编码解码,探求一个共通之处

javascript代码

  1. 对英文字符进行base64编码解码
var str = 'javascript';

// 编码
btoa(str)  // "amF2YXNjcmlwdA=="

// 解码
atob("amF2YXNjcmlwdA==")  // "javascript"

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  1. 对中文字符进行base64编码解码
var str = "China,中国"

btoa(str)
/*
VM156:1 Uncaught DOMException: Failed to execute 'btoa' on 'Window': 
The string to be encoded contains characters outside of the Latin1 range.
*/

// 先对字符串进行编码
encodeURIComponent(str) // "China%EF%BC%8C%E4%B8%AD%E5%9B%BD"

// 编码
btoa(encodeURIComponent(str))  // "Q2hpbmElRUYlQkMlOEMlRTQlQjglQUQlRTUlOUIlQkQ="

// 解码
decodeURIComponent(atob("Q2hpbmElRUYlQkMlOEMlRTQlQjglQUQlRTUlOUIlQkQ="))  // "China,中国"

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16

python3代码

  1. 对英文字符进行base64编码解码
import base64

name = "javascript"

# 编码
base64.b64encode(name.encode())  # b'amF2YXNjcmlwdA=='

# 解码
base64.b64decode(b'amF2YXNjcmlwdA==').decode()  # javascript

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  1. 对中文字符进行base64编码解码

name = "China,中国"

# 编码
base64.b64encode(name.encode())  # b'Q2hpbmHvvIzkuK3lm70='

# 解码
base64.b64decode(b'Q2hpbmHvvIzkuK3lm70=').decode()  # China,中国

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

总结:
js和py3对英文的处理方式基本一致,编码结果也一样
发现,js对中文编码会报错,py对中文可以直接编码

按照js的思路,先按照URI的编码方式将字符编码


from urllib.request import quote, unquote
 
name = "China,中国"

# 先对文字进行url方式编码
quote(name)  # 'China%EF%BC%8C%E4%B8%AD%E5%9B%BD'

# 编码
base64.b64encode(quote(name).encode()) 
# b'Q2hpbmElRUYlQkMlOEMlRTQlQjglQUQlRTUlOUIlQkQ='

# 解码
unquote(base64.b64decode(b'Q2hpbmElRUYlQkMlOEMlRTQlQjglQUQlRTUlOUIlQkQ=').decode())
# China,中国

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

总结:

语言 编码 解码
javascript window.btoa(encodeURIComponent(s)) decodeURIComponent(window.atob(b))
pyhton base64.b64encode(quote(s).encode()) unquote(base64.b64decode(b).decode())

其中:
s 表示字符串
b 表示编码后的字符

这样,js和python就可以实现相同的Base64编码解码,可以用于前端代码解码,将js代码转换为python代码

参考

  1. javascript 使用btoa和atob来进行Base64转码和解码
  2. Python编程:URL网址链接中的中文编码与解码
  3. 简单明了区分escape、encodeURI和encodeURIComponent

文章来源: pengshiyu.blog.csdn.net,作者:彭世瑜,版权归原作者所有,如需转载,请联系作者。

原文链接:pengshiyu.blog.csdn.net/article/details/83027613

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。