- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

BASE64Decoder小解

SHQ1874009 发表于 2023/11/24 08:53:24 2023/11/24

【摘要】 Base64 是网络上最常见的用于传输8Bit 字节代码的编码方式之一，大家可以查看RFC2045 ～RFC2049 ，上面有MIME 的详细规范。Base64 要求把每三个8Bit 的字节转换为四个6Bit 的字节（3*8 = 4*6 = 24 ），然后把6Bit 再添两位高位0 ，组成四个8Bit 的字节，也就是说，转换后的字符串理论上将要比原来的长1/3 。这样说会不会太抽象了？不怕...

Base64 是网络上最常见的用于传输8Bit 字节代码的编码方式之一，大家可以查看RFC2045 ～RFC2049 ，上面有MIME 的详细规范。

Base64 要求把每三个8Bit 的字节转换为四个6Bit 的字节（3*8 = 4*6 = 24 ），然后把6Bit 再添两位高位0 ，组成四个8Bit 的字节，也就是说，转换后的字符串理论上将要比原来的长1/3 。

这样说会不会太抽象了？不怕，我们来看一个例子：

转换前 aaaaaabb ccccdddd eeffffff

转换后 00aaaaaa 00bbcccc 00ddddee 00ffffff

应该很清楚了吧？上面的三个字节是原文，下面的四个字节是转换后的Base64 编码，其前两位均为0 。

转换后，我们用一个码表来得到我们想要的字符串（也就是最终的Base64 编码），这个表是这样的：

Table 1: The Base64 Alphabet

Value Encoding Value Encoding Value Encoding Value Encoding

      0 A          17 R         34 i            51 z

      1 B          18 S         35 j            52 0

      2 C          19 T         36 k            53 1

      3 D          20 U         37 l            54 2

      4 E          21 V         38 m            55 3

      5 F          22 W         39 n            56 4

      6 G          23 X         40 o            57 5

      7 H          24 Y         41 p            58 6

      8 I          25 Z         42 q            59 7

      9 J          26 a         43 r            60 8

      10 K          27 b        44 s            61 9

      11 L          28 c        45 t            62 +

      12 M          29 d        46 u            63 /

      13 N          30 e        47 v

      14 O          31 f        48 w      

      15 P          32 g        49 x

      16 Q          33 h        50 y

让我们再来看一个实际的例子，加深印象！

转换前 10101101 1011 1010 01110110

转换后 00101011 00011011 00101001 00110110

十进制 43 27 41 54

对应码表中的值 r b p 2

所以上面的24 位编码，编码后的Base64 值为 rbp2

解码同理，把 rbq2 的二进制位连接上再重组得到三个8 位值，得出原码。

（解码只是编码的逆过程，在此我就不多说了，另外有关MIME 的RFC 还是有很多的，如果需要详细情况请自行查找。）

用更接近于编程的思维来说，编码的过程是这样的：

1. 第一个字符通过右移2 位获得第一个目标字符的Base64 表位置，根据这个数值取到表上相应的字符，就是第一个目标字符。

2. 然后将第一个字符左移4 位加上第二个字符右移4 位，即获得第二个目标字符。

再将第二个字符左移2 位加上第三个字符右移6 位，获得第三个目标字符。

3. 最后取第三个字符的右6 位即获得第四个目标字符。

在以上的每一个步骤之后，再把结果与 0x3F 进行 AND 位操作，就可以得到编码后的字符了。

可是等等…… 聪明的你可能会问到，原文的字节数量应该是3 的倍数啊，如果这个条件不能满足的话，那该怎么办呢？

我们的解决办法是这样的：原文的字节不够的地方可以用全0 来补足，转换时Base64 编码用= 号来代替。这就是为什么有些Base64 编码会以一个或两个等号结束的原因，但等号最多只有两个。因为：

余数 = 原文字节数 MOD 3

所以余数任何情况下都只可能是0 ，1 ，2 这三个数中的一个。如果余数是0 的话，就表示原文字节数正好是3 的倍数（最理想的情况啦）。如果是1 的话，为了让Base64 编码是4 的倍数，就要补2 个等号；同理，如果是2 的话，就要补1 个等号。

在线转换:base64在线加密解密-迅雷地址在线解密加密

例子一：

import sun.misc.BASE64Decoder;

import sun.misc.BASE64Encoder;

public class Test {

    public static void main(String args[]) throws IOException {

        BASE64Encoder encode = new BASE64Encoder();

        String base64 = encode.encode(" 五笔字型电子计算机".getBytes());

        System.out.println(base64);

        BASE64Decoder decode = new BASE64Decoder();

        byte [] b = decode.decodeBuffer(base64);

        System.out.println( new String(b));

    }

}

输出：

zuWxytfW0M2159fTvMbL47v6

五笔字型电子计算机

JRE 中 sun 和 com.sun 开头包的类都是未被文档化的，他们属于 java, javax

类库的基础，其中的实现大多数与底层平台有关，一般来说是不推荐使用的。

Base64 主要不是加密，它主要的用途是把一些二进制数转成普通字符用于网络传输。

由于一些二进制字符在传输协议中属于控制字符，不能直接传送需要转换一下就可以了。

示例二：

try {

    byte[] KEY_DATA = {1,8,-49,-31,77,90,10,121,-14,109,107,38,29,68,59,5,82,49,31,42,-25,67,96,15};

    Cipher cipher = Cipher.getInstance(" DESede/ECB/PKCS5Padding ");

    SecretKeySpec key = new SecretKeySpec(KEY_DATA, "DESede");// 生成加密解密需要的 Key

    cipher.init(Cipher.ENCRYPT_MODE, key);

    byte[] res = cipher.doFinal(data.getBytes());

} catch (Exception e) {

    e.printStackTrace();

}

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

BASE64Decoder小解

Base64 是网络上最常见的用于传输8Bit 字节代码的编码方式之一，大家可以查看RFC2045 ～RFC2049 ，上面有MIME 的详细规范。

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

BASE64Decoder小解

Base64 是网络上最常见的用于传输8Bit 字节代码的编码方式之一，大家可以查看RFC2045 ～RFC2049 ，上面有MIME 的详细规范。

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品