Base64 的原理、实现及应用

Stella981
• 阅读 790

Base64编码是基于64个字符(字符分别为:ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxzy0123456789+/)的编码方式,因为2的6次方正好为64,所以我们用6bit就可以表示出64个字符,eg:000000对应'A',000001对应'B',111111对应'/'。
转换表如下:

QQ截图20160411092432.png

按我们的习惯,8bit是1个字节,所以我们正常使用的时候,一般都是1Byte=8bit(字符'a'=97=01100001)来使用。所以我们处理字符串的时候会遇到8bit/16bit/24bit/32bit……的情况,而Base64按照6bit为一个单元,处理的时候会遇到6bit/12bit/18bit/24bit/30bit……的情况,8和6的最小公倍数是24,所以我们用1、2、3个正常字符这三种情况就可以把所有需要转换成Base64的字符串概括了。

  • 被3整除个字符(3/6/9/12……):abc=01100001 01100010 01100011 分成Base64分组后为:011000 010110 001001 100011 即24 22 9 35,对应Base64编码的 YWJj
  • 除3余1个字符(2/5/8/11……):ab=01100001 01100010,分成Base64分组后为:011000 010110 0010,0010不够6bit,需要补0为:001000,得到YWI,因为4个Base编码为一组,最后再补上'='补齐一组,即:YWI=
  • 除3余2个字符(1/4/7/10……):a=011000010,分成Base64分组后为:011000 01,01不够6bit,需要补0为:010000,得到YQ,因为4个Base编码为一组,最后再补上'='补齐一组,即:YQ==

上面的文字归结为下图:

QQ截图20160411094646.png

可以看出,所有转换后的Base64编码都是4个字符的倍数(4/8/12/16……),如果不够4个字符的,都用'='填充了。

/**
 * <p>Base64编码是基于64个字符(字符分别为:ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxzy0123456789+/)的编码方式,
 * 因为2的6次方正好为64,所以我们用6bit就可以表示出64个字符,eg:000000对应A,000001对应B</p>
 * <p>按我们的习惯,一般都是1Byte=8bit(字符'a'=97=01100001)的使用,所以我们可以用24bit(6和8的最小公倍数)来进行分组,24正好事3BYTE,可以分出4组Base64的分组,需要编码的字符串有如下情况:
 * <li>被3整除:abc=01100001 01100010 01100011 分成Base64分组后为:011000 010110 001001 100011 即24 22 9 35,对应Base64编码的 YWJj</li>
 * <li>除3余1:ab=01100001 01100010,分成Base64分组后为:011000 010110 0010,0010不够6bit,需要补0为:001000,得到YWI,因为4个Base编码为一组,最后再补上'='补齐一组,即:YWI=</li>
 * <li>除3余2:a=011000010,分成Base64分组后为:011000 01,01不够6bit,需要补0为:010000,得到YQ,因为4个Base编码为一组,最后再补上'='补齐一组,即:YQ==</li>
 * </p>
 * @author chmod400
 *
 */
public class Base64Utils {
    
    private static String codeStr = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxzy0123456789+/";
    private static char[] code = codeStr.toCharArray();
    
    /**
     * 对字符串进行Base64编码
     * @param str
     * @return
     */
    public static String encode(String str) {
        if(str == null) {
            throw new NullPointerException();
        }
        StringBuffer result = new StringBuffer();
        // 字符串转为二进制
        String binStr = str2Bin(str);
        // 6bit 为一个单元,需要补0的位数
        int tail = binStr.length() % 6;
        if(tail != 0) {//最后剩2bit,需要补4位,剩4位需要补2bit
            tail = 6 - tail;
        }
        for(int i = 0; i < tail; i++) {
            binStr += "0";
        }
        for(int i = 0; i < binStr.length() / 6; i++) {
            int beginIndex = i * 6;
            String s = binStr.substring(beginIndex, beginIndex+6);
            // 二进制转十进制
            int codePoint = Integer.valueOf(s, 2);
            // 对应的字符
            char c = code[codePoint];
            result.append(c);
        }
        // 需要补=的位数
        int groupNum = binStr.length() / 6;// 6bit为一组
        if((groupNum % 4) != 0) {
            tail = 4 - groupNum % 4;
        }
        for(int i = 0; i < tail; i++) {
            result.append("=");
        }
        return result.toString();
    }

    /**
     * base64解码
     * @param str
     * @return
     */
    public static String decode(String str) {
        if(str == null) {
            throw new NullPointerException();
        }
        StringBuffer result =  new StringBuffer();
        // 去除末尾的'='
        int index = str.indexOf("=");
        if (index >= 0) {
            str = str.substring(0, index);
        }
        // base64字符串转换为二进制
        String binStr = base64Str2Bin(str);
        // 将二进制按8bit一组还原成原字符
        for(int i = 0; i < binStr.length() / 8; i++) {
            int beginIndex = i * 8;
            String s = binStr.substring(beginIndex, beginIndex+8);
            String c = bin2Str(s);
            result.append(c);
        }
        return result.toString();
    }
    
    /**
     * 字符串转换为二进制字符串
     * @param str
     * @return
     */
    private static String str2Bin(String str) {
        StringBuffer sb = new StringBuffer();
        // 字符串转为字符数组
        char[] c = str.toCharArray();
        for(int i = 0; i < c.length; i++) {
            // 将每个字符转换为二进制
            String s = Integer.toBinaryString(c[i]);
            // 需要补0的长度
            int len = 8 - s.length();
            for(int j = 0; j < len; j++) {
                s = "0" + s;
            }
            sb.append(s);
        }
        return sb.toString();
    }
    
    /**
     * Base64字符串转换为二进制字符串
     * @param str
     * @return
     */
    private static String base64Str2Bin(String str) {
        StringBuffer sb = new StringBuffer();
        // 字符串转为字符数组
        char[] c = str.toCharArray();
        for(int i = 0; i < c.length; i++) {
            // 将每个字符转换为二进制
            int index = codeStr.indexOf(c[i]);
            String s = Integer.toBinaryString(index);
            // 需要补0的长度
            int len = 6 - s.length();
            for(int j = 0; j < len; j++) {
                s = "0" + s;
            }
            sb.append(s);
        }
        return sb.toString();
    }
    
    /**
     * 二进制转换为字符串
     * @param binStr
     * @return
     */
    private static String bin2Str(String binStr) {
        StringBuffer sb = new StringBuffer();
        for(int i = 0; i < binStr.length() / 8; i++) {
            int beginIndex = i * 8;
            String s = binStr.substring(beginIndex, beginIndex+8);
            // 二进制转十进制
            int codePoint = Integer.valueOf(s, 2);
            // 对应的字符
            char c = Character.toChars(codePoint)[0];
            sb.append(c);
        }
        return sb.toString();
    }
    
    public static void main(String[] args) {
        System.out.println(str2Bin("ab"));
//      System.out.println(bin2Str("000001000001000001000000"));
        /*System.out.println(encode("a"));
        System.out.println(encode("ab"));
        System.out.println(encode("abc"));
        System.out.println(encode(""));
        System.out.println(encode(null));*/
        
//      System.out.println(encode(codeStr));
        
        System.out.println(decode("YQ=="));
        System.out.println(decode("YWI="));
        System.out.println(decode("YWJj"));
        System.out.println(decode("QUJDREVGR0hJSktMTU5PUFFSU1RVVldYWVphYmNkZWZnaGlqa2xtbm9wcXJydHV2d3h6eTAxMjM0NTY3ODkrLw=="));
        System.out.println(decode(""));
        System.out.println(decode(null));
    }

}
点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Wesley13 Wesley13
3年前
java将前端的json数组字符串转换为列表
记录下在前端通过ajax提交了一个json数组的字符串,在后端如何转换为列表。前端数据转化与请求varcontracts{id:'1',name:'yanggb合同1'},{id:'2',name:'yanggb合同2'},{id:'3',name:'yang
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
6个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Peter20 Peter20
3年前
mysql中like用法
like的通配符有两种%(百分号):代表零个、一个或者多个字符。\(下划线):代表一个数字或者字符。1\.name以"李"开头wherenamelike'李%'2\.name中包含"云",“云”可以在任何位置wherenamelike'%云%'3\.第二个和第三个字符是0的值wheresalarylike'\00%'4\
Stella981 Stella981
3年前
KVM调整cpu和内存
一.修改kvm虚拟机的配置1、virsheditcentos7找到“memory”和“vcpu”标签,将<namecentos7</name<uuid2220a6d1a36a4fbb8523e078b3dfe795</uuid
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
1年前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这