Phper 学 C 兴趣入门

Stella981
• 阅读 655

引子

为什么 php 手册里经常说某个函数是二进制安全的?我们平常使用函数的时候也没发现有什么区别呀,那么二进制安全到底是什么意思呢?

Php 实验

<?php
echo strlen("abc"); // 3
echo strlen("abc\0"); // 4
echo strlen("abc\0d"); // 5
echo strlen("abc\0def"); // 7

从上面的规律可以看出\0被认为是一个字符,其实在上面的式子中\0是一个ascii字符。

补课简单说明下 ascii 码

我们知道,计算机内部,所有信息最终都是一个二进制值。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000011111111

上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定。这被称为 ASCII 码,一直沿用至今。

man ascii

ascii 码前 33 个都是控制字符,比如我们最熟悉的换行,都是不可见的字符。

       Oct   Dec   Hex   Char                        Oct   Dec   Hex   Char
       ────────────────────────────────────────────────────────────────────────
       000   0     00    NUL '\0'                    100   64    40    @
       001   1     01    SOH (start of heading)      101   65    41    A
       002   2     02    STX (start of text)         102   66    42    B
       003   3     03    ETX (end of text)           103   67    43    C
       004   4     04    EOT (end of transmission)   104   68    44    D
       005   5     05    ENQ (enquiry)               105   69    45    E
       006   6     06    ACK (acknowledge)           106   70    46    F
       007   7     07    BEL '\a' (bell)             107   71    47    G
       010   8     08    BS  '\b' (backspace)        110   72    48    H
       011   9     09    HT  '\t' (horizontal tab)   111   73    49    I
       012   10    0A    LF  '\n' (new line)         112   74    4A    J

从上面的表中可以看到八进制012和十六进制0A都表示换行

echo "abc\012d";
echo "\n";
echo "abc\x0Ad";
echo "\n";
echo "abc\x0ad";
echo "\n";
echo "abc\nd";
echo "\n";

输出结果

abc
d
abc
d
abc
d
abc
d

ascii 码第一个\0则表示空字符,所以执行

echo "abc\0d"; 

输出的就是abcd。到这里上面的长度计算想必大家都弄明白了吧。

这里再留个大家一个思考题,strlenmb_strlen有什么区别?
有兴趣的可以看看我这篇博客 https://mengkang.net/1129.html

C 实验

#include <stdio.h>
#include <string.h>

int main(){
    printf("%d\n",strlen("abc")); // 3
    printf("%d\n",strlen("abc\0")); // 3
    printf("%d\n",strlen("abc\0d")); // 3
    printf("%d\n",strlen("abc\0def")); // 3
}

通过上面的例子可以观察到\0及其以后都不在strlen的计算范围内。在C语言里字符串都以\0作为结束符。

#include <stdio.h>
#include <string.h>

int main(){
    printf("%s\n","abc\0def"); // abc
}

所以,因为字符串中间有\0而影响程序逻辑和结果的情况,叫非二进制安全。

思考

通过上面的两个实验发现只有C里面我们才需要关注函数的二进制安全问题嘛,PHP 也会遇到类似的问题么?我怎么从来遇到过。下面两个例子。

案例1

<?php
echo date("Y\0/m/d");

案例来源:https://stackoverflow.com/questions/36933837/why-are-there-binary-safe-and-binary-unsafe-functions-in-php

在线执行结果 https://3v4l.org/dqXhf

Phper 学 C 兴趣入门

可以看出来date函数是把入参"0/m/d"去掉了,不过在 php7 里修复了该问题。

案例2

<?php
var_export(strcoll("a\0b","a"));
var_export(strcmp("a\0b","a"));

这两个函数都是比较字符串“大小”,strcoll 会根据环境变量 LC_COLLATE 所指定的文字排列次序来比较两字符串的大小,默认 LC_COLLATE 为"POSIX"或"C",strcoll() 和 strcmp() 一样根据ASCII比较字符串大小。

strcoll 函数是官方手册在线说明了的非二进制安全的函数。https://www.php.net/manual/en/function.strcoll.php

课后思考

下面这个两个计算长度分辨是多少,下次课我们一起分析 php 和 c 里面单引号和双引号的区别。

<?php
echo strlen("123\0456");
echo strlen('123\0456');

原文链接

本文为云栖社区原创内容,未经允许不得转载。

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
4个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
PHP创建多级树型结构
<!lang:php<?php$areaarray(array('id'1,'pid'0,'name''中国'),array('id'5,'pid'0,'name''美国'),array('id'2,'pid'1,'name''吉林'),array('id'4,'pid'2,'n
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
10个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这