Python 字符串与基本语句

Stella981
• 阅读 680

Python特点

  • python中没有变量的声明
  • 语句结束后没有分号
  • 严格要求缩进
  • 支持很长很长的大数运算(直接在Idle中输入即可)
  • 用“#”来注释

BIF:Bulit-in functions(内置函数)

  • input

    input(“文本”) //把文本打印出来,并把输入的参数以字符串的形式返回。

  • print

    print("文本") //将文本打印出来 print("字符串1"+"字符串2") //将字符串1和字符串2拼接输出 print("字符串"* x ) //将字符串打印x次

  • if else:if else语句后面要加冒号“:”

    if 条件 : //条件成立后执行冒号后带有缩进的语句 语句1 语句2 else: //同理 语句1 语句2

冒号之后带有缩进的语句都属于if条件成立后(else)所要执行的语句,说明了缩进的严格要求

  • BIF查询

    dir(builtins) //查询python中所有的BIF help(BIF名字) //查询BIF功能

变量


  • 变量命名时严格区分大小写

  • 变量不用定义,直接使用

  • 变量类型和C语言差不多

  • 获取变量类型

    type(数据) //返回数据的类型

  • 数据类型比较

    isinstance(数据1,数据类型) //型相同返回True,否则False isinstance(a,int) //判断数据a是否为整形

字符串型

  • 要创建字符串,就要在字符两边加上双引号或者单引号
  • 如果字符串中出现了单引号或者双引号怎么办?
  • 使用转义符号“\”,对字符串中的引号进行转义。

eg:打印Let's go

>>> 'Let's go'      //我们输入  "Let's go" 会报错。

Python 字符串与基本语句

现在我们用转义字符"\",对引号进行转义。

>>> 'Let\'s go'     

Python 字符串与基本语句

成功啦!

原始字符串

既然转义字符"\",这么好用不如我们来把它打印出来吧哈哈。

eg:打印'C:now'。(打印文件夹路径)

  • 方法1

    • 这有什么难的,直接打印不就好了吗。

      str = 'C:now' str

    Python 字符串与基本语句

    • 它的显示是正常的。但是我们如果用print,效果就会改变了

      print(str)

    Python 字符串与基本语句

    • 我们会发现:编译器把字符串中的'\n',识别成了换行。

  • 方法2:用反斜杠对自身进行转义

    >>> str = 'C:\\now'
    

    Python 字符串与基本语句

    • 一切正常

    • 但是如果一个字符串有很多反斜杠str = 'C:\Program Files\Intel\WiFi\Help'

    • 这种情况我们如果一个个的去对反斜杠进行转义会很麻烦。

    • 这时候原始字符串就派上了用场,它的使用很简单。只需在字符串前面加一个'r'即可。

      str = r'C:\Program Files\Intel\WiFi\Help' str

    Python 字符串与基本语句

    • 编译器会对每一个反斜杠自动转义,是不是很方便

    • 注意事项:使用原始字符串时最后一个字符不要是反斜杠。

      str = r'C:\Program Files\Intel\WiFi\Help' str

    Python 字符串与基本语句

    • 系统报错

长字符串

  • 如果我们想输出一段长的字符串,比如:

    我如果爱你——
    

      绝不像攀援的凌霄花,   借你的高枝炫耀自己:   我如果爱你——   绝不学痴情的鸟儿,   为绿荫重复单调的歌曲;   也不止像泉源,   常年送来清凉的慰籍;   也不止像险峰,增加你的高度,衬托你的威仪。

  • 可以用三个引号

    str = """我如果爱你——   绝不像攀援的凌霄花,   借你的高枝炫耀自己:   我如果爱你——   绝不学痴情的鸟儿,   为绿荫重复单调的歌曲;   也不止像泉源,   常年送来清凉的慰籍;   也不止像险峰,增加你的高度,衬托你的威仪。"""

编码问题

  • 编码方式
  • ASCII:8bit,一个字节,表示数目127,非常局限。
  • Unicode:16bit,通常两个字节,基本可以表示所有语言。
  • UTF-8:因为Unicode存英文会浪费空间,所以UTF-8应运而生,UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。
  • python中采用Unicode编码,也就是说python支持多种语言。

  • 对于单个字符的编码,Python提供了ord()函数获取字符的整数表示,chr()函数把编码转换为对应的字符:

    ord('A') 65 ord('中') 20013 chr(66) 'B' chr(25991) '文'

格式化

  • 一个常见的问题是如何输出格式化的字符串。我们经常会输出类似'亲爱的xxx你好!你xx月的话费是xx,余额是xx'之类的字符串,而xxx的内容都是根据变量变化的,所以,需要一种简便的格式化字符串的方式。

  • 在Python中,采用的格式化方式和C语言是一致的,用%实现,举例如下:

    'Hello, %s' % 'world' 'Hello, world' 'Hi, %s, you have $%d.' % ('Michael', 1000000) 'Hi, Michael, you have $1000000.'

  • %运算符就是用来格式化字符串的。在字符串内部,%s表示用字符串替换,%d表示用整数替换,有几个%?占位符,后面就跟几个变量或者值,顺序要对应好。如果只有一个%?,括号可以省略。

  • 有些时候,字符串里面的%是一个普通字符怎么办?这个时候就需要转义,用%%来表示一个%

    'growth rate: %d %%' % 7 'growth rate: 7 %'

bytes类型


  • 由于Python的字符串类型是str,在内存中以Unicode表示,一个字符对应若干个字节。如果要在网络上传输,或者保存到磁盘上,就需要把str变为以字节为单位的bytes。

  • Python对bytes类型的数据用带b前缀的单引号或双引号表示:

    x = b'ABC'

  • 要注意区分'ABC''bABC',尽管他们显示相同。前者是str,后者是bytes

  • 以Unicode表示的str通过encode()方法可以编码为指定的bytes,例如:

    'ABC'.encode('ascii') b'ABC' '中文'.encode('utf-8') b'\xe4\xb8\xad\xe6\x96\x87' '中文'.encode('ascii') Traceback (most recent call last): File "", line 1, in UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

  • 纯英文的str可以用ASCII编码为bytes,内容是一样的。

  • 含有中文的str可以用UTF-8编码为bytes

  • 含有中文的str无法用ASCII编码,因为中文编码的范围超过了ASCII编码的范围,Python会报错。

  • bytes中,无法显示为ASCII字符的字节,用\x##显示。

  • 反过来,如果我们从网络或磁盘上读取了字节流,那么读到的数据就是bytes。要把bytes变为str,就需要用decode()方法:

    b'ABC'.decode('ascii') 'ABC' b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8') '中文'

  • 如果bytes中包含无法解码的字节,decode()方法会报错:

    b'\xe4\xb8\xad\xff'.decode('utf-8') Traceback (most recent call last): ... UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 3: invalid start byte

  • 如果bytes中只有一小部分无效的字节,可以传入errors='ignore'忽略错误的字节:

    b'\xe4\xb8\xad\xff'.decode('utf-8', errors='ignore') '中'

  • len()函数计算的是str的字符数,如果换成byteslen()函数就计算字节数

    len(b'ABC') 3 len(b'\xe4\xb8\xad\xe6\x96\x87') 6 len('中文'.encode('utf-8')) 6

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
4个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Stella981 Stella981
3年前
Python3:sqlalchemy对mysql数据库操作,非sql语句
Python3:sqlalchemy对mysql数据库操作,非sql语句python3authorlizmdatetime2018020110:00:00coding:utf8'''
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
10个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这