Python基础知识
在Python中,能够直接处理的数据类型有以下几种:
一、整数
Python可以处理任意大小的整数,当然包括负整数,在Python程序中,整数的表示方法和数学上的写法一模一样,例如:,,-88,,等等。
计算机由于使用二进制,所以,有时候用十六进制表示整数比较方便,十六进制用x前缀和-9,-f表示,例如:xff,x5b4c32,等等。
二、浮点数
浮点数也就是小数,之所以称为浮点数,是因为按照科学记数法表示时,一个浮点数的小数点位置是可变的,比如,.23x^9和2.3x^8是相等的。浮点数可以用数学写法,如.23,3.4,-9.,等等。但是对于很大或很小的浮点数,就必须用科学计数法表示,把用e替代,.23x^9就是.23e9,或者2.3e8,.2可以写成.2e-5,等等。
整数和浮点数在计算机内部存储的方式是不同的,整数运算永远是精确的(除法难道也是精确的?是的!),而浮点数运算则可能会有四舍五入的误差。
三、字符串
字符串是以''或""括起来的任意本,比如'bc',"xyz"等等。请注意,''或""本身只是一种表示方式,不是字符串的一部分,因此,字符串'bc'只有,b,c这3个字符。
四、布尔值
布尔值和布尔代数的表示完全一致,一个布尔值只有True、Flse两种值,要么是True,要么是Flse,在Python中,可以直接用True、Flse表示布尔值(请注意大小写),也可以通过布尔运算计算出来。
布尔值可以用n、or和not运算。
n运算是与运算,只有所有都为True,n运算结果才是True。
or运算是或运算,只要其中有一个为True,or运算结果就是True。
not运算是非运算,它是一个单目运算符,把True变成Flse,Flse变成True。
五、空值
空值是Python里一个特殊的值,用None表示。None不能理解为,因为是有意义的,而None是一个特殊的空值。
此外,Python还提供了列表、字典等种数据类型,还允许创建自定义数据类型,我们后面会继续讲到
打印输出
print语句可以向屏幕上输出指定的字。比如输出'hello,orl',用代码实现如下:
>>>print'hello,orl'
Python的注释以#开头,后面的字直到行尾都算注释
在Python程序中,变量是用一个变量名表示,变量名必须是大小写英、数字和下划线(_)的组合,且不能用数字开头,比如:
=
变量是一个整数。
t_7='T7'
变量t_7是一个字符串。
在Python中,等=是赋值语句,可以把任意数据类型赋值给变量,同一个变量可以反复赋值,而且可以是不同类型的变量,例如:
=23#是整数
print
='imooc'#变为字符串
print
这种变量本身类型不固定的语言称之为动态语言,与之对应的是静态语言。
静态语言在定义变量时必须指定变量类型,如果赋值的时候类型不匹配,就会报错。例如Jv是静态语言,赋值语句如下(//表示注释):
int=23;//是整数类型变量
="mooc";//错误:不能把字符串赋给整型变量
和静态语言相比,动态语言灵活,就是这个原因。
请不要把赋值语句的等等同于数学的等。比如下面的代码:
x=
x=x+2
如果从数学上理解x=x+2那无论如何是不成立的,在程序中,赋值语句先计算右侧的表达式x+2,得到结果2,再赋给变量x。由于x之前的值是,重新赋值后,x的值变成2。
最后,理解变量在计算机内存中的表示也非常重要。当我们写:='BC'时,Python解释器干了两件事情:
.在内存中创建了一个'BC'的字符串;
2.在内存中创建了一个名为的变量,并把它指向'BC'。
也可以把一个变量赋值给另一个变量b,这个操作实际上是把变量b指向变量所指向的数据,例如下面的代码:
='BC'
b=
='XYZ'
printb
最后一行打印出变量b的内容到底是'BC'呢还是'XYZ'?如果从数学意义上理解,就会错误地得出b和相同,也应该是'XYZ',但实际上b的值是'BC',让我们一行一行地执行代码,就可以看到到底发生了什么事:
执行='BC',解释器创建了字符串'BC'和变量,并把指向'BC':
执行b=,解释器创建了变量b,并把b指向指向的字符串'BC':
执行='XYZ',解释器创建了字符串'XYZ',并把的指向改为'XYZ',但b并没有改:
所以,最后打印变量b的结果自然是'BC'了。
字符串可以用''或者""括起来表示。
如果字符串本身包含'怎么办?比如我们要表示字符串I'mO,这时,可以用""括起来表示:
"I'mO"
类似的,如果字符串包含",我们就可以用''括起来表示:
'Lern"Python"isuseful'
如果字符串既包含'又包含"怎么办?
这个时候,就需要对字符串的某些特殊字符进行“转义”,Python字符串用\进行转义。
要表示字符串Bobsi"I'mO".
由于'和"会引起歧义,因此,我们在它前面插入一个\表示这是一个普通字符,不代表字符串的起始,因此,这个字符串又可以表示为:
'Bobsi\"I\'mO\".'
注意:转义字符\不计入字符串的内容中。
常用的转义字符还有:
\n表示换行
\t表示一个制表符
\\表示\字符本身
如果一个字符串包含很需要转义的字符,对每一个字符都进行转义会很麻烦。为了避这种情况,我们可以在字符串前面个前缀r,表示这是一个r字符串,里面的字符就不需要转义了。例如:
r'\(~_~)/\(~_~)/'
但是r'...'表示法不能表示行字符串,也不能表示包含'和"的字符串(为什么?)
如果要表示行字符串,可以用'''...'''表示:
'''Line
Line2
Line3'''
上面这个字符串的表示方法和下面的是完全一样的:
'Line\nLine2\nLine3'
还可以在行字符串前面r,把这个行字符串也变成一个r字符串:
r'''Pythoniscreteby"Guio".
Itisfreenesytolern.
Let'sstrtlernPythoninimooc!'''
字符串还有一个编码问题。
因为计算机只能处理数字,如果要处理本,就必须先把本转换为数字才能处理。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制=十进制255),-255被用来表示大小写英字母、数字和一些符,这个编码表被称为SCII编码,比如大写字母的编码是65,小写字母z的编码是22。
如果要表示中,显然一个字节是不够的,至少需要两个字节,而且还不能和SCII编码冲突,所以,中国制定了GB232编码,用来把中编进去。
类似的,日和韩等其他语言也有这个问题。为了统一所有字的编码,Unicoe应运而生。Unicoe把所有语言都统一到一套编码里,这样就不会再有乱码问题了。
Unicoe通常用两个字节表示一个字符,原有的英编码从单字节变成双字节,只需要把高字节全部填为就可以。
因为Python的诞生比Unicoe标准发布的时间还要早,所以最早的Python只支持SCII编码,普通的字符串'BC'在Python内部都是SCII编码的。
Python在后来了对Unicoe的支持,以Unicoe表示的字符串用u'...'表示,比如:
printu'中'
中
注意:不u,中就不能正常显示。
Unicoe字符串除了了一个u之外,与普通字符串没啥区别,转义字符和行表示法仍然有效:
转义:
u'中\n日\n韩'
行:
u'''第一行
第二行'''
r+行:
ur'''Python的Unicoe字符串支持"中",
"日",
"韩"等种语言'''
如果中字符串在Python环境下遇到UnicoeecoeError,这是因为.py件保存的格式有问题。可以在第一行注释
#-*-coing:utf-8-*-
目的是告诉Python解释器,用UTF-8编码读取源代码。然后用Notep++另存为...并选择UTF-8格式保存。
Python支持对整数和浮点数直接进行四则混合运算,运算规则和数学上的四则运算规则完全一致。
基本的运算:
+2+3#==>6
4*5-6#==>4
7.5/8+2.#==>3.375
使用括可以提升优先级,这和数学运算完全一致,注意只能使用小括,但是括可以嵌套很层:
(+2)*3#==>9
(2.2+3.3)/(.5*(9-.3))#==>.42455938697387
和数学运算不同的地方是,Python的整数运算结果仍然是整数,浮点数运算结果仍然是浮点数:
+2#==>整数3
.+2.#==>浮点数3.
但是整数和浮点数混合运算的结果就变成浮点数了:
+2.#==>浮点数3.
为什么要区分整数运算和浮点数运算呢?这是因为整数运算的结果永远是精确的,而浮点数运算的结果不一定精确,因为计算机内存再大,也无法精确表示出无限循环小数,比如.换成二进制表示就是无限循环小数。
那整数的除法运算遇到除不尽的时候,结果难道不是浮点数吗?我们来试一下:
/4#==>2
令很初学者惊讶的是,Python的整数除法,即使除不尽,结果仍然是整数,余数直接被扔掉。不过,Python提供了一个求余的运算%可以计算余数:
%4#==>3
如果我们要计算/4的精确结果,按照“整数和浮点数混合运算的结果是浮点数”的法则,把两个数中的一个变成浮点数再运算就没问题了:
./4#==>2.75
我们已经了解了Python支持布尔类型的数据,布尔类型只有True和Flse两种值,但是布尔类型有以下几种运算:
与运算:只有两个布尔值都为True时,计算结果才为True。
TruenTrue#==>True
TruenFlse#==>Flse
FlsenTrue#==>Flse
FlsenFlse#==>Flse
或运算:只要有一个布尔值为True,计算结果就是True。
TrueorTrue#==>True
TrueorFlse#==>True
FlseorTrue#==>True
FlseorFlse#==>Flse
非运算:把True变为Flse,或者把Flse变为True:
notTrue#==>Flse
notFlse#==>True
布尔运算在计算机中用来做条件判断,根据计算结果为True或者Flse,计算机可以自动执行不同的后续代码。
在Python中,布尔类型还可以与其他数据类型做n、or和not运算,请看下面的代码:
=True
printn'=T'or'=F'
计算结果不是布尔类型,而是字符串'=T',这是为什么呢?
因为Python把、空字符串''和None看成Flse,其他数值和非空字符串都看成True,所以:
Truen'=T'计算结果是'=T'
继续计算'=T'or'=F'计算结果还是'=T'
要解释上述结果,又涉及到n和or运算的一条重要法则:短路计算。
.在计算nb时,如果是Flse,则根据与运算法则,整个结果必定为Flse,因此返回;如果是True,则整个计算结果必定取决与b,因此返回b。
2.在计算orb时,如果是True,则根据或运算法则,整个计算结果必定为True,因此返回;如果是Flse,则整个计算结果必定取决于b,因此返回b。
所以Python解释器在做布尔运算时,只要能提前确定计算结果,它就不会往后算了,直接返回结果。
Python内置的一种数据类型是列表:list。list是一种有序的集合,可以随时和删除其中的元。
比如,列出班里所有同学的名字,就可以用一个list表示:
>>>['Michel','Bob','Trcy']
list是数学意义上的有序集合,也就是说,list中的元是按照顺序排列的。
由于list是一个有序集合,所以,我们可以用一个list按分数从高到低表示出班里的3个同学:
>>>L=['m','Lis','Brt']
那我们如何从list中获取指定第N名的同学呢
需要特别注意的是,索引从开始,也就是说,第一个元的索引是,第二个元的索引是,以此类推。
因此,要打印第一名同学的名字,用L[]:
>>>printL[]
m
要打印第二名同学的名字,用L[]:
>>>printL[]
Lis
要打印第四名同学的名字,用L[3]:
>>>printL[3]
4(mostrecentclllst):
File"<stin>",line,in<moule>
InexError:listinexoutofrnge
报错了!InexError意思就是索引超出了范围,因为上面的list只有3个元,有效的索引是,,2。
所以,使用索引时,千万注意不要越界。
List的倒序检索:最后一个为L[-],倒数第二个为L[-2]…..
注意倒序检索也不能越界!!
ppen();在集合最后边新的元;
L.insert(,'Pul');把元插入到定义的位置。
现在,班里有3名同学:
>>>L=['m','Lis','Brt']
今天,班里转来一名新同学Pul,如何把新同学到现有的list中呢?
第一个办法是用list的ppen()方法,把新同学追到list的末尾:
>>>L=['m','Lis','Brt']
>>>L.ppen('Pul')
>>>printL
['m','Lis','Brt','Pul']
ppen()总是把新的元到list的尾部。
如果Pul同学表示自己总是考满分,要求到第一的位置,怎么办?
方法是用list的insert()方法,它接受两个参数,第一个参数是索引,第二个参数是待的新元:
>>>L=['m','Lis','Brt']
>>>L.insert(,'Pul')
>>>printL
['Pul','m','Lis','Brt']
L.insert(,'Pul')的意思是,'Pul'将被到索引为的位置上(也就是第一个),而原来索引为的m同学,以及后面的所有同学,都自动向后移动一位。
L.pop()删除集合的最后一个元
L.pop(元下标)删除指定下标的元
L[要替换的下标]=要替换的元(也可用倒序索引)。
tuple是另一种有序的列表,中翻译为“元组”。tuple和list非常类似,但是,tuple一旦创建完毕,就不能修改了。
同样是表示班里同学的名称,用tuple表示如下:
>>>t=('m','Lis','Brt')
创建tuple和创建list唯一不同之处是用()替代了[]。
tuple和list一样,可以包含个、个和任意个元。
包含个元的tuple,前面我们已经创建过了。
包含个元的tuple,也就是空tuple,直接用()表示:
创建包含个元的tuple呢?来试试:
>>>t=()
>>>printt
好像哪里不对!t不是tuple,而是整数。为什么呢?
因为()既可以表示tuple,又可以作为括表示运算时的优先级,结果()被Python解释器计算出结果,导致我们得到的不是tuple,而是整数。
正是因为用()定义单元的tuple有歧义,所以Python规定,单元tuple要一个逗“,”,这样就避了歧义:
>>>t=(,)#单个tuple需在元后逗
>>>printt
(,)
Python在打印单元tuple时,也自动了一个“,”,为了明确地告诉你这是一个tuple。
元tuple不这个额外的“,”效果是一样的:
>>>t=(,2,3,)
>>>printt
(,2,3)
前面我们看到了tuple一旦创建就不能修改。现在,我们来看一个“可变”的tuple:
>>>t=('','b',['','B'])
注意到t有3个元:'','b'和一个list:['','B']。list作为一个整体是tuple的第3个元。list对象可以通过t[2]拿到:
>>>L=t[2]
然后,我们把list的两个元改一改:
>>>L[]='X'
>>>L[]='Y'
再看看tuple的内容:
>>>printt
('','b',['X','Y'])
tuple包含的3个元存储分析:
当我们把list的元''和'B'修改为'X'和'Y'后,tuple变为:
tuple所谓的“不变”是说,tuple的每个元,指向永远不变。即指向'',就不能改成指向'b',指向一个list,就不能改成指向其他对象,但指向的这个list本身是可变的!
理解了“指向不变”后,要创建一个内容也不变的tuple就必须保证tuple的每一个元本身也不能变。
If示例,注意缩进
ge=2
ifge>=8:
print'yourgeis',ge
print'ult'
else:
print'geissmllerthn8'
print'EN
'
注意:Python代码的缩进规则。具有相同缩进的代码被视为代码块,上面的3,4行print语句就构成一个代码块(但不包括第5行的print)。如果if语句判断为True,就会执行这个代码块。
缩进请严格按照Python的习惯写法:4个空格,不要使用Tb,不要混合Tb和空格,否则很容易造成因为缩进引起的语法错误。
注意:if语句后接表达式,然后用:表示代码块开始。
如果你在Python交互环境下敲代码,还要特别留意缩进,并且退出缩进需要敲一行回车:
要避嵌套结构的if...else...,我们可以用if...个elif...else...的结构,一次写完所有的规则:
ifge>=8:
print'ult'
elifge>=6:
print'teenger'