Python中的import语句是导入一个文件,这条语句主要做三件事:
1 通过一定的方式,搜寻要导入的文件;
2 如果需要,就编译这个文件;
3 运行这个文件
但是,需要注意的是,所有这三个步骤,都只是文件再第一次导入的时候才会执行,如果文件已经导入了,后续的import会直接从内存里面找到已经加载的模块使用,换句话说,此时,import不会执行上面的3个步骤。
搜寻文件
在上面3个步骤中,最重要的就是搜寻要导入的文件。搜寻的的路径由5部分组成:
1 程序的Home目录
程序的Home目录根据运行程序的方式而不同。如果你是使用python python_program.py的方式来运行,那么,程序的Home目录就是python_program.py所在的目录;如果你是进入了python的可交互式命令行,那么程序的Home目录就是你启动可交互式命令行时,所在的目录。但是,如果你的*.py文件存在Home目录的子目录下面,那么,Python是不会自动搜寻子目录的。
2 PYTHONPATH环境变量
环境变量PYTHONPATH可以指定Python要搜索的目录,如果要设置,最好在前面加上export,即export PYTHONPATH=指定的目录
3 标准库目录
Python会自动搜寻标准库目录
4 .pth文件指定的目录
Python可以识别一个.pth文件,这个文件中每行指定一个搜寻目录。根据系统的不同,这个文件需要放置的位置也不一样。例如,如果你的系统是Windows的,那么这个文件可能需要放在Python的安装目录下,或者安装目录下的Lib/site-packages下面;如果你的系统是Unix-like的,那么,这个文件可能要放在/usr/local/lib/python3.3/site-packages或者/usr/local/lib/site-python下面。具体情况,需要参考Python的library document。
5 第三方扩展的Lib/site-package目录
Python会将第三方扩展库安装在这个目录下面,使它成为搜索路径的一部分。
上面提到的搜索路径方式,只是一个通用的方案,具体实现细节还要看各自的Python实现。要查看自己Python的搜索路径,可以使用sys module,通过sys.path就可以打印出自己Python实现的搜索路径,非常方便。
按需编译
Python并不是每一次导入文件,都会重新编译,Python编译的条件是:
1 Python源文件时戳比相应的字节码文件新,那么就重新编译;
2 对于<Python 3.2的版本来说,如果当前的Python实现和字节码中的"magic number"包含的版本号不一样,就会重新编译;对于>=Python 3.2之后的版本,如果字节码文件名中指定的版本号与当前Python实现不一样,也会重新编译
一旦编译导入成功,Python就会把字节码存入到内存中,通过sys.modules可以查看内存中存储的导入模块
import可以导入的类型
import可以导入的类型很多,包括:
.py源文件
.pyc字节码
.pyo 优化的字节码文件
文件目录
C/C++的动态库
C/C++的静态库
ZIP文件
内存镜像,比如Python的frozen package
Java class(Jython使用)
.NET(IronPython使用)
既然Python可以导入这么多文件,那么,如果在搜寻路径中同一个目录下,出现了b.py和b.pyc,那么,Python到底会使用哪一个文件呢?Python自己有一套选择标准,但是,这个标准可能随着Python实现的不同迭代版本而不同。