Nginx是一个轻量级高性能的web服务器,它是为快速响应大量静态文件请求和高效利用系统资源而设计的。与apache使用面向进程或线程的方式处理请求不同,nginx使用异步事件驱动模型在负载下性能更突出。
虽然nginx能高效地服务静态文件,但也有人认为nginx处理动态内容并不理想。不像apache服务器,nginx没用使用内嵌解释器的方式来处理动态内容。相反,动态内容被丢给cgi,fastcgi或者像apache这样的web服务器,然后把处理结果返回给nginx,nginx在返给浏览器。这种方式就导致部署起来会更复杂一些。出于这些原因,使用和配置nginx可能会晦涩。nginx的配置感觉更复杂或者不直接。
本文的前提是你使用nginx安装来安装nginx,如果你使用其它方法或者系统自带包安装,那么你的配置文件的位置和下面讲的配置文件位置可能不同。
nginx的强大都是靠配置文件来实现,nginx就是一个二进制文件nginx读入一个配置文件nginx.conf(nginx.conf可能include包含若干子配置文件)来实现各种各样的功能。
管理配置文件
nginx使用嵌套的花括号语法来定义选项。安装完成后nginx的主配置文件被放在/usr/local/nginx/nginx.conf。同时一个默认的备份配置文件存在/usr/local/nginx/nginx.conf.default。其它子配置文件同样有一个.default结尾的备份配置文件。.default的作用是当你修改配置文件错误的时候,你可以快速回到上一个好用的状态。建议大家经常对配置好的功能的配置文件做备份,可以以日期文件做结尾。比如你可以使用如下指令完成,修改日期为你所备份的日期。
1
cp /usr/local/nginx/nginx.conf /usr/local/nginx/nginx.conf-20121224
每次修改完nginx.conf都要重新加载配置文件
1
/usr/loca/nginx/nginx -t
1
kill -HUP `cat /usr/local/nginx/nginx.pid`
全局配置
我们分片段一点点的介绍默认的配置文件
1
2
3
4
5
6
7
8
9
10
11
12
#user nobody;
worker_processes 1;
#error_log logs/error.log;
#error_log logs/error.log notice;
#error_log logs/error.log info;
#pid logs/nginx.pid;
events {
worker_connections 1024;
}
这些是配置文件开始的默认行。通常的环境下,你不需要修改这些选项。这一部分有几个方面需要我们注意:
- 所有以#号开的行是注释,nginx不会解析。默认的配置文件有许多说明解释的注释块
- 指令是以一个变量名开头(例如,worker_processes或pid),然后包含一个参数(例如,1或 logs/nginx.pid)或者多个参数(例如,"logs/error.log notice")
- 所有指令以分号结尾
- 某些指令,像上面的
events
可以包含多个子指令作为参数。这些子指令以花括号包围。 - 虽然nginx不解析空白符(例如tab,空格,和换行符),但是良好的缩进能提高你维护长期运行配置文件的效率。良好的缩进使配置文件读起来更流畅,能让你很容易明白配置的策略,即使几个月前。
下面我们继续读配置文件
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
http {
include mime.types;
default_type application/octet-stream;
#log_format main '$remote_addr - $remote_user [$time_local] "$request" '
'$status $body_bytes_sent "$http_referer" '
'"$http_user_agent" "$http_x_forwarded_for"';
#access_log logs/access.log main;
sendfile on;
#tcp_nopush on;
#keepalive_timeout 0;
keepalive_timeout 65;
#gzip on;
"http { }"块的开头像配置文件的开头一样都是标准配置不需要修改。这里我们需要把注意力放在这些元素上:
- 这部分内容的开始"include"语句包含/usr/loca/nginx/mime.types文件到nginx.conf文件include语句所在位置。include对ningx.conf文件的可读性和组织性很有用。
- 不能过多使用include,如果太多递归地include文件会产生混乱,所以需要合理有限制地使用include来保证配置文件的清晰和可管理。
- 你可以去掉log_format指令前的注释并修改这几行设置的变量为你想记录的信息。
- gzip指令告诉nginx使用gzip压缩的方式来降低带宽使用和加快传输速度。如果想使用gzip压缩,需要添加如下配置到配置文件的gzip位置。
1
2
3
4
5
6
7
gzip on;
gzip_http_version 1.1;
gzip_comp_level 2;
gzip_types text/plain text/html text/css
application/x-javascript text/xml
application/xml application/xml+rss
text/javascript;
使用gizp压缩并不是没有代价的。在降低带宽的同时也增加了CPU的使用。gzip_cop_level的参数取值范围1-9,9代表最用CPU和1代表最少用CPU,其默认值是1.
另外,请注意上面的片段 "http { " 是http的前半部分,其余部分解下面继续,直到匹配的"}"。
虚拟机server配置
我们家是nginx.conf接下来的配置文件是这样
1
2
3
4
5
6
7
8
9
10
11
12
server {
listen 80;
server_name localhost;
access_log logs/localhost.access.log main;
location / {
root html;
index index.html index.htm;
}
}
}
我们可以看到http{ }块到此结束。
server指令块,像上面例子中那个一样,是我们nginx用户主要配置自己虚拟主机的地方。在server块里有许多重要的指令。listen指令告诉nginx在一个特定的hostname,ip或者tcp端口监听连接。默认,http服务运行在80端口。一下这些listen指令都是有效的:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
listen 127.0.0.1:80;
listen localhost:80;
listen 127.0.0.1:8080;
listen localhost:8080;
listen 192.168.3.105:80;
listen 192.168.3.105:8080;
listen 80;
listen *:80;
listen 8080;
listen *:8080;
listen 12.34.56.77:80;
listen 12.34.56.78:80;
listen 12.34.56.79:80;
在这些例子中,我们可以看到很多不同表达方式:
- 第一组2个指令指明服务器监听在127.0.0.1或localhost的80端口,localhost通常定义在/etc/hosts指向127.0.0.1
- 第二组除了端口号监听在8080而不是80外,与第一组相同。
- 第三组例子定义服务器监听在192.168.3.105的80和8080端口
- 第四组例子是在所有地址上监听特定的端口。listen 80与listen *:80相同,listen 8080与listen *:80相同。
- 最后一组例子设置服务器只监听在12.34.56.77/78/79的80端口上的请求。
server_name指令可以设置基于域名的虚拟主机,根据请求头部的内容,一个ip的服务器可以配置多个域名。下面这些server_name的参数是有效的:
1
2
3
4
5
6
7
8
9
10
11
server_name nginx.cn;
server_name nginx.cn www.nginx.cn;
server_name *.nginx.cn;
server_name .nginx.cn;
server_name nginx.*;
server_name nginx.cng bucknell.net brackley.org;
server_name localhost litchfield bleddington;
server_name "";
多个域名之间以空格分隔。nginx允许一个虚拟主机有一个或多个名字,也可以使用通配符"*"来设置虚拟主机的名字。上面的例子我们看到了很多特殊的地方:
- 第一组例子,首先定义server_name为nginx.cn,那么来自http://nginx.cn的请求就会发到该主机上。第二个例子配置了nginx.cn和www.nginx.cn,那么http://nginx.cn和http://www.nginx.cn的请求会发到这个主机上。
- *.nginx.cn和.nginx.cn是等同的配置,设置该主机处理所有来自nginx.cn的子域名,比如www.nginx.cn,blog.nginx.cn等
- 第二组server_name配置nginx.*,配置服务器处理所有以nginx.开头的请求。例如,nginx.com,nginx.cn,nginx.net,nginx.baidu.com
- 接下来一组第一个server_name配置,设置主机处理来自三个域名的请求。nginx允许设置不是有效域名的名字。比如接下来这个配置我们可以看到三个不是有效域名的例子,localhost,litchfiled和bledington。nginx只查找请求的HTTP头中的域名但并不判断域名是否有效,这个例子中这些主机名可以配制在/etc/hosts中。当你在本机调试时使用非域名的主机名有时候更适合些。
- 最后一组例子,server_name设置为空的双引号,它告诉nginx捕捉所有没有hostname的请求,或者hostname没有在其它server_name中指定的。
我们继续分析接下来的server指令块,看看access_log指令。
1
2
3
4
access_log logs/nginx.access.log;
access_log /srv/http/ducklington.org/logs/access.log;
access_log /var/log/nginx/access/ducklington.org;
access_log off;
第一个例子,日志使用相对路径,log文件放在与配置文件同级的目录中,也就是日志存储在/usr/local/nginx/logs/nginx.access.log;接下来的两个例子定义了完整的绝对路径;最后一个例子是关闭access log,不会记录访问日志到文件。
server块的最后部分是location指令块,对于client的不同请求目标,location是用来配置服务器的不同响应。
就像server_name指令配置nginx处理请求使用包含在请求中的信息一样,location指令配置如何响应不同位置资源的请求。例如:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
location / { }
location /images/ { }
location /blog/ { }
location /planet/ { }
location /planet/blog/ { }
location ~ IndexPage.php$ { }
location ~ ^/BlogPlanet(/|/index.php)$ { }
location ~* .(pl|cgi|perl|prl)$ { }
location ~* .(md|mdwn|txt|mkdn)$ { }
location ^~ /images/IndexPage/ { }
location ^~ /blog/BlogPlanet/ { }
location = / { }
前五个例子是按字面逐字匹配,匹配请求url域名后面开始的部分。假设一个请求http://www.nginx.cn,我们假设server\_name已经匹配www.nginx.cn,那么"location /"指令将捕获这个请求。nginx使用匹配度最高的location。比如http://ducklington.org/planet/blog/和http://ducklington.org/planet/blog/about/会匹配"location /planet/blog",而不是"location /planet/"
location配置
对于特定的请求,一旦nginx匹配一个location来处理。那么这个请求的响应内容就会由这个location块中的指令决定。我们先来看一个最基本的locaiton配置块。
1
2
3
4
location / {
root html;
index index.html index.htm;
}
在这个例子中文档根(doucument root)位于html/目录。根据nginx的安装目录/usr/local/nginx,这个location的完整路径是/usr/local/nginx/html。假设一个请求访问位于/blog/includes/styles.css文件同时没有别的location块匹配,那么nginx会用位于文件系统的/usr/local/nginx/html/blog/includes/styles.css响应。当然你也可以用绝对路径设置root指令。
index指令会告诉nginx使用哪个资源如果请求中没有文件名。因此,如果请求http://.ducklington.org/将会补全资源位置为/usr/local/nginx/html/index.html。如果index配置了多个文件,nginx会按顺序处理直到找到第一个存在的补全资源。如果index.html在相关目录中没有,那么将使用index.htm。如果两个都不存在,会返回404错误。
让我们看另外一个location指令的例子,这些location指令都在ducklington.org的server指令块里。
1
2
3
4
5
6
7
8
9
10
11
12
13
root /srv/www/ducklington.org/public_html;
location / {
index index.html index.htm;
}
location ~ .php$ {
gzip off;
include fastcgi_params;
fastcgi_pass 127.0.0.1:9000;
fastcgi_index index.php;
fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name;
}
在这个例子中,所有以.php结尾的请求都被第二个location块处理。第二个语句块对所有请求指定了一个fastcgi句柄。其它的请求,nginx会使用第一个location块来处理。
请求http://ducklington.org/tasks.php将会被发给fastcgi去执行位于/srv/www/ducklington.org/public\_html/tasks.php的文件
请求 http://ducklington.org/squire/roster.php也将使用fastcgi句柄执行位于 /srv/www/ducklington.org/public_html/squire/roster.pl的文件,并返回结果。
具体的location匹配规则这就不说了,不明白的可以看这里nginx location匹配
最佳实践
上面这些例子和解释应该足够让你能够配置自己的nginx server了。下面列出配置nginx server最佳实践。
首先,把具体某一个要配置的server指令块的所有指令放在一个文件中,然后使用include语句把它包含到配置文件中。
例如绑定ducklington.org域名,首先把ducklington.org的 server指令块配置放在/srv/www/ducklington.org/nginx.conf。然后增加指令include /srv/www/ducklington.org/nginx.conf;到配置文件的http块中。像这样:
1
2
3
4
5
6
7
http {
# [...]
include /srv/www/ducklington.org/nginx.conf;
# [...]
}