nginx配置负载均衡以及负载均衡的策略的选取(linux)
一、nginx配置负载均衡
安装nginx,修改conf/nginx.conf配置文件
在http块下添加
#配置动态服务器列表
upstream test.com {
server localhost:8080 weight=1; #tomcat1 的ip和端口
server localhost:8081 weight=1; #tomcat2 的ip和端口
}
在location块下添加
#设置代理
proxy_pass http://test.com;
完整的配置文件
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
#配置动态服务器列表
upstream test.com {
server localhost:8080 weight=1; #tomcat1 的ip和端口
server localhost:8081 weight=1; #tomcat2 的ip和端口
}
server {
listen 80;
server_name localhost;
location / {
root html;
index index.html index.htm;
#设置代理
proxy_pass http://test.com;
}
error_page 500 502 503 504 /50x.html;
location = /50x.html {
root html;
}
}
}
上述代码去除了注释的部分
测试的时候开启了两个tomcat,一个8080端口一个8081端口
8080服务器和8081服务器实现负载均衡

刷新

二、nginx负载均衡策略
轮询 |
默认方式 |
weight |
权重方式 |
ip_hash |
依据ip分配方式 |
least_conn |
最少连接方式 |
fair(第三方) |
响应时间方式 |
url_hash(第三方) |
依据URL分配方式 |
轮询
它是upstream模块默认的负载均衡默认策略。每个请求会按时间顺序逐一分配到不同的后端服务器。例如有两台服务器A,B,则按照请求的顺序 第一次转发给A,第二此转发给B,第三次转发给A,第四次转发给B,…以此类推。
参数:
fail_timeout |
与max_fails结合使用。 |
max_fails |
设置在fail_timeout参数设置的时间内最大失败次数,如果在这个时间内,所有针对该服务器的请求都失败了,那么认为该服务器会被认为是停机了, |
fail_time |
服务器会被认为停机的时间长度,默认为10s。 |
backup |
标记该服务器为备用服务器。当主服务器停止时,请求会被发送到它这里。 |
down |
标记服务器永久停机了。 |
- 缺省配置就是轮询策略。
- 在轮询中,如果服务器down掉了,会自动剔除该服务器。
Weight
权重方式,在轮询策略的基础上指定轮询的几率。例子如下:
upstream test.com {
server localhost:8080 weight=2; #tomcat1 的ip和端口
server localhost:8081; #tomcat2 的ip和端口
}
weight参数用于指定轮询几率,weight的默认值为1,;weight的数值与访问比率成正比,比如8080被访问的几率为8081服务器的两倍。
- 权重越高分配到需要处理的请求越多。
- 此策略可以与least_conn和ip_hash结合使用。
- 此策略比较适合服务器的硬件配置差别比较大的情况。
ip_hash
指定负载均衡器按照基于客户端IP的分配方式,这个方法确保了相同的客户端的请求一直发送到相同的服务器,以保证session会话。这样每个访客都固定访问一个后端服务器,可以解决session不能跨服务器的问题。
upstream test.com {
ip_hash; #保证每个访客固定访问一个后端服务器
server localhost:8080 weight=2; #tomcat1 的ip和端口
server localhost:8081; #tomcat2 的ip和端口
}
- 在nginx版本1.3.1之前,不能在ip_hash中使用权重(weight)。
- ip_hash不能与backup同时使用。
- 此策略适合有状态服务,比如session。
- 当有服务器需要剔除,必须手动down掉。
least_conn
把请求转发给连接数较少的后端服务器。轮询算法是把请求平均的转发给各个后端,使它们的负载大致相同;但是,有些请求占用的时间很长,会导致其所在的后端负载较高。这种情况下,least_conn这种方式就可以达到更好的负载均衡效果。
upstream test.com {
least_conn; #把请求转发给连接数较少的后端服务器
server localhost:8080 weight=2; #tomcat1 的ip和端口
server localhost:8081; #tomcat2 的ip和端口
server localhost:8082 backup; #tomcat3 的ip和端口
}
- 此负载均衡策略适合请求处理时间长短不一造成服务器过载的情况。
三、第三方策略
第三方的负载均衡策略的实现需要安装第三方插件。
fair
按照服务器端的响应时间来分配请求,响应时间短的优先分配。
upstream test.com {
server localhost:8080; #tomcat1 的ip和端口
server localhost:8081; #tomcat2 的ip和端口
fair; #实现响应时间短的优先分配
}
url_hash
按访问url的hash结果来分配请求,使每个url定向到同一个后端服务器,要配合缓存命中来使用。同一个资源多次请求,可能会到达不同的服务器上,导致不必要的多次下载,缓存命中率不高,以及一些资源时间的浪费。而使用url_hash,可以使得同一个url(也就是同一个资源请求)会到达同一台服务器,一旦缓存住了资源,再此收到请求,就可以从缓存中读取。
upstream test.com {
hash $request_uri; #实现每个url定向到同一个后端服务器
server localhost:8080; #tomcat1 的ip和端口
server localhost:8081; #tomcat2 的ip和端口
}