美國服務(wù)器運(yùn)行在Nginx上的網(wǎng)站有一定概率會出現(xiàn)【502 Bad Gateway】錯誤,而有些美國服務(wù)器是在轉(zhuǎn)移到Nginx之后就出現(xiàn)了這個問題,這可能并不是Nginx的原因, 美國服務(wù)器網(wǎng)站Nginx 502錯誤的原因比較多,主要是因為在代理模式下后端服務(wù)器出現(xiàn)問題引起的。今天美聯(lián)科技小編就來分析下美國服務(wù)器502錯誤問題的解決辦法。
美國服務(wù)器502錯誤最通常的出現(xiàn)情況就是后端主機(jī)當(dāng)機(jī)。在upstream配置里有這么一項配置:proxy_next_upstream,這個配置指定了nginx在從一個后端主機(jī)取數(shù)據(jù)遇到何種錯誤時會轉(zhuǎn)到下一個后端主機(jī),這里寫上的就是會出現(xiàn)502的所有情況,默認(rèn)是error timeout。error是當(dāng)機(jī)、斷線之類的,timeout是讀取堵塞超時。可以寫為
proxy_next_upstream error timeout invalid_header http_500 http_503;
也可以去掉http_500這一項了,http_500指定后端返回500錯誤時會轉(zhuǎn)一個主機(jī),后端的jsp出錯的話,本來會打印一堆stacktrace的錯誤信息,現(xiàn)在被502取代了。503錯誤就可以保留,因為后端通常是apache resin,如果apache死機(jī)就是error,但resin死機(jī),僅僅是503,所以還是有必要保留的。
美國服務(wù)器遇到502問題,可以優(yōu)先考慮按照以下兩個步驟去解決。
1、查看當(dāng)前的PHP FastCGI進(jìn)程數(shù)是否夠用
netstat -anpo | grep "php-cgi" | wc –l
如果實際使用的【FastCGI進(jìn)程數(shù)】接近預(yù)設(shè)的【FastCGI進(jìn)程數(shù)】,那么,說明【FastCGI進(jìn)程數(shù)】不夠用,需要增大。
2、部分PHP程序的執(zhí)行時間超過了Nginx的等待時間
可以適當(dāng)增加nginx.conf配置文件中FastCGI的timeout時間。php.ini中memory_limit設(shè)低了會出錯,修改了php.ini的memory_limit為64M,重啟nginx,如果發(fā)現(xiàn)恢復(fù)了,那么就是PHP的內(nèi)存不足的原因。
3、max-children和max-requests
美國服務(wù)器主機(jī)上運(yùn)行著nginx php(fpm) xcache的話,訪問量日均 300W pv左右。如果是近期出現(xiàn)php頁面打開很慢,cpu使用率突然降至很低,系統(tǒng)負(fù)載突然升至很高,查看網(wǎng)卡的流量,也會發(fā)現(xiàn)突然降到了很低這樣的情況,而且這種情況只持續(xù)數(shù)秒鐘就恢復(fù),這時檢查php-fpm的日志文件發(fā)現(xiàn)了一些線索:
1)Sep 30 08:32:23.289973 [NOTICE] fpm_unix_init_main(), line 271: getrlimit(nofile): max:51200, cur:51200
2)Sep 30 08:32:23.290212 [NOTICE] fpm_sockets_init_main(), line 371: using inherited socket fd=10, “127.0.0.1:9000″
3)Sep 30 08:32:23.290342 [NOTICE] fpm_event_init_main(), line 109: libevent: using epoll
4)Sep 30 08:32:23.296426 [NOTICE] fpm_init(), line 47: fpm is running, pid 30587
看顯示的這幾句的前面,是1000多行的關(guān)閉children和開啟children的日志。因為php-fpm有一個參數(shù) max_requests,該參數(shù)指明每個children最多處理多少個請求后便會被關(guān)閉,默認(rèn)的設(shè)置是500。因為php是把請求輪詢給每個children,在大流量下,每個childre到達(dá)max_requests所用的時間都差不多,這樣就造成所有的children基本上在同一時間被關(guān)閉。
在這期間,nginx無法將php文件轉(zhuǎn)交給php-fpm處理,所以cpu會降至很低,不用處理php,更不用執(zhí)行sql,而負(fù)載會升至很高,關(guān)閉和開啟children、nginx等待php-fpm,網(wǎng)卡流量也降至很低,nginx無法生成數(shù)據(jù)傳輸給客戶端。
解決方式很簡單,就是增加children的數(shù)量,并且將 max_requests 設(shè)置未 0 或者一個比較大的值,打開 /usr/local/php/etc/php-fpm.conf,調(diào)大以下兩個參數(shù),但是要根據(jù)美國服務(wù)器主機(jī)實際情況,數(shù)值過大也不行。
1)<value name=”max_children”>5120</value>
2)<value name=”max_requests”>600</value>
然后再重啟php-fpm,就能恢復(fù)了。
4、增加緩沖區(qū)容量大小
將nginx的error log打開,發(fā)現(xiàn)【pstream sent too big header while reading response header from upstream】這樣的錯誤提示。大概意思是nginx緩沖區(qū)有一個bug造成的,網(wǎng)站的頁面消耗占用緩沖區(qū)可能過大。
參考國外系統(tǒng)管理員寫的修改辦法,增加了緩沖區(qū)容量大小設(shè)置,502問題徹底解決。后來系統(tǒng)管理員又對參數(shù)做了調(diào)整只保留了2個設(shè)置參數(shù):client head buffer,fastcgi buffer size。
5、request_terminate_timeout
如果主要是在一些post或者數(shù)據(jù)庫操作的時候出現(xiàn)502這種情況,而不是在靜態(tài)頁面操作中常見,那么可以查看一下php-fpm.conf設(shè)置中的一項:
request_terminate_timeout
這個值是max_execution_time,就是fast-cgi的執(zhí)行腳本時間。
0s為關(guān)閉,就是無限執(zhí)行下去。這樣問題也就解決了,執(zhí)行很長時間也不會出錯。
優(yōu)化fastcgi中,還可以改改這個值5s 看看效果。php-cgi進(jìn)程數(shù)不夠用、php執(zhí)行時間長、或者是php-cgi進(jìn)程崩潰,都會出現(xiàn)502錯誤。
關(guān)注美聯(lián)科技,了解更多IDC資訊!