2014年6月15日 星期日

[ Java 文章收集 ] Java Socket 重要參數介紹

來源自 這裡 
Preface: 
Java Socket 的 api 可能很多人會用,但是 Java Socket 的參數可能很多人都不知道用來幹嘛的,甚至都不知道有這些參數。 

backlog: 
用於 ServerSocket,配置 ServerSocket 的最大客戶端等待隊列。等待隊列的意思. Wiki 上的說明如下: 
backlog is an integer representing the number of pending connections that can be queued up at any one time. The operating system usually places a cap on this value.

先看下面代碼: 
  1. public class Main {  
  2.     public static void main(String[] args) throws Exception {  
  3.         int port = 8999;  
  4.         int backlog = 2;  
  5.         ServerSocket serverSocket = new ServerSocket(port, backlog);  
  6.         Socket clientSock = serverSocket.accept();  
  7.         System.out.println("revcive from " + clientSock.getPort());  
  8.         while (true) {  
  9.             byte buf[] = new byte[1024];  
  10.             int len = clientSock.getInputStream().read(buf);  
  11.             System.out.println(new String(buf, 0, len));  
  12.         }  
  13.     }  
  14. }  
這段測試代碼在第一次處理一個客戶端時,就不會處理第二個客戶端,所以除了第一個客戶端,其他客戶端就是等待隊列了。所以這個服務器最多可以同時連接3個客戶端,其中2個等待隊列。大家可以telnet localhost 8999測試下。 

這個參數設置為-1表示無限制,默認是50個最大等待隊列,如果設置無限制,那麼你要小心了,如果你服務器無法處理那麼多連接,那麼當很多客戶端連到你的服務器時,每一個 TCP 連接都會佔用服務器的內存,最後會讓服務器崩潰的。 

另外,就算你設置了 backlog 為10,如果你的代碼中是一直Socket clientSock = serverSocket.accept(),假設我們的機器最多可以同時處理100個請求,總共有100 個線程在運行,然後你把在 100 個線程的線程池處理 clientSock,不能處理的 clientSock 就排隊,最後 clientSock 越來越多,也意味著 TC​​P 連接越來越多,也意味著我們的服務器的內存使用越來越高 (客戶端連接進程,肯定會發送數據過來,數據會保存到服務器端的TCP接收緩存區),最後服務器就宕機了。所以如果你不能處理那麼多請求,請不要循環無限制地調用 serverSocket.accept() ,否則 backlog 也無法生效。如果真的請求過多,只會讓你的服務器宕機 (相信很多人都是這麼寫,要注意點)! 

TcpNoDelay: 
禁用 納格演算法 (Nagle's algorithm),將數據立即發送出去。納格演算法是以減少封包傳送量來增進 TCP/IP 網絡的效能,當我們調用下面代碼,如: 
  1. Socket socket = new Socket();     
  2. socket.connect( new InetSocketAddress(host, 8000));     
  3. InputStream in = socket.getInputStream();     
  4. OutputStream out = socket.getOutputStream();     
  5. String head = "hello ";     
  6. String body = " world\r\n";     
  7. out.write(head.getBytes());     
  8. out.write(body.getBytes());  
我們發送了 "hello",當 "hello" 沒有收到 ack 確認 (TCP是可靠連接,發送的每一個數據都要收到對方的一個ack確認,否則就要重發)的時候,根據納格演算法, "world" 不會立馬發送,會等待,要么等到 ack 確認 (最多等100ms對方會發過來的),要么等到 TCP 緩衝區內容>=MSS,很明顯這裡沒有機會,我們寫了 "world" 後再也沒有寫數據了,所以只能等到 "hello" 的 ack 我們才會發送 "world" ,除非我們禁用納格算法,數據就會立即發送了。 

SoLinger: 
當我們調用 socket.close() 返回時,socket 已經 write 的數據未必已經發送到對方了,例如 
  1. Socket socket = new Socket();     
  2. socket.connect( new InetSocketAddress(host, 8000));     
  3. InputStream in = socket.getInputStream();     
  4. OutputStream out = socket.getOutputStream();     
  5. String head = "hello ";     
  6. String body = " world\r\n";     
  7. out.write(head.getBytes());     
  8. out.write(body.getBytes());   
  9. socket.close();  
裡調用了 socket.close() 返回時 , "hello" 和 "world" 未必已經成功發送到對方了,如果我們設置了 linger 而不小於0,如 
  1. boolean on = true;  
  2. int linger = 100;  
  3. ....  
  4. socket.setSoLinger(boolean on, int linger)  
  5. ......  
  6. socket.close();  
那麼 close 會等到發送的數據已經確認了才返回。但是如果對方宕機,超時,那麼會根據 linger 設定的時間返回. 

UrgentData & OOBInline: 
TCP的緊急指針,一般都不建議使用,而且不同的TCP/IP實現,也不同,一般說如果你有緊急數據寧願再建立一個新的TCP/IP連接發送數據,讓對方緊急處理。所以這兩個參數,你們可以忽略吧,想知道更多的,自己查下資料。 

SoTimeout: 
設置 socket 調用 InputStream 讀數據的超時時間,以毫秒為單位,如果超過這個時候,會拋出 java.net.SocketTimeoutException。 

KeepAlive: 
當我們作為服務端,一個客戶端連接上來,如果設置了 keeplive 為true,當對方沒有發送任何數據過來,超過一個時間 (看系統內核參數配置),那麼我們這邊會發送一個ack探測包發到對方,探測雙方的TCP/IP連接是否有效 (對方可能斷點,斷網),在Linux好像這個時間是75秒。如果不設置,那麼客戶端宕機時,服務器永遠也不知道客戶端宕機了,仍然保存這個失效的連接。 

SendBufferSize & ReceiveBufferSize: 
TCP 發送緩存區和接收緩存區,默認是 8192,一般情況下足夠了,而且就算你增加了發送緩存區,對方沒有增加它對應的接收緩衝,那麼在TCP三握手時,最後確定的最大發送窗口還是雙方最小的那個緩衝區,就算你無視,發了更多的數據,那麼多出來的數據也會被丟棄。除非雙方都協商好。 
public void setSendBufferSize(int size) throws SocketException
public int getSendBufferSize() throws SocketException
public void setReceiveBufferSize(int size) throws SocketException
public int getReceiveBufferSize() throws SocketException

Supplement: 
网络编程中Nagle算法和Delayed ACK的测试

沒有留言:

張貼留言

[Git 常見問題] error: The following untracked working tree files would be overwritten by merge

  Source From  Here 方案1: // x -----删除忽略文件已经对 git 来说不识别的文件 // d -----删除未被添加到 git 的路径中的文件 // f -----强制运行 #   git clean -d -fx 方案2: 今天在服务器上  gi...