⑴ 計網:運輸層
本篇文章先概括介紹運輸層協議的特點、進程之間的通信和埠等重要概念,然後講述比較簡單的UDP協議。然後討論較為復雜但非常重要的TCP協議和可靠傳輸的工作原理,包括停止等待協議和ARQ協議。在詳細講述TCP報文段的首部格式之後,討論TCP的三個重要問題:滑動窗口、流量控制和擁塞控制機制。最後,介紹TCP的連接管理。
從通信和信息處理的角度看,運輸層向它上面的應用層提供通信服務,它屬於面向通信部分的最高層,同時也是用戶功能中的最低層。
當網路的邊緣部分中的兩台主機使用網路 的核心部分的功能進行端到端的通信時,只有主機的協議棧才有運輸層,而網路核心部分中的路由器在轉發分組時都只用到下三層的功能。
運輸層有一個很重要的功能 復用和分用:
從IP層來說,通信的兩端是兩台主機。但實際上,真正進行通信的實體是 在主機中的進程,是這台主機中的一個進程和另一台主機中的一個進程在交換數據(即通信)。運輸層提供應用進程間的邏輯通信。「邏輯通信」的意思是:從應用層來看,只要把應用層報文交給下面的運輸層, 運輸層就可以把這報文傳送到對方的運輸層。但事實上這兩個運輸層之間並沒有一條水平方向的物理連接。數據的傳送是沿著圖中的虛線方向(經過多個層次)傳送的。
從這里可以看出網路層和運輸層有明顯的區別。網路層為主機之間提供邏輯通信,而運輸層為應用進程之間提供端到端的邏輯通信。
運輸層還要對收到的報文進行差錯檢測,而在網路層,IP數據報首部中的檢驗和欄位,只檢驗首部是否出現差錯而不檢查數據部分。
根據應用程序的不同需求,運輸層需要有兩種不同的運輸協議,即面向連接的TCP和無連接的UDP,這兩種協議就是本章要討論的主要內容。
當運輸層採用面向連接的TCP協議時,盡管下面的網路是不可靠的(只提供盡最大努力服務),但這種邏輯通信信道就相當於一條全雙工的可靠信道。但當運輸層釆用無連接的UDP協議時,這種邏輯通信信道仍然是一條不可靠信道。
TCP/IP運輸層的兩個主要協議都是互聯網的正式標准,即:
在TCP/IP體系中,則根據所使用的協議是TCP或 UDP,分別稱之為TCP報文段或UDP用戶數據報。
UDP在傳送數據之前不需要先建立連接。遠地主機的運輸層在收到UDP報文後,不需要給出任何確認。雖然UDP不提供可靠交付,但在某些情況下UDP卻是一種最有效的工作方式。
TCP則提供面向連接的服務。在傳送數據之前必須先建立連接,數據傳送結束後要釋放連接。TCP不提供廣播或多播服務。由於TCP要提供可靠的、面向連接的運輸服務,因此不可避免地增加了許多的開銷,佔用許多處理機資源。
前面己經提到過運輸層的復用和分用功能。應用層所有的應用進程都可以通過運輸層再傳送到IP層(網路層),這就是復用。運輸層從IP層收到發送給各應用進程的數據後,必須分別交付指明的各應用進程,這就是分用。顯然,給應用層的每個應用進程賦予一個非常明確的標志是至關重要的。
為了使運行不同操作系統的計算機的應用進程能夠互相通信,就必須用統一的方法(而這種方法必須與特定操作系統無關)對TCP/IP體系的應用進程進行標志。
解決這個問題的方法就是在運輸層使用協議埠號,或通常簡稱為埠。這就是說,雖然通信的終點是應用進程,但只要把所傳送的報文交到目的主機的某個合適的目的埠,剩下的工作(即最後交付目的進程)就由TCP或UDP來完成。
在協議棧層間的抽象的協議埠是軟體埠,和路由器或交換機上的硬體埠是完全不同的概念。軟體埠是應用層的各種協議進程與運輸實體進行層間交互的一種地址。
TCP/IP的運輸層用一個16位埠號來標志一個埠。但請注意,埠號只具有本地意義,它只是為了標志本計算機應用層中的各個進程在和運輸層交互時的層間介面。在互聯網不同計算機中,相同的埠號是沒有關聯的。
兩個計算機中的進程要互相通信,不僅必須知道對方的IP地址(為了找到對方的計算機),而且要知道對方的埠號(為了找到對方計算機中的應用進程)。
因此運輸層的埠號分為下面的兩大類:
用戶數據報協議UDP只在IP的數據報服務之上增加了很少一點的功能,這就是復用和分用的功能以及差錯檢測的功能。
UDP的主要特點是:
用戶數據報UDP有兩個欄位:數據欄位和首部欄位。首部欄位很簡單,只有8個位元組。由四個欄位組成,每個欄位的長度都是兩個位元組。各欄位意義如下:
當運輸層從IP層收到UDP數據報時,就根據首部中的目的埠,把UDP數據報通過相應的埠,上交最後的終點——應用進程。
如果接收方UDP發現收到的報文中的目的埠號不正確(即不存在對應於該埠號的應用進程),就丟棄該報文,並由網際控制報文協議ICMP發送「埠不可達」差錯報文給發送方。
UDP用戶數據報首部中檢驗和的計算方法有些特殊。在計算檢驗和時,要在UDP用戶 數據報之前增加12個位元組的偽首部。所謂「偽首部」是因為這種偽首部並不是UDP用戶數 據報真正的首部。只是在計算檢驗和時,臨時添加在UDP用戶數據報前面,得到一個臨時的 UDP用戶數據報。檢驗和就是按照這個臨時的UDP用戶數據報來計算的。偽首部既不向下傳
送也不向上遞交,而僅僅是為了計算檢驗和。
UDP計算檢驗和的方法和計算IP數據報首部檢驗和的方法相似。但不同的是:IP數據 報的檢驗和只檢驗IP數據報的首部,但UDP的檢驗和是把首部和數據部分一起都檢驗。
TCP是TCP/IP體系中非常復雜的一個協議,下面介紹TCP最主要的特點:
前面己經講過,每一條TCP連接有兩個端點,TCP連接的端點叫做套接字或插口。埠號拼接到IP地址即 構成了套接字。
因此,套接字的表示方法是在點分十進制的IP地址後面寫上埠號,中間用冒號或逗號隔開,例如說:
每一條TCP連接唯一地被通信兩端的兩個端點(即兩個套接字)所確定,例如:
這里IP1和IP2分別是兩個端點主機的IP地址,而port1和port2分別是兩個端點主機中的埠號。TCP連接的兩個套接字就是socket1和socket2。
總之,TCP連接就是由協議軟體所提供的一種抽象。
雖然有時為了方便,我們也可以說,在一個應用進程和另一個應用進程之間建立了一條TCP連接,但一定要記住:TCP連 接的端點是個很抽象的套接字,即(IP地址:埠號)。
我們知道,TCP發送的報文段是交給IP層傳送的。但IP層只能提供盡最大努力服務,也就是說,TCP下面的網路所提供的是不可靠的傳輸。因此,TCP必須釆用適當的措施才能使得兩個運輸層之間的通信變得可靠。
「停止等待」就是每發送完一個分組就停止發送,等待對方的確認。在收到確認後再發送下一個分組。
停止等待協議有以下四種情況:
停止等待協議的優點是簡單,但缺點是信道利用率太低。
信道利用率U可以用以下公式計算:
為了提高傳輸效率,發送方可以不使用低效率的停止等待協議,而是釆用流水線傳輸,這種傳輸方式可以獲得很高的信道利用率。
滑動窗口協議比較復雜,是TCP協議的精髓所在。這里先給出連續ARQ協議最基本的概念,但不涉及許多細節問題。
發送方維持的發送窗口,它的意義是:位於發送窗口內的分組都可連續發送出去,而不需要等待對方的確認。這樣,信道利用率就提高了。
連續ARQ協議規定,發送方每收到一個確認,就把發送窗口向前滑動一個分組的位置。
如果原來己經發送了前5個分組,那麼現在就可以發送窗口內的第6個分組了。
接收方一般都是釆用累積確認的方式。這就是說,接收方不必對收到的分組逐個發送 確認,而是在收到幾個分組後,對按序到達的最後一個分組發送確認,這就表示:到這個分組為止的所有分組都已正確收到了。
累積確認有優點也有缺點。優點是:容易實現,即使確認丟失也不必重傳。但缺點是不能向發送方反映出接收方己經正確收到的所有分組的信息。
如果發送方發送了前5個分組,而中間的第3個分組丟失了。這時接收方只能對前兩個分組發出確認。發送方無法知道後面三個分組的下落,而只好把後面的三個分組都再重傳一次。這就叫做Go-back-N(回退N)。
TCP雖然是面向位元組流的,但TCP傳送的數據單元卻是報文段。一個TCP報文段分為首部和數據兩部分,而TCP的全部功能都體現在它首部中各欄位的作用。
TCP報文段首部的前20個位元組是固定的,後面有4n位元組是根據需要而增加的選項。因此TCP首部的最小長度是20位元組。
首部固定部分各欄位的意義如下:
TCP的滑動窗口是以位元組為單位的。
現假定A收到了 B發來的確認報文段,其中窗口是20位元組,而確認號是31(這表明B期望收到的下一個序號是31,而序號30為止的數據已經收到了)。
A的發送窗口表示:在沒有收到B的確認的情況下,A可以連續把窗口內的數據都發送出去。凡是已經發送過的數據,在未收到確認之前都必須暫時保留,以便在超時重傳時使用。
發送窗口後沿的後面部分表示己發送且己收到了確認。發送窗口後沿的變化情況有兩種可能,即不動(沒有收到新的確認)和前移(收到了新的確認)。
發送窗口裡面的序號表示允許發送的序號。窗口越大,發送方就可以在收到對方確認之前連續發送更多的數據,因而可能獲得更高的傳輸效率。但A的發送窗口一定不能超過B的接收窗口數值。
發送窗口前沿的前面部分表示不允許發送的。發送窗口前沿通常是不斷向前移動,但也有可能不動。這對應於兩種情況:一是沒有收到新的確認,對方通知的窗口大小也不變;二是收到了 新的確認但對方通知的窗口縮小了,使得發送窗口前沿正好不動。
現在假定A發送了序號為31〜41的數據。這時,發送窗口位置並未改變, 但發送窗口內靠後面有11個位元組(灰色小方框表示)表示己發送但未收到確認。而發送窗口內靠前面的9個位元組(42〜50)是允許發送但尚未發送的。
從以上所述可以看出,要描述一個發送窗口的狀態需要三個指針:P1,P2和P3,小於P1的是已發送並已收到確認的部分,而大於P3的是不允許發送的部分:
再看一下B的接收窗口。B的接收窗口大小是20。在接收窗口外面,到30號為止的數據是已經發送過確認,並且已經交付主機了。因此在B可以不再保留這些數據。接收窗口內的序號(31〜50)是允許接收的。
此時B收到了序號為32和33的數據。這些數據沒有按序到達,因為序號為31的數據沒有收到(也許丟失了,也許滯留在網路中的某處)。請注意,B只能對按序收到的數據中的最高序號給出確認,因此B發送的確認報文段中的確認號仍然是31 (即期望收到的序號),而不能是32或33。
現在假定B收到了序號為31的數據,並把序號為31〜33的數據交付主機,然後B刪除這些數據。接著把接收窗口向前移動3個序號,同時給A發送確認,其中窗口值仍為20,但確認號是34。這表明B已經收到了到序號33為止的數據。我們注意到,B還收到了序號為37, 38和40的數據,但這些都沒有按序到達,只能先暫存在接收窗口中。
A在繼續發送完序號42〜53的數據後,指針P2向前移動和P3重合。發送窗口內的序號都已用完,但還沒有再收到確認(圖5-18)。由於A的發送窗口己滿,可用窗口已減小到零,因此必須停止發送。為了保證可靠傳輸,A只能認為B還沒有收到這些數據。於是,A在經過一段時間後(由超時計時器控制)就重傳這部分數據,重新設置超時計時器,直到收到B的確認為止。
CP的發送方在規定的時間內沒有收到確認就要重傳已發送的報文段。這種重傳的概念是很簡單的,但重傳時間的選擇卻是TCP最復雜的問題之一。
如果把超時重傳 時間設置得太短,就會引起很多報文段的不必要的重傳,使網路負荷增大。但若把超時重傳 時間設置得過長,則又使網路的空閑時間增大,降低了傳輸效率。
那麼,運輸層的超時計時器的超時重傳時間究竟應設置為多大呢?
TCP釆用了一種自適應演算法,它記錄一個報文段發出的時間,以及收到相應的確認的 時間。這兩個時間之差就是報文段的往返時間RTT。TCP保留了 RTT的一個加權平均往返時間RTT s 。
每當第一次測量到RTT樣本時,RTTs值就取為所測量到的RTT樣本 值。但以後每測量到一個新的RTT樣本,就按下式重新計算一次RTT s :
顯然,超時計時器設置的超時重傳時間RTO應略大於上面得 出的加權平均往返時間RTT s ,所以RTO應該這樣計算。
而RTT D 是RTT的偏差的加權平均值,它與RTTs和新的RTT樣本之差有關。
現在發送出一個報文段,設定的重傳時間到了,還沒有收到確認。於是重傳報文段。經過了一段時間後,收到了確認報文段。現在的問題是:如何判定此確認報文段 是對先發送的報文段的確認,還是對後來重傳的報文段的確認?
Kam演算法進行修正。方法是:報文段每重傳一次,就把超時重傳時間RTO增大一些。典型的做法是取新的重傳時間為舊的重傳時間的2倍。當不再發生報文段的重傳時,才根據上面給出的式子計算超時重傳時間。
現在還有一個問題沒有討論。這就是若收到的報文段無差錯,只是未按序號,中間還缺少一些序號的數據,那麼能否設法只傳送缺少的數據而不重傳已經正確到達接收方的數據?答案是可以的。選擇確認就是一種可行的處理方法。
舉一個例子來說明選擇確認的工作原理。TCP的接收方在接收對方發送過來的數據位元組流的序號不連續,結果就形成了一些不連續的位元組塊。
可以看出,序號1〜1000收到了,但序號1001〜1500沒有收到。接下來的位元組流又收到了,可是又缺少了3001〜3500。再後面從序號4501起又沒有收到。
也就是說,接收方收到了和前面的位元組流不連續的兩個位元組塊。如果這些位元組的序號都在接收窗口之內,那麼接收方就先收下這些數據,但要把這些信息准確地告訴發送方,使發送方不要再重復發送這些已收到的數據。
一般說來,我們總是希望數據傳輸得更快一些。但如果發送方把數據發送得過快,接 收方就可能來不及接收,這就會造成數據的丟失。所謂流量控制就是讓發送方的發送速率不要太快,要讓接收方來得及接收。
利用滑動窗口機制可以很方便地在TCP連接上實現對發送方的流量控制。
設A向B發送數據。在連接建立時,B告訴了A:「我的接收窗口rwnd = 400」。因此,發送方的發送窗口不能超過接收方給出的接收窗口的數值。
我們應注意到,接收方的主機B進行了三次流量控制。第一次把窗口減小到rwnd = 300, 第二次又減到rwnd = 100,最後減到rwnd = 0,即不允許發送方再發送數據了。這種使發送方暫停發送的狀態將持續到主機B重新發出一個新的窗口值為止。
TCP協議使得在發送方不發送很小的報文段的同時,接收方也不要 在緩存剛剛有了一點小的空間就急忙把這個很小的窗口大小信息通知給發送方。
在計算機網路中的鏈路容量(即帶寬)、交換結點中的緩存和處理機等,都是網路的資源。在某段時間,若對網路中某一資源的需求超過了該資源所能提供的可用部分,網路的性能就要變壞。這種情況就叫做擁塞,即對資源需求之和 > 可用資源。
網路擁塞往往是由許多因素引起的。簡單地將處理機的速率提高或簡單地擴大緩存的存儲空間,可能會使上述情況緩解一些,但往往又會將瓶頸轉移到其他地方。問題的實質往往是整個系統的各個部分不匹配。只有所有的部分都平衡了,問題才會得到解決。
擁塞控制與流量控制的關系密切,它們之間也存在著一些差別。擁塞控制就是防止過多的數據注入到網路中,這樣可以使網路中的路由器或鏈路不致過載。流量控制往往是指點對點通信量的控制,是個端到端的問題(接收端控制發送端)。
下圖中橫坐標是提供的負載,代表單位時間內輸入給網路的分組數目。縱坐標是吞吐量,代表單位時間內從網路輸出的分組數目。
實踐證明,擁塞控制是很難設計的,因為它是一個動態的(而不是靜態的)問題。
從大的方面看,可以分為 開環控制 和 閉環控制 兩種方法:
TCP進行擁塞控制的演算法有四種,即慢開始、擁塞避免、快重傳和快恢復。
為了集中精力討論擁塞控制,我們假定:
擁塞控制也叫做基於窗口的擁塞控制。為此,發送方維持一個叫做擁塞窗口cwnd的狀態變數。擁塞窗口的大小取決於網路的擁塞程度,並且動態地在變化。發送方讓自己的發送窗口等於擁塞窗口。
發送方控制擁塞窗口的原則是:只要網路沒有出現擁塞,擁塞窗口就可以再增大一些,以便把更多的分組發送出去,這樣就可以提高網路的利用率。但只要網路出現擁塞或有可能出現擁塞,就必須把擁塞窗口減小一些,以減少注入到網路中的分組數,以便緩解網路出現的擁塞。
發送方又是如何知道網路發生了擁塞呢?我們知道,當網路發生擁塞時,路由器就要丟棄分組。因此只要發送方沒有按時收到應當到達的確認報文,也就是說,只要出現了超時,就可以猜想網路可能出現了擁塞。現在通信線路的傳輸質量一般都很好,因傳輸出差錯而丟棄分組的概率是很小的(遠小於1%)。因此,判斷網路擁塞的依據就是出現了超時。
慢開始演算法的思路是這樣的:當主機開始發送數據時,由於並不清楚網路的負荷情況,所以如果立即把大量數據位元組注入到網路,那麼就有可能引起網路發生擁塞。因此我們由小到大逐漸增大擁塞窗口數值。
新的RFC5681把初始擁塞窗口cwnd設置為不超過2至4個SMSS(發送方的最大報文段)的數值。慢開始規定,在每收到一個對新的報文段的確認後,可以把擁塞窗口增加最多一個SMSS的數值。
下面用例子說明慢開始演算法的原理。在一開始發送方先設置cwnd = 1,發送第一個報文段M1,接收方收到後確認M1。發送 方收到對M1的確認後,把cwnd從1增大到2,於是發送方接著發送M2和M3兩個報文 段。接收方收到後發回對M2和M3的確認。發送方每收到一個對新報文段的確認(重傳的不算在內)就使發送方的擁塞窗口加1,因此發送方在收到兩個確認後,cwnd就從2增大到4,並可發送M4〜M7共4個報文段。
與慢開始演算法相輔助的演算法是擁塞避免演算法。
擁塞避免演算法的思路是讓擁塞窗口 cwnd緩慢地增大,即每經過一個往返時間RTT就 把發送方的擁塞窗口cwnd加1,而不是像慢開始階段那樣加倍增長。在擁塞避免階段,擁塞窗口 cwnd按線性規律緩慢增長,比慢開始演算法的擁塞窗口增長速率緩慢得多。
為了防止擁塞窗口 cwnd增長過大引起網路擁塞,還需要設置一個慢開始門限ssthresh 狀態變數。慢開始門限ssthresh的用法如下:
下面用圖片說明慢開始演算法和擁塞避免演算法相互配合的原理。
其中ssthresh的初始值設置為16,開始時使用慢開始演算法,成指數性增長,當到達ssthresh值時,TCP協議預測可能會出現擁塞,所以開始使用避免擁塞演算法,成線性增長,當發生超時重傳時,立即減小擁塞窗口,重復上述步驟。
但是,有時,個別報文段會在網路中丟失,但實際上網路並未發生擁塞。如果發送方遲遲收 不到確認,就會產生超時,就會誤認為網路發生了擁塞。這就導致發送方錯誤地啟動慢開 始,把擁塞窗口cwnd又設置為1,因而降低了傳輸效率。
釆用快重傳演算法可以解決上述問題。快重傳演算法可以讓發送方盡早知道發生了個別報文段的丟失。快重傳演算法首先要求接收方不要等待自己發送數據時才進行捎帶確認,而是要立即發送確認,即使收到了失序的報文段也要立即發出對已收到的報文段的重復確認。
下面舉一個例子來說明快重傳演算法的原理。接收方收到了M1和M2後都分別及時發出了確認。現假定接收方沒有收到M3但卻收到了 M4。本來接收方可以什麼都不做。但按照快重傳演算法,接收方必須立即發送對M2的重復確認,以便讓發送方及 早知道接收方沒有收到報文段M3。發送方接著發送M5和M6。接收方收到後也仍要再次分別發出對M2的重復確認。這樣,發送方共收到了接收方的4個對M2的確認,其中後3個都是重復確認。快重傳演算法規定,發送方只要一連收到3個重復確認,就知道接收方確實沒 有收到報文段M3,因而應當立即進行重傳(即「快重傳」),這樣就不會出現超時,發送方也不就會誤認為出現了網路擁塞。
快恢復演算法與快重傳演算法配合使用,當使用快重傳演算法發現是由於數據丟失而引起的超時(不是網路擁塞引起的),就使用快恢復演算法,此時發送方調整門限值ssthresh=cwnd/2,同時設置擁塞窗口cwnd=ssthresh,並開始執行擁塞避免演算法。
慢開始、擁塞避免、快重傳和快恢復這四種演算法相輔相成,構成了TCP的擁塞控制。
網路層的策略對TCP擁塞控制影響最大的就是路由器的分組丟棄策略。在最簡單的情 況下,路由器的隊列通常都是按照「先進先出」的規則處理到來的分組。
由於隊列長度總是有限的,因此當隊列已滿時,以後再到達的所有分組(如果能夠繼續排隊,這些分組都將排在隊列的尾部)將都被丟棄。這就叫做尾部丟棄策略。
路由器的尾部丟棄往往會導致一連串分組的丟失,這就使發送方出現超時重傳,使 TCP進入擁塞控制的慢開始狀態,結果使TCP連接的發送方突然把數據的發送速率降低到 很小的數值。更為嚴重的是,在網路中通常有很多的TCP連接(它們有不同的源點和終 點),這些連接中的報文段通常是復用在網路層的IP數據報中傳送。在這種情況下,若發生了路由器中的尾部丟棄,就可能會同時影響到很多條TCP連接,結果使這許多TCP連接在同一時間突然都進入到慢開始狀態。這在TCP的術語中稱為全局同步。
為了避免發生網路中的全局同步現象,可以使用主動隊列管理AQM。
所謂「主動」就是不要等到路由器的隊列長度已經達到最大值時才不得不丟棄後面到達的分組。這樣就太被動了。應當在隊列長度達到某個值得警惕的數值時 (即當網路擁塞有了某些擁塞徵兆時),就主動丟棄到達的分組。這樣就提醒了發送方放慢發送的速率,因而有可能使網路擁塞的程度減輕,甚至不出現網路擁塞。
TCP是面向連接的協議。運輸連接是用來傳送TCP報文的。TCP運輸連接的建立和釋放是每一次面向連接的通信中必不可少的過程。因此,運輸連接就有三個階段,即:連接建立、數據傳送和連接釋放。運輸連接的管理就是使運輸連接的建立和釋放都能正常地進行。
在TCP連接建立過程中要解決以下三個問題:
TCP連接的建立釆用客戶伺服器方式。主動發起連接建立的應用進程叫做客戶,而被動等待連接建立的應用進程叫做伺服器。
TCP建立連接的過程叫做握手,握手需要在客戶和伺服器之間交換三個TCP報文段。
下面舉一個例子來說明TCP建立連接的過程。假定主機A運行的是TCP客戶程序,而B運行TCP伺服器程序。最初兩端的TCP進程都處於CLOSED(關閉)狀態。圖中在主機下面的方框分別是TCP進程所處的狀態。請注意,在本例中,A主動打開連接,而B被動打開連接。
一開始,B的TCP伺服器進程先創建傳輸控制塊TCB,准備接受客戶進程的連接請求。然後伺服器進
⑵ 計算機網路——TCP/UDP協議
計算機網路七層模型中,傳輸層有兩個重要的協議:
(1)用戶數據報協議UDP (User Datagram Protocol)
(2)傳輸控制協議TCP (Transmission Control Protocol)
UDP 在傳送數據之前不需要先建立連接。遠地主機的運輸層在收到UDP 報文後,不需要給出任何確認。雖然UDP 不提供可靠交付,但在某些情況下UDP 卻是一種最有效的工作方式。
TCP 則提供面向連接的服務。在傳送數據之前必須先建立連接,數據傳送結束後要釋放連接。TCP 不提供廣播或多播服務。由於TCP 要提供可靠的、面向連接的運輸服務,因此不可避免地增加了許多的開銷,如確認、流量控制、計時器以及連接管理等。
UDP 的主要特點是:
首部手段很簡單,只有8 個位元組,由四個欄位組成,每個欄位的長度都是兩個位元組。
前面已經講過,每條TCP 連接有兩個端點,TCP 連接的端點叫做套接字(socket)或插口。套接字格式如下:
套接寧socket= (IP 地址:埠號』)
每一條TCP 連接唯一地被通信兩端的兩個端點(即兩個套接宇)所確定。即:
TCP 連接= {socket1, socket2} = {(IP1: port1), (IP2: port2)}
3次握手鏈接
4次握手釋放鏈接
斷開連接請求可以由客戶端發出,也可以由伺服器端發出,在這里我們稱A端向B端請求斷開連接。
各個狀態節點解釋如下:
下面為了討論問題的萬便,我們僅考慮A發送數據而B 接收數據並發送確認。因此A 叫做發送方,而B 叫做接收方。
「停止等待」就是每發送完一個分組就停止發送,等待對方的確認。在收到確認後再發送下一個分組。
使用上述的確認和重傳機制,我們就可以在不可靠的傳輸網路上實現可靠的通信。像上述的這種可靠傳輸協議常稱為自動重傳請求ARQ (Automatic Repeat reQuest)。意思是重傳的請求是自動進行的。接收方不需要請求發送方重傳某個出錯的分組。
滑動窗口協議比較復雜,是TCP 協議的精髓所在。這里先給出連續ARQ 協議最基本的概念,但不涉提到許多細節問題。詳細的滑動窗口協議將在後面討論。
下圖表示發送方維持的發送窗口,它的意義是:位於發送窗口內的5 個分組都可連續發送出去,而不需要等待對方的確認。這樣,信道利用率就提高了。
連續ARQ 協議規定,發送方每收到一個確認,就把發送窗口向前滑動一個分組的位置。
接收方一般都是採用 累積確認 的方式。這就是說,接收方不必對收到的分組逐個發送確認,而是可以在收到幾個分組後,對按序到達的最後一個分組發送確認,這樣就表示:到這個分組為止的所有分組都己正確收到了。
累積確認 的優點是容易實現,即使確認丟失也不必重傳。但缺點是不能向發送方反映出接收方己經正確收到的所有分組的信息。
例如,如果發送方發送了前5 個分組,而中間的第3 個分組丟失了。這時接收方只能對前兩個分組發出確認。發送方無法知道後面三個分組的下落,而只好把後面的三個分組都再重傳一次。這就叫做Go-back-N (回退N ),表示需要再退回來重傳己發送過的N 個分組。可見當通信線路質量不好時,連續ARQ 協議會帶來負面的影響。
TCP 的滑動窗口是以位元組為單位的。現假定A 收到了B 發來的確認報文段,其中窗口是20 (位元組),而確認號是31 (這表明B 期望收到的下一個序號是31 ,而序號30 為止的數據己經收到了)。根據這兩個數據, A 就構造出自己的發送窗口,其位置如圖所示。
發送窗口表示:在沒有收到B 的確認的情況下, A可以連續把窗口內的數據都發送出去。凡是己經發送過的數據,在未收到確認之前都必須暫時保留,以便在超時重傳時使用。
發送窗口後沿的後面部分表示己發送且己收到了確認。這些數據顯然不需要再保留了。而發送窗口前沿的前面部分表示不允許發送的,因為接收方都沒有為這部分數據保留臨時存放的緩存空間。
現在假定A 發送了序號為31 ~ 41 的數據。這時發送窗口位置並未改變,但發送窗口內靠後面有11個位元組(灰色小方框表示)表示己發送但未收到確認。而發送窗口內靠前面的9 個位元組( 42 ~ 50 )是允許發送但尚未發送的。】
再看一下B 的接收窗口。B 的接收窗口大小是20,在接收窗口外面,到30 號為止的數據是已經發送過確認,並且己經交付給主機了。因此在B 可以不再保留這些數據。接收窗口內的序號(31~50)足允許接收的。B 收到了序號為32 和33 的數據,這些數據沒有按序到達,因為序號為31 的數據沒有收到(也許丟失了,也許滯留在網路中的某處)。 請注意, B 只能對按序收到的數據中的最高序號給出確認,因此B 發送的確認報文段中的確認號仍然是31 (即期望收到的序號)。
現在假定B 收到了序號為31 的數據,並把序號為31~33的數據交付給主機,然後B刪除這些數據。接著把接收窗口向前移動3個序號,同時給A 發送確認,其中窗口值仍為20,但確認號是34,這表明B 已經收到了到序號33 為止的數據。我們注意到,B還收到了序號為37, 38 和40 的數據,但這些都沒有按序到達,只能先存在接收窗口。A收到B的確認後,就可以把發送窗口向前滑動3個序號,指針P2 不動。可以看出,現在A 的可用窗口增大了,可發送的序號范圍是42~53。整個過程如下圖:
A 在繼續發送完序號42-53的數據後,指針P2向前移動和P3重合。發送窗口內的序號都已用完,但還沒有再收到確認。由於A 的發送窗口己滿,可用窗口己減小到0,因此必須停止發送。
上面已經講到, TCP 的發送方在規定的時間內沒有收到確認就要重傳已發送的報文段。這種重傳的概念是很簡單的,但重傳時間的選擇卻是TCP 最復雜的問題之一。
TCP採用了一種自適應演算法 ,它記錄一個報文段發出的時間,以及收到相應的確認的時間。這兩個時間之差就是報文段的往返時間RTT,TCP 保留了RTT的一個加權平均往返時間RTTs (這又稱為平滑的往返時間, S 表示Smoothed 。因為進行的是加權平均,因此得出的結果更加平滑)。每當第一次測量到RTT樣本時, RTTs值就取為所測量到的RTT樣本值。但以後每測量到一個新的RTT樣本,就按下式重新計算一次RTTs:
新的RTTs = (1 - α)×(舊的RTTs) + α ×(新的RTT樣本)
α 越大表示新的RTTs受新的RTT樣本的影響越大。推薦的α 值為0.125,用這種方法得出的加權平均往返時間RTTs 就比測量出的RTT值更加平滑。
顯然,超時計時器設置的超時重傳時間RTO (RetransmissionTime-Out)應略大於上面得出的加權平均往返時間RTTs。RFC 2988 建議使用下式計算RTO:
RTO = RTTs + 4 × RTTd
RTTd是RTT 的偏差的加權平均值,它與RTTs和新的RTT樣本之差有關。計算公式如下:
新的RTTd= (1- β)×(舊的RTTd) + β × |RTTs-新的RTT樣本|
發現問題: 如圖所示,發送出一個報文段。設定的重傳時間到了,還沒有收到確認。於是重
傳報文段。經過了一段時間後,收到了確認報文段。現在的問題是:如何判定此確認報文段是對先發送的報文段的確認,還是對後來重傳的報文段的確認?
若收到的確認是對重傳報文段的確認,但卻被源主機當成是對原來的報文段的確認,則這樣計算出的RTTs 和超時重傳時間RTO 就會偏大。若後面再發送的報文段又是經過重傳後才收到確認報文段,則按此方法得出的超時重傳時間RTO 就越來越長。
若收到的確認是對原來的報文段的確認,但被當成是對重傳報文段的確認,則由此計算出的RTTs 和RTO 都會偏小。這就必然導致報文段過多地重傳。這樣就有可能使RTO 越來越短。
Kam 提出了一個演算法:在計算加權平均RTTs 時,只要報文段重傳了就不採用其往返時間樣本。這樣得出的加權平均RTTs 和RTO 就較准確。
新問題: 設想出現這樣的情況:報文段的時延突然增大了很多。因此在原來得出的重傳時間內,不會收到確認報文段。於是就重傳報文段。但根據Kam 演算法,不考慮重傳的報文段的往返時間樣本。這樣,超時重傳時間就無法更新。
解決方案: 對Kam 演算法進行修正,方法是z報文段每重傳一次,就把超時重傳時間RTO 增大一些。典型的做法是取新的重傳時間為2 倍的舊的重傳時間。當不再發生報文段的重傳時,才根據上面給出的公式計算超時重傳時間。
流量控制(flow control)就是讓發送方的發送速率不要太快,要讓接收方來得及接收。
利用滑動窗口機制可以很方便地在TCP 連接上實現對發送方的流量控制。
接收方的主機B 進行了三次流量控制。第一次把窗口減小到rwnd =300,第二次又減到rwnd = 100 ,最後減到rwnd = 0 ,即不允許發送方再發送數據了。這種使發送方暫停發送的狀態將持續到主機B 重新發出一個新的窗口值為止。我們還應注意到,B 向A 發送的三個報文段都設置了ACK=1,只有在ACK=1 時確認號欄位才有意義。
發生死鎖: 現在我們考慮一種情況。上圖中, B 向A 發送了零窗口的報文段後不久, B 的接收緩存又有了一些存儲空間。於是B 向A 發送了rwnd = 400 的報文段。然而這個報文段在傳送過程中丟失了。A 一直等待收到B 發送的非零窗口的通知,而B 也一直等待A 發送的數據。如果沒有其他措施,這種互相等待的死鎖局面將一直延續下去。
解決方案: TCP 為每一個連接設有一個 持續計時器(persistence timer) 。只要TCP 連接的一方收到對方的零窗口通知,就啟動持續計時器。若持續計時器設置的時間到期,就發送一個 零窗口探測報文段 (僅攜帶1 宇節的數據),而對方就在確認這個探測報文段時給出了現在的窗口值。
1 TCP連接時是三次握手,那麼兩次握手可行嗎?
在《計算機網路》中是這樣解釋的:已失效的連接請求報文段」的產生在這樣一種情況下:client發出的第一個連接請求報文段並沒有丟失,而是在某個網路結點長時間的滯留了,以致延誤到連接釋放以後的某個時間才到達server。本來這是一個早已失效的報文段。但server收到此失效的連接請求報文段後,就誤認為是client再次發出的一個新的連接請求。於是就向client發出確認報文段,同意建立連接。假設不採用「三次握手」,那麼只要server發出確認,新的連接就建立了。由於現在client並沒有發出建立連接的請求,因此不會理睬server的確認,也不會向server發送ACK包。這樣就會白白浪費資源。而經過三次握手,客戶端和伺服器都有應有答,這樣可以確保TCP正確連接。
2 為什麼TCP連接是三次,揮手確是四次?
在TCP連接中,伺服器端的SYN和ACK向客戶端發送是一次性發送的,而在斷開連接的過程中,B端向A端發送的ACK和FIN是是分兩次發送的。因為在B端接收到A端的FIN後,B端可能還有數據要傳輸,所以先發送ACK,等B端處理完自己的事情後就可以發送FIN斷開連接了。
3 為什麼在第四次揮手後會有2個MSL的延時?
MSL是Maximum Segment Lifetime,最大報文段生存時間,2個MSL是報文段發送和接收的最長時間。假定網路不可靠,那麼第四次發送的ACK可能丟失,即B端無法收到這個ACK,如果B端收不到這個確認ACK,B端會定時向A端重復發送FIN,直到B端收到A的確認ACK。所以這個2MSL就是用來處理這個可能丟失的ACK的。
1 文件傳送協議
文件傳送協議FTP (File Transfer Protocol) [RFC 959]是網際網路上使用得最廣泛的文件傳送協議,底層採用TCP協議。
盯P 使用客戶伺服器方式。一個FTP 伺服器進程可同時為多個客戶進程提供服務。FTP的伺服器進程由兩大部分組成:一個主進程,負責接受新的請求:另外有若干個從屬進程,負責處理單個請求。
在進行文件傳輸時,客戶和伺服器之間要建立兩個並行的TCP 連接:「控制連接」(21埠)和「數據連接」(22埠)。控制連接在整個會話期間一直保持打開, FTP 客戶所發出的傳送請求,通過控制連接發送給伺服器端的控制進程,但控制連接並不用來傳送文件。實際用於傳輸文件的是「數據連接」。伺服器端的控制進程在接收到FTP 客戶發送來的文件傳輸請求後就創建「數據傳送進程」和「數據連接」,用來連接客戶端和伺服器端的數據傳送進程。
2 簡單文件傳送協議TFTP
TCP/IP 協議族中還有一個簡單文件傳送協議TFfP (Trivial File Transfer Protocol),它是一個很小且易於實現的文件傳送協議,埠號69。
TFfP 也使用客戶伺服器方式,但它使用UDP 數據報,因此TFfP 需要有自己的差錯改正措施。TFfP 只支持文件傳輸而不支持交耳。
3 TELNET
TELNET 是一個簡單的遠程終端協議,底層採用TCP協議。TELNET 也使用客戶伺服器方式。在本地系統運行TELNET 客戶進程,而在遠地主機則運行TELNET 伺服器進程,佔用埠23。
4 郵件傳輸協議
一個電子郵件系統應具如圖所示的三個主要組成構件,這就是用戶代理、郵件伺服器,以及郵件發送協議(如SMTP )和郵件讀取協議(如POP3), POP3 是郵局協議(Post Office Protocol)的版本3 。
SMTP 和POP3 (或IMAP )都是在TCP 連接的上面傳送郵件,使用TCP 的目的是為了使郵件的傳送成為可靠的。