目录
一. 关于IP
1.1 什么是IP协议
1.2 前置认识
二. IP报头字段详解
三. 网段划分
3.1 IP地址的构成
3.2 网段划分
3.3 子网划分
3.4 IP地址不足问题
四. 公网IP和私有IP
五. 理解运营商和全球网络
六. 路由
七. IP报文的分片与组装
我数学成绩很好,10次考试6次满分,然后大家都在传,说我有“数学考满分的能力”,那么我一定能做到吗?
不一定,只是有很大的概率考满分
如果我想每次都考满分,该怎么办呢?
我有很大的概率考满分,但是我不想要这个概率。我只想每次都考满分。好在我不光成绩好,我叔、三叔是教导主任。我是个特别执拗的人,考不到满分我就会发脾气,我三叔很宠我。如果本次考试没有考满分,我三叔就会让这次考试无效,重新考。这样就能保证每次都考满分。
其中,三叔是我的上层,而我是真正用来考试执行的人(如果我每次只能考60多分,那么重复考试就是没有意义的。考100次也不会满分的)
三叔本质是给我提供策略,我是真正“执行考试”的人,没考到满分就重新考,这相当于超时重传
IP协议的本质工作是:提供一种能力,将数据跨网络从A主机送到B主机
IP地址并不是4字节数据或者点分十进制
用户需要的是:提供一种能力,将数据“可靠地”将数据从A主机跨网络送到B主机;按照现在的网络,将数据成功送过去的概率很高,但不是100%,所以传输层提供策略,下层提供能力。也就是三叔和我两者结合就能保证“我”每次都能考满分。
数据发送的过程中会经过很多路由器,就好比我们网络基础1的旅游的例子
所以,IP地址 = 目标网络 + 目标主机
我们处在一个精心设计的世界中,你有身份证号,上学时有学号,上班时有工号,我们有学号但是我们学号,但是不是单纯的数据,是有构成格式的:学号 = 学院编号/专业编号/班级编号/学生编号
你在你们学校捡到了个钱包,你现在想把钱包归还,你最开始是通过一个一个问学生的学号是否匹配上,但是你发现这样效率太低下了。这个归还钱包的过程本质是查找,查找的本质是排除
每个学院都有学生会主席,每个学生会主席都给自家学院建了一个群,然后每个主席又相互建了一个主席群,而且学生会主席肯定知道其它学院的编号,然后我艾特主席,把卡照片发给他,然后主席再把照片发主席群里去
然后主席一看,是电气学院的学号,便艾特了电气学院的主席,然后电气主席说这是我们学院的学号,然后电气主席再把照片发到他的电气学院群里去艾特小美,然后交换联系方式,最后物归原主
上面一顿操作下来,让整个校园卡归还过程快速合理,一开始我说不是我学院的,排除了我这个学院的所有人,然后主席找到了电气主席本质是排除了其它学院,就加速了归还过程。
为什么归还的速度变快了?
我把钱包(报文)直接转给计算机学院的学生会主席,本质上是我淘汰了我所在的局域网当中的所有主机,淘汰了一群人。计算机学院的主席此时把数据转发给群里,@了电气学院主席,本质上是淘汰了其他的群。查找的本质是排除,建立群把我们每个人按照学号的方式进行拉群,本质是因为以前一次淘汰一个人,现在一次淘汰一群人。淘汰/排除的效率高了
我们把我自己的学院编号叫做源IP地址,把要归还的校园卡的学校叫做目的IP,各自学院的群叫做局域网主机,把主席叫做局域网出口路由器,把主席群叫做公网。在这次查找是我们的思路是,先找到目标网络,然后再由目标网络找到目标主机
为什么要这样呢,因为在查找的时候效率高,一次可以排除很多东西。唐僧要去西天取经,肯定是排除了路上的其他城市,只选择了到西天的必经城市
我们发现,IP报头在宏观上跟TCP报头很相似,所以我们把内核上的协议叫做TCP/IP
两个老问题:
先解决封装和解包的过程 再解决分用的过程
报头和有效载荷如何分离?
有效载荷长度 = 16位总长度 - 固定长度报头,就能将有效载荷和报头分离
4位首部长度
真实报头长度 = 4位首部长度(假设是x) * 4,范围为[0000, 1111],换成十进制就是[0, 15]
标准报头长度为20字节,那么x就是5,首部长度就是[5, 15],就是[20, 60]字节之间,这和TCP是一模一样的
那我该怎么识别这个IP呢?很简单 我管你多长只需要先读取20个字节,里面的字段都有了
16位总长度
4位版本
这个是固定死的,对于IPv4来说就是4
但是现在有个问题,ip地址是32位,也就是42亿个,现在入网设备太多了,面临着“IP地址不足”的问题
解决方法有很多,NAT,还有IPv6,其中IPv6相当于新的协议了,它用128位来标识,IPv6和IPv4不兼容,IPv6我国最强大,主要用在国内内网,IPv4主要用在公网,这个我们后面讲运营商在讲,现在默认认为是4
8位服务类型
比如说你要去云南去玩,可能又非常多的路线和方式供你选择,比如说坐飞机,坐火车,骑自行车。
8位生存时间(TTL)
为什么要有8位生存时间
一个报文如果允许能一直转发,可是这种一直转发就会因为目的地址找不到了,时间一久,网络中会出现很多游离报文。他们从A-B B-C 我们不允许这样的情况存在,所以就有了8位生存时间
8位协议
比如填上特定TCP的编号,就可以告诉上方,当前数据包要交给谁了
如何将有效载荷交付给上层?
基于IP协议的传输层协议不止一种,因此当IP从底层获取到一个报文并对其进行解包后,IP需要知道应该将分离后得到的有效载荷交付给上层的哪一个协议。
在IP报头当中有一个字段叫做8位协议,该字段表示的就是上层协议的类型,IP就是根据该字段判定应该将分离出来的有效载荷交付给上层的哪一个协议的。该字段是发送方的IP层从上层传输层获取到数据后填充的,比如是上层TCP交给IP层的数据,那么该数据在封装IP报头时的8位协议填充的就是TCP对应的编号。
32位源IP和32位目的IP
我们以前在进行socket套接字编码的时候,要求填充 ip + port,,端口号将来是给我们的TCP用的不管是源还是目的,ip将来给我们的IP层用的。每发出去个报文,你的源IP地址就是你自己,32位目的IP地址就是对方的IP地址。
现在可以认为:我们在应用层要把点分十进制的ip字符串转化成4字节的ip是为了填充报头的这两个内容的,而32位源IP和32位目的IP是提供给路由器让它进行路径选择的
IP报头当中的32位源IP地址和32位目的IP地址,分别代表的就是该报文的发送端和接收端对应的IP地址。
数据在网络传输过程中会遇到一个个的路由器,这些路由器会帮助网络当中的数据进行路由转发,使得网络中的数据慢慢趋近于目标主机。路由器在帮助数据进行路由转发时,会提取出该数据的IP报头当中的目的IP地址,并以此作为数据路由转发的重要依据。
当接收端收到了发送端发来的数据后,接收端可能也想要给发送端发送数据,因此发送端在发送数据时除了需要指明该数据的目的IP地址,还需要指明该数据的源IP地址,也就是发送端的IP地址。即便接收端收到数据后没有数据想要发送给发送端,但至少接收端需要向发送端发送一个响应报文,表明发送端发送的数据已经被接收端可靠的收到了,因此发送出去的数据除了需要指明该数据的目的IP地址,还需要指明该数据的源IP地址。
理解socket编程:
在进行socket编程的时候,当一端想要发送数据给另一端时,必须要指明对端的IP地址和端口号,也就是发送数据的目的IP地址和目的端口号。
其中这里的IP地址就是给网络层的IP用的,用于数据在网络传输过程中的路由转发,而这里的端口号就是给传输层的TCP或UDP用的,用于指明该数据应该交给上层的哪一个进程。
发送数据时我们不需要指明发送数据的源IP地址和源端口号,因为传输层和网络层都是在操作系统内核当中实现的,数据在进行封装时操作系统会自行填充上对应的源IP地址和源端口号。
唐僧去西天取经的时候,会有人问他,和尚你从哪里来?唐僧会说我从东土大唐而来,我要去西天拜佛求经。这句话说完整就是:我(报文)从东土大唐(源IP)而来,我受唐太宗(源端口号)之命,我要去西天(目标IP),面见如来佛祖(目的端口号)求得真经(数据)
IP地址分为两部分:网络号和主机号
这就好比我们学号的班级加个人编号一样,一个班级内的同学前面的数字是一样的,这叫做同一个网段,后面两个数字或者三个数字不一样,这就是主机号不能相同
通过合理设置主机号和网络号, 就可以保证在相互连接的网络中, 每台主机的IP地址都不相同. 那么问题来了, 手动管理子网内的IP, 是一个相当麻烦的事情.
DHCP协议
网络开始兴起的时候是32位的IP,可以标识2^32差不多42亿,用完就没了,所以我们可以认为IP地址是一种有限的资源,就意味着各个国家是要竞争IP的
IP分为网路地址和主机地址,曾经提出的划分这两个地址的方式,是把IP地址分为5类,称之为分类划分法:
但是随着网络发展,这种划分方式问题很快出现:
注意:该方法是针对上面五种IP的类类型提出的,因为可以看到有些IP地主机号太多了,实际情况下不需要这么多主机,所以需要将主机号减少,减少IP的主机数,就能划分出更多子网,减少IP地址浪费
CIDR方案
引入一个额外的子网掩码(subnet mask)来区分网络号和主机号;
子网掩码也是一个32位的正整数. 通常用一串 "0" 来结尾;
将IP地址和子网掩码进行 "按位与" 操作, 得到的结果就是网络号;
网络号和主机号的划分与这个IP地址是A类、B类还是C类无关;
此时一个网络就被更细粒度的划分成了一个个更小的子网,通过不断的子网划分,子网中IP地址对应的主机号就越来越短,因此子网当中可用IP地址的个数也就越来越少,这也就避免了IP地址被大量浪费的情况。
特殊的IP地址
并不是所有的IP地址都能够作为主机的IP地址,有些IP地址本身就是具有特殊用途的。
也就是说,IP地址中主机号为全0的代表的是当前局域网的网络号,IP地址中主机号为全1的代表的是广播地址,这两个IP地址都是不能作为主机的IP地址的。
CIDR虽然一定程度上缓解了IP地址浪费的问题,但是没有增加IP地址的绝对上限,仍然不是很够用,所以有下面三种解决方法:
私网IP地址的种类
如果一个组织内部组件局域网,在这个局域网内,IP地址只用于局域网内地通信,而不直接连接到公网上,理论上使用任何IP都可以,但是为了规范,RFC 1918 规定了用于组件局域网地私有IP地址:
包含在上面三个范围中地,都成为私有IP,其余地都是公网IP,我们连接云服务器时,连接的这个IP就是云服务器地公网IP:
我们连接云服务器时,连接的这个IP地址就是云服务器的公网IP地址。
我们可以通过 ifconfig 命令来查看我们这台机器的私网IP,其中网络接口lo(loop)代表的是本地环回,而eth0代表的就是我这台机器的网络接口,可以看到我的私网IP地址是10.2.20.4
需要注意的是,这里连接云服务器时的IP地址82.157.13.28,是云服务器的公网IP,由于我使用的是腾讯云,因此这里的10.2.20.4是我这个云服务器在腾讯内部的私网IP,可以看到这个IP正好在第一种私网IP范围内
此外,打开Windows当中的cmd窗口,通过ipconfig
命令可以看到以172.20开头的私网IP
在我们的使用生涯中,我们从一开始使用的IP其实都是私有IP,在云服务器中才接触到公网IP
数据是如何发送到服务器的
路由器是连接两个或多个网络的硬件设备,在路由器上有两种网络接口,分别是LAN口和WAN口:
我们将LAN口的IP地址叫做LAN口IP,也叫做子网IP,将WAN口的IP地址叫做WAN口IPO,也叫做外网IP。
我们使用的电脑、家用路由器、运营商路由器、广域网以及我们要访问的服务器之间的关系大致如下:
由于私网IP不能出现在公网当中,因此子网内的主机在和外网进行通信时,路由器会不断将数据包IP首部中的源IP地址替换成路由器的WAN口IP ,这样逐级替换,最终数据包中的源IP地址成为一个公网IP,这种技术成为NAT(Network Address Translation,网络地址转换)。
由于私网IP不能出现在公网当中,因此子网内的主机在和外网进行通信时,路由器会不断将数据包IP首部中的源IP地址替换成路由器的WAN口IP
所以NAT技术主要用来解决IP不足的
子网IP可以当作目的IP,但只有一种情况,就是你访问的目标主机就是在你内网当中
路由器是要进行报文转发的,所以必定至少要连接两种网络,一个是内网,一个是运营商内部网络
家用路由器理解上和运营商的路由器是性质类似的
其实我们要访问一个公网,本质上报文在我的电脑上要先交到家用路由器,然后再转发给运营商路由器,然后再转发给公网上,然后才能访问。如果你家是电信的,邻居家也是电信的。你俩家里的路由器,在访问的时候会访问同一个运营商路由器
我们是怎么上网的?
关于运营商
关于全球网络
为什么私网IP不能出现在公网当中?
主机A要把数据发给主机B,是要先根据目标IP,经过路由完成转发,实际是一跳一跳转发的
IP数据包的传输过程中会遇到很多路由器,这些路由器会帮助数据包进行路由转发,每当数据包遇到一个路由器后,对应路由器都会查看该数据的目的IP地址,并告知该数据下一跳应该往哪跳。
我们可以查看当前主机的路由表:
IP数据包的传输过程中会遇到很多路由器,每当数据包到一个路由器后,路由器会查看该数据的目的IP地址,并告知数据下一跳该往哪跳
当IP数据包到达路由器时,路由器就会用该数据的目的IP地址,依次与路由表中的子网掩码 Genmask进行“按位与”操作,然后将结果与子网掩码对应的目的网络地址Destination(内网的地址)进行比对,如果匹配则说明该数据包下一跳就应该跳去这个子网,此时就会将该数据包通过对应的发送接口Iface发出。
如果将该数据包的目的IP地址与子网掩码进行“按位与”后,没有找到匹配的目的网络地址,此时路由器就会将这个数据包发送到默认路由,也就是路由表中目标网络地址中的default。可以看到默认路由对应的Flags是UG,实际就是将该数据转给了另一台路由器,让该数据在另一台路由器继续进行路由。
数据包不断经过路由器路由后,最终就能到达目标主机所在的目标网络,此时就不再根据该数据包目的IP地址当中的网络号进行路由了,而是根据目的IP地址当中的主机号进行路由,最终根据该数据包对应的主机号就能将数据发送给目标主机了。
查路由表是怎么查的呢?
拿着目标主机的IP地址,按位与&上路由表中的子网掩码,然后和Destination做对比,如果比对不成功,如果不是就直接对比下一个掩码和Destination,如果对比成功,那么表示目标网络正确,就通过eth0把数据发送出去
路由器的查找结果可能有以下三种:
假设某主机上的网络接口配置和路由表如下:
转发过程例1: 如果要发送的数据包的目的地址是192.168.56.3
转发过程例2: 如果要发送的数据包的目的地址是202.10.1.2
实际上,在一台主机中,报文并没有通过网络层直接发出去,而是继续交给了自己的下一次协议(数据链路层,属于网卡的驱动层,还有物理层)数据链路再去转发给路由器或者同一个网段的主机。
但是数据链路层,无法一次发送过大的报文,所以就要求上层不能给我交付过大的报文。(这就是为什么你可以直接发送的数据是64KB,但是你还要用滑动窗口把一段很长的数据,分成一个个的数据段)
ifconfig命令可以查看当前协议栈的一些信息,其中下面红框框的 mtu 表示当前的数据链路层的MAC帧一次最多发送1500字节的数据,这个数据包括IP的报头和IP的有效载荷
但是,如果一个报文超过1500字节,但是数据链路层又不得不发,这时候就会对报文进行分片, 而且既然有分片,那么必定有组装,所以就要求IP报头里包含分片组装的相关信息:
你怎么知道报文分片了呢?
只要我收到了后面的切片部分,那么片偏移一定不为0。如果片偏移为0,我们还有个三位标识符的结束标识。
简单来说,
总结:片偏移 != 0 || 更多分片 == 1,只要符合任意一个条件,就说明这个IP是被分片
如何组装的?
如何知道切片报文是否丢失?
丢失报文有丢失,那么一般是三种情况:1,丢第一个 2,丢中间的 3,丢最后一个
建不建议分片呢?
不建议。因为在IP当中,如果有任意一个分片丢失导致组装失败,那么在TCP看来就相当于整个报文丢失了,会进行全部重发,所以分片可能会增加丢包概率,降低传输效率
但是具体是UDP,TCP说了算,IP是个跑腿的。就要求TCP发送报文不要发送过大的报文了,也就想到了TCP滑动窗口一大块数据为什么分多次发了,那TCP也不知道这个发的报文最大是多少呢?那就和TCP的三次握手又有关系了,握手双方是会交换自己单个发送报文的数据量的大小的...
为什么分片之后每一个都要带上报头?
因为如果不带报头的话,就没有16位标识,3位标志,13位片偏移了,就没办法组装了
例子
假设有一个IP数据包,总长度为4000字节,其中IP报头为20字节,数据部分为3980字节。现在,网络的MTU为1500字节,也就是说,每个传输的分片的总长度不能超过1500字节。那么,每个分片能携带的数据部分最大为:
但是,由于IP分片要求数据部分长度必须是8字节的整数倍(除了最后一个分片),所以实际每个分片中能携带的数据部分应取小于等于1480且是8的倍数的最大值,即1472字节。
因此,原数据3980字节会分成如下3个分片:
分片1
分片2
分片3
这样,在目的地,接收方会根据相同的标识字段(12345)、分片偏移以及MF标志将这些分片重新组装回原来的4000字节的数据包。
我们在面试的时候可能会遇到这样的问题
一般面试官问到网络,几乎都会问:请你帮我解释下,一个HTTP请求从发到服务器,到你最终拿到响应的整个过程
你要谈的话,是不是要从应用层HTTP的request respond,可是这俩都是数据,要交给TCP,交给TCP就会面临可靠性问题,拥塞控制,流量控制等问题,就会面临面向连接的丢包重传的问题,你再想谈,TCP报文再向下就是IP问题,IP问题你可能又涉及到路由问题和分片问题。朋友们,细节你聊的越多,人家面试官才能认识到你是真的听懂了
本文发布于:2025-04-07 11:40:00,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/1743997235584892.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |