K8s的网络——Underlay和Overlay网络

2023-09-15 18:30:01

0. 基础知识

1)网络7层基础知识

在网络7层协议基础里,

  • 第一层物理链路;
  • 第二层是数据链路层,在第一层的基础上引入MAC地址做数据转发。MAC地址在局域网内具有唯一性,主机A发送数据时,会向局域网内进行广播,每个主机根据mac地址自动匹配。网桥、交换机都是工作在数据链路层。由MAC地址构建的网络可以叫以太网。在网络中接入设备数据剧增后,要维护一张MAC地址表变得非常巨大,无法得以实施,引出了网络层。
  • 第三层是网络层,IP地址模型。消息传递的时候,先通过IP确定两台主机是不是在同一个子网,如果在同一个子网,就直接交给交换机通过MAC地址通信;如果不是同一个子网,则将报文发送网关地址。发送给网关前,会通过ARP协议获取网关的MAC地址,主机根据MAC封装以太帧发送。
  • IP数据包经过路由器后,一般是不会修改IP的(除非NAT转换),但是MAC地址会发生变化。 每经过一个路由器,MAC发生一次变化。

2)多台主机公用一个公网IP是怎么定位的

一台主机发送信息时,网关有一套路由规则将目标IP解析到一个端口中,当源IP要出局域网时,要通过NAT协议转换为公网IP,到达目的网关时,目的网关通过NAT将目标IP变成当前局域网IP。

3)LAN,VLAN和VXLAN

  • LAN 表示 Local Area Network,本地局域网。一个 LAN 中的所有成员都会收到任意一个成员发出的广播包。LAN变大后,同步广播信息会造成链路冲突堵塞,所以交换机将大的LAN切分成多个小的逻辑LAN。
  • VLAN(Virtual Local Area Network)即虚拟局域网,是将一个物理的LAN在逻辑上划分成多个广播域的通信技术。每个VLAN是一个广播域,VLAN内的主机间可以直接通信,而VLAN间则不能直接互通。交换机用于实现VLAN;每个交换机端口都分配有一个VLAN。
  • VXLAN(Virtual eXtensible Local Area Network,虚拟扩展局域网),本质上是一种隧道技术,在源网络设备与目的网络设备之间的IP网络上,建立一条逻辑隧道,将用户侧报文经过特定的封装后通过这条隧道转发。
  • 为什么要VXLAN:
    • 突破VLAN ID数量限制。

    • 突破TOR交换机MAC地址表限制:之前TOR(Top Of Rack)交换机的一个端口连接一个物理主机对应一个MAC地址,但现在交换机的一个端口虽然还是连接一个物理主机但是可能进而连接几十个甚至上百个虚拟机和相应数量的MAC地址。

    • 突破单条网络链路。VxLAN通过UDP封装,在三层网络上传输,可以利用一些基于三层的协议来实现多条线路共同工作(active-active),以实现负载均衡,例如ECMP,LACP。

4)网桥

网桥也叫桥接器,是连接两个局域网的一种存储/转发设备,它能将一个大的LAN分割为多个网段,或将两个以上的LAN互联为一个逻辑LAN,使LAN上的所有用户都可访问服务器。

当使用网桥连接两段LAN时,网桥对来自网段1的MAC 帧,首先要检查其终点地址。如果该帧是发往网段1 上某一站的,网桥则不将帧转发到网段2 ,而将其滤除;如果该帧是发往网段2 上某一站的,网桥则将它转发到网段2。

网桥的缺点:

  • 网桥对接收的帧要先存储和查找站表,然后转发,这就增加了时延
  • 网络上负荷很重时,可能因网桥缓冲区存储空间不够而发生溢出,以致产生帧丢失的现象。
  • 具有不同MAC子层的网段桥接在一起时,网桥在转发一个帧之前,必须修改帧的某些字段的内容,以适合另一个MAC子层的要求,增加时延
  • 网桥只适合于用户数不太多(不超过几百个)和信息量不太大的局域网,否则有时会产生较大的广播风暴

1.Underlay网络

underlay网络是底层物理网络,负责网络之间的数据包传递。

在underlay网络中,各个设备之间必须通过路由协议来保证IP之间的连接性。underlay网络可以是2层,也可以是三层网络。2层网络通常应用于以太网,通过VLAN进行划分。三层网络在同一个自治域使用OSPF、IS-IS等协议进行路由控制,各个域之间采用BGP等协议做路由传递和互联。

underlay在一个较好的可用环境网络场景下适用,也有一些问题:

  • 由于硬件根据目的IP进行转发,传输路径依赖是非严重;
  • 新增或变更网络,重新配置十分耗时;
  • 网络切片和分段实现负载,无法做到网络资源按需分配;
  • 多路径转发依赖路由,无法融合多个底层网络来实现负载;

2.Overlay网络

为了摆脱underlay网络的限制,采用网络虚拟化技术,在underlay网络上构建虚拟的overlay网络。

互相连接的overlay网络设备之间建立隧道,数据包传输出去时,设备为数据包添加新的IP头好隧道头部,并且屏蔽掉内层IP头部,数据包根据新的IP头部进行转发。当数据包到达目的设备后,外部的IP都和隧道头被丢弃,恢复出原始的数据包。

overlay网络协议标准包括:VXLAN,NVGRE,SST,NVO3,EVPN等。

对比项

Underlay网络

Overlay网络

数据传输

通过网络设备例如路由器、交换机进行传输

沿着节点间的虚拟链路进行传输

包封装和开销

发生在网络的二层和三层

需要跨源和目的封装数据包,产生额外的开销

报文控制

面向硬件

面向软件

部署时间

上线新服务涉及大量配置,耗时多

只需更改虚拟网络中的拓扑结构,可快速部署

多路径转发

因为可扩展性低,所以需要使用多路径转发,而这会产生更多的开销和网络复杂度

支持虚拟网络内的多路径转发

扩展性

底层网络一旦搭建好,新增设备较为困难,可扩展性差

扩展性强,例如VLAN最多可支持4096个标识符,而VXLAN则提供多达1600万个标识符

协议

以太网交换、VLAN、路由协议(OSPF、IS-IS、BGP等)

VXLAN、NVGRE、SST、GRE、NVO3、EVPN

多租户管理

需要使用基于NAT或者VRF的隔离,这在大型网络中是个巨大的挑战

能够管理多个租户之间的重叠IP地址

overlay网络的缺点:

  • 性能问题:Overlay网络使用VXLAN协议实现跨主机通信,会增加数据包的传输延迟,对网络性能有一定影响。
  • 配置复杂:Overlay网络的配置比较复杂,需要进行多个配置步骤。
  • 容易出错:由于Overlay网络的配置比较复杂。

3. docker 构建overlay网络

  1. TCP 端口 2377,用来集群管理相关的通信;
  2. TCP 和 UDP 端口 7946,用来进行节点之间的通信;
  3. UDP 端口 4789,用来进行进行 overlay 网络上的数据传输。

-- 在主节点初始化docker swarm

docker swarm init

-- 在从节点加入swarm集群

    docker swarm join --token SWMTKN-1-3e3cne19my7mcmtv8u3v74j0pvyqbyk0yt2rzp48rozftoobh3-0h0pbf3bxxkqeqk9axfqetfux 172.30.171.123:2377

-- 在任意节点查看swarm

docker info

-- 在主节点创建一个overlay网络

docker network create overlaynet1 --driver overlay --subnet 172.45.0.0/16 --gateway 172.45.0.1

-- 查看swarm群节点

docker node ls

如果创建swarm集群服务,没有指定网络,将会默认连接到ingress网络。建议可以为每个系统的工作应用单独创建overlay网络。

-- 创建docker容器服务测试

docker service create -t --replicas 2 --network overlaynet1 --name alpine-overlay2 alpine:latest

-- 在主节点可以查看

-- 在从节点,可以看到有容器启动起来

-- 删除服务和删除网络

docker service rm my-nginx

docker network rm nginx-net

4. K8s的网络通信模式

1)overlay 网络&underlay 网络

  • overlay网络
    • flannel vxlan, calico bgp, calico vxlan
    • 将pod地址信息封装在宿主机地址信息内,可以实现跨node子网通信。
  • underlay网络
    • calico 
    • 为pod启动单独的虚拟机网络,透传给宿主机的物理网络。

2)K8s网络组件

  • flannel 组件
    • flannel的基本原理是:借助etcd维护网络IP地址分配,为每一个pod分配一个不同的IP,容器之间网络通过隧道进行通信。
    • Cni0网桥设备,每创建一个pod都会创建一对veth pair,其中一端是pod的eth0,另一端是网桥中的网卡端口。

  • Calico
    • Calico 是一个用于容器、虚拟机和主机的纯三层开源网络组建,使用BGP协议。
    •  IPIP模式:是一种隧道协议,也是一种overlay网络;
    • BGP模式:是一种路由协议,通过在每个节点运行BGP代理来实现容器间的通信。

3)为什么需要overlay网络

当前,越来越多的任务是跑在虚拟机上,而虚拟机会发生迁移(从一台物理服务器迁移到另一台),为保障业务不中断,要求虚拟机迁移过程后IP地址保持不变,但实际底层的物理链路可能已发生变化,需要overlay网络和集群虚拟机构建大二层网络。

5. K8s pod的网络抓包

1)网络基础知识

在Linux中,网络命名空间是独立的、隔离的逻辑空间;可通过lsns查看命名空间

集群中的每个 pod 都有一个在后台运行的隐藏容器,被称为 pause,负责创建和维持网络命名空间。

  • 创建pod时,CNI会创建一个带有pause容器的网络命名空间;
  • pod中所有的容器都会加入到创建的网络命名空间中
  • CNI分配IP地址并将容器连接到网络

2)k8s的pod网络原则

  • 集群中的pod都能与任何其他pod通信,无需使用网络地址转换;
  • 集群节点上运行的任意程序都与同一节点上的任意pod通信
  • 每个pod都有自己的IP地址。

2) 网络基础

深入理解lan、vlan、vxlan《OpenStack 网络》-阿里云开发者社区

百度百科-验证

什么是Overlay网络? Overlay网络 vs Underlay网络 - 华为

k8s 小记 - 网络_莫测之境的技术博客_51CTO博客

更多推荐

Elasticsearch 8.10 中引入查询规则 - query rules

作者:KathleenDeRusso我们很高兴宣布Elasticsearch8.10中的查询规则!查询规则(queryrules)允许你根据正在搜索的查询词或根据作为搜索查询的一部分提供的上下文信息来更改查询。什么是查询规则?查询规则(queryrules)允许自定义搜索相关性之外的搜索结果,这可以根据您提供的上下文信

Jmeter——结合Allure展示测试报告

在平时用jmeter做测试时,生成报告的模板,不是特别好。大家应该也知道allure报告,页面美观。先来看效果图,报告首页,如下所示:报告详情信息,如下所示:运行run.py文件,运行成功,如下所示:接下来来看下实现过程。安装allureallure是开源的,直接到github上下载即可。就不细说了。需要注意的是,环境

Windows 10 + Jenkins 2.4 安装插件时https 的证书问题及解决

本篇面临与解决的问题本篇是在Windows10中安装Jenkins2.414.1,在安装完成之后安装一些需要的插件,可以在浏览器端安装插件的时候,总是不成功,控制台报以下错误:SEVEREh.model.UpdateCenter$DownloadJob#run:Failedtoinstallantisamy-marku

1. PCIE基础入门知识

GT/s是"每秒十亿次传输"时间版本速率2003Pcie1.02.5GT/s2006PCIE2.05GT/s2010PCIE3.08GT/s2017PCIE4.016GT/s高速接口:雷电接口(PCIEx4接口)PCIE接口工作模式:Endpoint和RootPort。Endpoint(终端)指的是PCIe总线中的最终

vue框架实现表情打分效果

本来今天要实现这个功能但是在网上查了一下就csdn上有一个符合要求的但是他竟然收费,痛心疾首啊太伤白嫖党的心的所以我手写了一个这个类似功能的代码希望能帮到有这个需求的同学们技术栈是VUE3用其他技术栈的也可以看因为逻辑很简单都一样的//问卷的虚拟数据constdataInfoList=ref([{id:'0',labe

SkyWalking快速上手(六)——告警

文章目录前言一、什么是SkyWalking的告警功能二、为什么要使用SkyWalking的告警功能1.及时发现异常情况2.提高故障处理效率3.避免数据丢失和损坏4.提升系统性能和稳定性三、如何使用SkyWalking的告警功能1.告警规则2.告警通知3.告警持续时间四、注意事项1、合理设置告警规则和阈值1.1.确定监控

MongoDB的搭建 和crud操作

MongoDBdocker下载dockerrun--restart=always-d--namemongo-v/docker/mongodb/data:/data/db-p27017:27017mongo:4.0.6使用navcat工具使用MongoDBCrud操作jar包<dependency><groupId>or

notepad++配合正则表达式分组模式处理文本转化为sql语句

一、正则分组知识点补充正则分组和捕获():用于分组和捕获子表达式。大白话就是()匹配到的数据,通过美元符号加下标可以获取该数据,例如$1、$2,下标从1开始。下面的案例就采用该模式处理文本数据二、使用正则的需求背景有一份报表的数据,需要把数据入库到mysql数据库,因为数据很多,不可能手动一个一个转,这里采用正则表达式

Python基础

Python简介1.Python是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。2.Python的设计具有很强的可读性,相比其他语言经常使用英文关键字,其他语言的一些标点符号,它具有比其他语言更有特色语法结构。Python是一种解释型语言:这意味着开发过程中没有了编译这个环节。类似于PHP和Perl语言

【绝㊙️】三年开发内功心得

经典嵌套if-else问题这个也是老生常谈问题了,不管哪里都能看到。那如何解决方法一(重要):如果逻辑分支过多,即使你不解决嵌套if-slse,至少也要把每个if的{}里的逻辑抽到一个独立的方法或者工具类或者策略模式类,保证{}里只有一行或者简单几行代码,保证住流程的清晰,比如:Obejctdata=null;if(n

2022年统计用区划代码表SQL 01

行政区划代码为国家公布的六位县级以上行政区划代码行政区编码的用途:APP里做城市级联选择根据身份证前六位获取用户所在城市区县370786昌邑市370800济宁市370811任城区370812兖州区百度高德等接口通常都会返回adcode字段(行政区编码)根据行政区编码可以查询天气数据例如请求天气API接口,传参adcod

热文推荐