《分会场2_曾宇星_使用eBPF和Trace技术诊断Kubernetes下DNS问题_报告PPT.pdf》由会员分享,可在线阅读,更多相关《分会场2_曾宇星_使用eBPF和Trace技术诊断Kubernetes下DNS问题_报告PPT.pdf(39页珍藏版)》请在三个皮匠报告上搜索。
1、使用eBPF和Trace技术诊断Kubernetes下DNS问题第三届 eBPF开发者大会w w w.e b p f t r a v e l.c o m中 国 西 安阿里云 曾宇星第 三 届 e B P F 开 发 者 大 会关于我Technical Expert,Alibaba Cloud Istio&Envoy member,has rich experiences in cloud native fields such as Kubernetes、Networking、Istio、Envoy、Nginx Ingress、CoreDNS,etc.曾宇星第 三 届 e B P F 开 发 者
2、 大 会 为什么DNS 问题难以排查 DNS问题常用排查方式 自动化诊断DNS问题目录为什么DNS问题难以排查 第三届 eBPF开发者大会w w w.e b p f t r a v e l.c o m中 国 西 安第 三 届 e B P F 开 发 者 大 会Kubernetes 下的DNS 解析链路第 三 届 e B P F 开 发 者 大 会Kubernetes 下的DNS 解析链路第 三 届 e B P F 开 发 者 大 会Kubernetes 下的DNS 解析链路复杂度:应用采用不同的语言实现,可能对应不同的DNS Resolver,dns 解析器的行为存在差异 本地的/etc/re
3、solv.conf 配置 IPVS/Iptabels 负载均衡和转发问题 CoreDNS 配置 CoreDNS 和上游DNS Server 间的网络问题第 三 届 e B P F 开 发 者 大 会Kubernetes 下DNS 常见问题应用侧DNS Resolver 的实现缺陷这只是其中一个例子:Musl lib 库的处理DNS 逻辑中,针对出现AAAA有NXDOMAIN时,整个域名都会被认为是无法正常解析的历史原因,不同的解析器不同版本可能存在一些已知问题(历史包袱)第 三 届 e B P F 开 发 者 大 会Kubernetes 下DNS 常见问题节点或者Ipvs、Iptables 问
4、题导致发送端丢包Error log write:operation not permitted第 三 届 e B P F 开 发 者 大 会Kubernetes 下DNS 常见问题IPVS 串流问题https:/ 三 届 e B P F 开 发 者 大 会Kubernetes 下DNS 常见问题 kube-proxy 异常导致ipvs 下对应的CoreDNS server 地址不同步第 三 届 e B P F 开 发 者 大 会Kubernetes 下DNS 常见问题CoreDNS 侧节点丢包第 三 届 e B P F 开 发 者 大 会Kubernetes 下DNS 常见问题CoreDNS
5、和 上游DnsServer 间的网络问题第 三 届 e B P F 开 发 者 大 会Kubernetes 下DNS 常见问题VPC 网络原因(路由、安全组配置等)DNS 问题常用的排查方式第三届 eBPF开发者大会w w w.e b p f t r a v e l.c o m中 国 西 安第 三 届 e B P F 开 发 者 大 会CoreDNS 内置的可观测相关插件插件类别名称Logginglog、dump、debug、dnstapTracingtrace(CoreDNS 内部)Metricsprometheus第 三 届 e B P F 开 发 者 大 会CoreDNS 内置的可观测相
6、关插件插件类别名称Logginglog、dump、debug、dnstapTracingtrace(CoreDNS 内部)Metricsprometheus第 三 届 e B P F 开 发 者 大 会查看CoreDNS 日志-Log Plugin仅提供CoreDNS 侧看到的信息INFO 10.0.3.105:44074-15790 AAAA IN 12fe2448f5b-.udp 75 false 1232 NOERROR qr,rd,ra 161 0.000328346sClient IPQuery IDResponse CodeResponse Duration第 三 届 e B P