热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

dellr730安装Gp后万兆网卡有rxerror

设备配置及操作系统cpu:英特尔至强E5-2640V3处理器2.6GHz8核2颗mem:8G,DDR4-2133RDIMM,32条,共256G硬

设备配置及操作系统

cpu:英特尔至强E5-2640V3处理器 2.6GHz 8核 2颗
mem:8G,DDR4-2133 RDIMM,32条,共256G
硬盘1:1.2T,万转sas做数据盘,24块
硬盘2:600G,万转sas做系统盘,2块
RAID卡:2G缓存
网卡:2*10GE(SFP+),原厂的
操作系统:suse11sp4
Linux hebda_data_33 3.0.101-77-default #1 SMP Tue Jun 14 20:33:58 UTC 2016 (a082ea6) x86_64 x86_64 x86_64 GNU/Linux
上联交换机:华为12812
网卡信息:



1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
ethtool -i p4p2

driver: bnx2x

version: 1.710.51-0

firmware-version: FFV08.07.25 bc 7.13.54

bus-info: 0000:83:00.1

supports-statistics: yes

supports-test: yes

supports-eeprom-access: yes

supports-register-dump: yes

hebda_data_33:~ # ethtool -i em1

driver: bnx2x

version: 1.710.51-0

firmware-version: FFV08.07.25 bc 7.13.54

bus-info: 0000:01:00.0

supports-statistics: yes

supports-test: yes

supports-eeprom-access: yes

supports-register-dump: yes



hebda_data_33:~ # lspci -s 0000:83:00.1 -vvv

83:00.1 Ethernet controller: Broadcom Corporation NetXtreme II BCM57810 10 Gigabit Ethernet (rev 10)

        Subsystem: Broadcom Corporation Device 1006

        Control: I/O- Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- SERR- FastB2B- DisINTx+

        Status: Cap+ 66MHz- UDF- FastB2B- ParErr- DEVSEL=fast >TAbort- SERR-
        Latency: 0

        Interrupt: pin B routed to IRQ 60

        Region 0: Memory at c8000000 (64-bit, prefetchable) [size=8M]

        Region 2: Memory at c8800000 (64-bit, prefetchable) [size=8M]

        Region 4: Memory at ca000000 (64-bit, prefetchable) [size=64K]

        Expansion ROM at ca500000 [disabled] [size=512K]

        Capabilities: [48] Power Management version 3

                Flags: PMEClk- DSI- D1- D2- AuxCurrent=0mA PME(D0+,D1-,D2-,D3hot+,D3cold+)

                Status: D0 NoSoftRst+ PME-Enable- DSel=0 DScale=1 PME-

        Capabilities: [50] Vital Product Data

                Not readable

        Capabilities: [58] MSI: Enable- Count=1/8 Maskable- 64bit+

                Address: 0000000000000000  Data: 0000

        Capabilities: [a0] MSI-X: Enable+ Count=32 Masked-

                Vector table: BAR=4 offset=00000000

                PBA: BAR=4 offset=00001000

        Capabilities: [ac] Express (v2) Endpoint, MSI 00

                DevCap: MaxPayload 512 bytes, PhantFunc 0, Latency L0s <4us, L1 <64us

                        ExtTag+ AttnBtn- AttnInd- PwrInd- RBE+ FLReset-

                DevCtl: Report errors: Correctable- Non-Fatal+ Fatal+ Unsupported+

                        RlxdOrd+ ExtTag+ PhantFunc- AuxPwr+ NoSnoop+

                        MaxPayload 256 bytes, MaxReadReq 4096 bytes

                DevSta: CorrErr+ UncorrErr- FatalErr- UnsuppReq+ AuxPwr+ TransPend-

                LnkCap: Port #0, Speed 5GT/s, Width x8, ASPM L0s L1, Latency L0 <1us, L1 <2us

                        ClockPM+ Surprise- LLActRep- BwNot-

                LnkCtl: ASPM Disabled; RCB 64 bytes Disabled- Retrain- CommClk+

                        ExtSynch- ClockPM- AutWidDis- BWInt- AutBWInt-

                LnkSta: Speed 5GT/s, Width x8, TrErr- Train- SlotClk+ DLActive- BWMgmt- ABWMgmt-

                DevCap2: Completion Timeout: Range ABCD, TimeoutDis+

                DevCtl2: Completion Timeout: 65ms to 210ms, TimeoutDis-

                LnkCtl2: Target Link Speed: 2.5GT/s, EnterCompliance- SpeedDis-, Selectable De-emphasis: -6dB

                         Transmit Margin: Normal Operating Range, EnterModifiedCompliance- ComplianceSOS-

                         Compliance De-emphasis: -6dB

                LnkSta2: Current De-emphasis Level: -6dB, EqualizationComplete-, EqualizationPhase1-

                         EqualizationPhase2-, EqualizationPhase3-, LinkEqualizationRequest-

        Capabilities: [100 v1] Advanced Error Reporting

                UESta:  DLP- SDES- TLP- FCP- CmpltTO- CmpltAbrt- UnxCmplt- RxOF- MalfTLP- ECRC- UnsupReq- ACSViol-

                UEMsk:  DLP- SDES- TLP- FCP- CmpltTO- CmpltAbrt+ UnxCmplt+ RxOF- MalfTLP- ECRC- UnsupReq- ACSViol-

                UESvrt: DLP+ SDES+ TLP+ FCP+ CmpltTO+ CmpltAbrt- UnxCmplt- RxOF+ MalfTLP+ ECRC+ UnsupReq- ACSViol-

                CESta:  RxErr- BadTLP- BadDLLP- Rollover- Timeout- NonFatalErr+

                CEMsk:  RxErr- BadTLP+ BadDLLP+ Rollover+ Timeout+ NonFatalErr+

                AERCap: First Error Pointer: 00, GenCap+ CGenEn+ ChkCap+ ChkEn+

        Capabilities: [13c v1] Device Serial Number f4-e9-d4-ff-fe-9d-ba-10

        Capabilities: [150 v1] Power Budgeting

        Capabilities: [160 v1] Virtual Channel

                Caps:   LPEVC=0 RefClk=100ns PATEntryBits=1

                Arb:    Fixed- WRR32- WRR64- WRR128-

                Ctrl:   ArbSelect=Fixed

                Status: InProgress-

                VC0:    Caps:   PATOffset=00 MaxTimeSlots=1 RejSnoopTrans-

                        Arb:    Fixed- WRR32- WRR64- WRR128- TWRR128- WRR256-

                        Ctrl:   Enable+ ID=0 ArbSelect=Fixed TC/VC=ff

                        Status: NegoPending- InProgress-

        Capabilities: [1b8 v1] Alternative Routing-ID Interpretation (ARI)

                ARICap: MFVC- ACS-, Next Function: 0

                ARICtl: MFVC- ACS-, Function Group: 0

        Capabilities: [220 v1] #15

        Kernel driver in use: bnx2x

        Kernel modules: bnx2x



hebda_data_33:~ # lspci -s 0000:01:00.0 -vvv

01:00.0 Ethernet controller: Broadcom Corporation NetXtreme II BCM57800 1/10 Gigabit Ethernet (rev 10)

        Subsystem: Dell BCM57800 10-Gigabit Ethernet

        Control: I/O- Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- SERR- FastB2B- DisINTx+

        Status: Cap+ 66MHz- UDF- FastB2B- ParErr- DEVSEL=fast >TAbort- SERR-
        Latency: 0

        Interrupt: pin A routed to IRQ 40

        Region 0: Memory at 95000000 (64-bit, prefetchable) [size=8M]

        Region 2: Memory at 95800000 (64-bit, prefetchable) [size=8M]

        Region 4: Memory at 96030000 (64-bit, prefetchable) [size=64K]

        Expansion ROM at 96080000 [disabled] [size=512K]

        Capabilities: [48] Power Management version 3

                Flags: PMEClk- DSI- D1- D2- AuxCurrent=0mA PME(D0+,D1-,D2-,D3hot+,D3cold+)

                Status: D0 NoSoftRst+ PME-Enable- DSel=8 DScale=1 PME-

        Capabilities: [50] Vital Product Data

                Not readable

        Capabilities: [58] MSI: Enable- Count=1/8 Maskable- 64bit+

                Address: 0000000000000000  Data: 0000

        Capabilities: [a0] MSI-X: Enable+ Count=32 Masked-

                Vector table: BAR=4 offset=00000000

                PBA: BAR=4 offset=00001000

        Capabilities: [ac] Express (v2) Endpoint, MSI 00

                DevCap: MaxPayload 512 bytes, PhantFunc 0, Latency L0s <4us, L1 <64us

                        ExtTag+ AttnBtn- AttnInd- PwrInd- RBE+ FLReset-

                DevCtl: Report errors: Correctable- Non-Fatal+ Fatal+ Unsupported+

                        RlxdOrd+ ExtTag+ PhantFunc- AuxPwr+ NoSnoop+

                        MaxPayload 256 bytes, MaxReadReq 4096 bytes

                DevSta: CorrErr+ UncorrErr- FatalErr- UnsuppReq+ AuxPwr+ TransPend-

                LnkCap: Port #0, Speed 5GT/s, Width x8, ASPM L0s L1, Latency L0 <1us, L1 <2us

                        ClockPM+ Surprise- LLActRep- BwNot-

                LnkCtl: ASPM Disabled; RCB 64 bytes Disabled- Retrain- CommClk+

                        ExtSynch- ClockPM- AutWidDis- BWInt- AutBWInt-

                LnkSta: Speed 5GT/s, Width x8, TrErr- Train- SlotClk+ DLActive- BWMgmt- ABWMgmt-

                DevCap2: Completion Timeout: Range ABCD, TimeoutDis+

                DevCtl2: Completion Timeout: 65ms to 210ms, TimeoutDis-

                LnkCtl2: Target Link Speed: 2.5GT/s, EnterCompliance- SpeedDis-, Selectable De-emphasis: -6dB

                         Transmit Margin: Normal Operating Range, EnterModifiedCompliance- ComplianceSOS-

                         Compliance De-emphasis: -6dB

                LnkSta2: Current De-emphasis Level: -6dB, EqualizationComplete-, EqualizationPhase1-

                         EqualizationPhase2-, EqualizationPhase3-, LinkEqualizationRequest-

        Capabilities: [100 v1] Advanced Error Reporting

                UESta:  DLP- SDES- TLP- FCP- CmpltTO- CmpltAbrt- UnxCmplt- RxOF- MalfTLP- ECRC- UnsupReq- ACSViol-

                UEMsk:  DLP- SDES- TLP- FCP- CmpltTO- CmpltAbrt+ UnxCmplt+ RxOF- MalfTLP- ECRC- UnsupReq- ACSViol-

                UESvrt: DLP+ SDES+ TLP+ FCP+ CmpltTO+ CmpltAbrt- UnxCmplt- RxOF+ MalfTLP+ ECRC+ UnsupReq- ACSViol-

                CESta:  RxErr- BadTLP- BadDLLP- Rollover- Timeout- NonFatalErr+

                CEMsk:  RxErr- BadTLP+ BadDLLP+ Rollover+ Timeout+ NonFatalErr+

                AERCap: First Error Pointer: 00, GenCap+ CGenEn+ ChkCap+ ChkEn+

        Capabilities: [13c v1] Device Serial Number 18-66-da-ff-fe-65-77-0b

        Capabilities: [150 v1] Power Budgeting

        Capabilities: [160 v1] Virtual Channel

                Caps:   LPEVC=0 RefClk=100ns PATEntryBits=1

                Arb:    Fixed- WRR32- WRR64- WRR128-

                Ctrl:   ArbSelect=Fixed

                Status: InProgress-

                VC0:    Caps:   PATOffset=00 MaxTimeSlots=1 RejSnoopTrans-

                        Arb:    Fixed- WRR32- WRR64- WRR128- TWRR128- WRR256-

                        Ctrl:   Enable+ ID=0 ArbSelect=Fixed TC/VC=ff

                        Status: NegoPending- InProgress-

        Capabilities: [1b8 v1] Alternative Routing-ID Interpretation (ARI)

                ARICap: MFVC- ACS-, Next Function: 1

                ARICtl: MFVC- ACS-, Function Group: 0

        Capabilities: [220 v1] #15

        Capabilities: [300 v1] #19

        Kernel driver in use: bnx2x

        Kernel modules: bnx2x



hebda_data_33:~ # ethtool -S p4p2|grep dis

     [0]: rx_discards: 79516

     [0]: rx_phy_ip_err_discards: 0

     [0]: rx_skb_alloc_discard: 28517

     [1]: rx_discards: 88484

     [1]: rx_phy_ip_err_discards: 0

     [1]: rx_skb_alloc_discard: 27102

     [2]: rx_discards: 13667973

     [2]: rx_phy_ip_err_discards: 0

     [2]: rx_skb_alloc_discard: 35207

     [3]: rx_discards: 33056205

     [3]: rx_phy_ip_err_discards: 0

     [3]: rx_skb_alloc_discard: 33533

     [4]: rx_discards: 13263091

     [4]: rx_phy_ip_err_discards: 0

     [4]: rx_skb_alloc_discard: 34748

     [5]: rx_discards: 7583294

     [5]: rx_phy_ip_err_discards: 0

     [5]: rx_skb_alloc_discard: 32756

     [6]: rx_discards: 3703892

     [6]: rx_phy_ip_err_discards: 0

     [6]: rx_skb_alloc_discard: 28380

     [7]: rx_discards: 31746726

     [7]: rx_phy_ip_err_discards: 0

     [7]: rx_skb_alloc_discard: 32609

     rx_discards: 103189181

     rx_mf_tag_discard: 0

     rx_brb_discard: 90068

     rx_phy_ip_err_discards: 0

     rx_skb_alloc_discard: 252852

 没有其它错误

hebda_data_23:~ # for i in `seq 1 10`; do ifconfig p4p2 | grep RX | grep overruns; sleep 1; done

          RX packets:253639505018 errors:305619311 dropped:0 overruns:305375168 frame:244143

          RX packets:253639552428 errors:305619311 dropped:0 overruns:305375168 frame:244143

          RX packets:253639566818 errors:305619311 dropped:0 overruns:305375168 frame:244143

          RX packets:253639585722 errors:305619311 dropped:0 overruns:305375168 frame:244143

          RX packets:253639597202 errors:305619311 dropped:0 overruns:305375168 frame:244143

          RX packets:253639610209 errors:305619311 dropped:0 overruns:305375168 frame:244143

          RX packets:253639622800 errors:305619311 dropped:0 overruns:305375168 frame:244143

          RX packets:253639642350 errors:305620450 dropped:0 overruns:305376307 frame:244143

          RX packets:253639675509 errors:305620450 dropped:0 overruns:305376307 frame:244143

          RX packets:253639723772 errors:305620471 dropped:0 overruns:305376328 frame:244143

hebda_data_23:~ # for i in `seq 1 10`; do ifconfig p4p2 | grep RX | grep overruns; sleep 1; done

          RX packets:253639788669 errors:305620773 dropped:0 overruns:305376630 frame:244143

          RX packets:253639812355 errors:305621201 dropped:0 overruns:305377058 frame:244143

          RX packets:253639834600 errors:305621201 dropped:0 overruns:305377058 frame:244143

          RX packets:253639892990 errors:305621455 dropped:0 overruns:305377312 frame:244143

          RX packets:253639913026 errors:305621455 dropped:0 overruns:305377312 frame:244143

          RX packets:253639919136 errors:305621455 dropped:0 overruns:305377312 frame:244143

          RX packets:253639935095 errors:305622380 dropped:0 overruns:305378237 frame:244143

          RX packets:253639954560 errors:305623012 dropped:0 overruns:305378869 frame:244143

          RX packets:253639961150 errors:305623012 dropped:0 overruns:305378869 frame:244143

          RX packets:253639971680 errors:305623012 dropped:0 overruns:305378869 frame:244143


业务配置

Gp DB 4.3

问题描述

安装应用后网卡的使用情况如下图:
但是在高峰时通过nagios会发现整个集群每个节点都报下面的错误,裸跑的时候也有类似的报错,但是没有来得及抓网卡的包:



1
2
3
Interface 11

Active checks of the service have been disabled - only passive checks are being accepted    Perform Extra Service Actions

CRITICAL    09-20-2016 10:47:51    0d 0h 11m 46s    1/1    CRIT - [p4p2] (up) MAC: f4:e9:d4:9d:cb:92, 10.00 Gbit/s, in: 262.67 MB/s, in-errors: 0.16%(!!) >= 0.1, out: 237.76 MB/s

实际使用的命令是:

1
2
echo '<<>>'

sed 1,2d /proc/net/dev

整体上来看,errors在0.1%-0.6%之间,极少的能达到1%,当时的流量也从20M-200MB左右不等。

  1. 第一个问题是:这是不是问题?我个人感觉应该是,所以个人花了精力来处理,各位大神意见?


  2. 第一个问题是:如何解决?我有一点思路,请大神拍一下。
    看了网上大家写的,怀疑问题是在rx errors,而且我看overrun比较多,是否不是ring_buffer的问题,而是中断的问题?



   



推荐阅读
  • x86 linux的进程调度,x86体系结构下Linux2.6.26的进程调度和切换
    进程调度相关数据结构task_structtask_struct是进程在内核中对应的数据结构,它标识了进程的状态等各项信息。其中有一项thread_struct结构的 ... [详细]
  • 嵌入式处理器的架构与内核发展历程
    本文主要介绍了嵌入式处理器的架构与内核发展历程,包括不同架构的指令集的变化,以及内核的流水线和结构。通过对ARM架构的分析,可以更好地理解嵌入式处理器的架构与内核的关系。 ... [详细]
  • 网卡工作原理及网络知识分享
    本文介绍了网卡的工作原理,包括CSMA/CD、ARP欺骗等网络知识。网卡是负责整台计算机的网络通信,没有它,计算机将成为信息孤岛。文章通过一个对话的形式,生动形象地讲述了网卡的工作原理,并介绍了集线器Hub时代的网络构成。对于想学习网络知识的读者来说,本文是一篇不错的参考资料。 ... [详细]
  • 本文概述了JNI的原理以及常用方法。JNI提供了一种Java字节码调用C/C++的解决方案,但引用类型不能直接在Native层使用,需要进行类型转化。多维数组(包括二维数组)都是引用类型,需要使用jobjectArray类型来存取其值。此外,由于Java支持函数重载,根据函数名无法找到对应的JNI函数,因此介绍了JNI函数签名信息的解决方案。 ... [详细]
  • 通过Anaconda安装tensorflow,并安装运行spyder编译器的完整教程
    本文提供了一个完整的教程,介绍了如何通过Anaconda安装tensorflow,并安装运行spyder编译器。文章详细介绍了安装Anaconda、创建tensorflow环境、安装GPU版本tensorflow、安装和运行Spyder编译器以及安装OpenCV等步骤。该教程适用于Windows 8操作系统,并提供了相关的网址供参考。通过本教程,读者可以轻松地安装和配置tensorflow环境,以及运行spyder编译器进行开发。 ... [详细]
  • 达人评测 酷睿i5 12450h和锐龙r7 5800h选哪个好 i512450h和r75800h对比
    本文介绍了达人评测酷睿i5 12450h和锐龙r7 5800h选哪个好的相关知识,包括两者的基本配置和重要考虑点。希望对你在选择时提供一定的参考价值。 ... [详细]
  • Android自定义控件绘图篇之Paint函数大汇总
    本文介绍了Android自定义控件绘图篇中的Paint函数大汇总,包括重置画笔、设置颜色、设置透明度、设置样式、设置宽度、设置抗锯齿等功能。通过学习这些函数,可以更好地掌握Paint的用法。 ... [详细]
  • Todayatworksomeonetriedtoconvincemethat:今天在工作中有人试图说服我:{$obj->getTableInfo()}isfine ... [详细]
  • 篇首语:本文由编程笔记#小编为大家整理,主要介绍了软件测试知识点之数据库压力测试方法小结相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 上图是InnoDB存储引擎的结构。1、缓冲池InnoDB存储引擎是基于磁盘存储的,并将其中的记录按照页的方式进行管理。因此可以看作是基于磁盘的数据库系统。在数据库系统中,由于CPU速度 ... [详细]
  • 【重识云原生】第四章云网络4.8.3.2节——Open vSwitch工作原理详解
    2OpenvSwitch架构2.1OVS整体架构ovs-vswitchd:守护程序,实现交换功能,和Linux内核兼容模块一起,实现基于流的交换flow-basedswitchin ... [详细]
  • PeopleSoft安装镜像版本及导入语言包的方法
    本文介绍了PeopleSoft安装镜像的两个版本,分别是VirtualBox虚拟机版本和NativeOS版本,并详细说明了导入语言包的方法。对于Windows版本,可以通过psdmt.exe登录进入,并使用datamover脚本导入语言包。对于Linux版本,同样可以使用命令行方式执行datamover脚本导入语言包。导入语言包后,可以实现多种语言的登录。参考文献提供了相关链接以供深入了解。 ... [详细]
  • 本文详细介绍了在Linux虚拟化部署中进行VLAN配置的方法。首先要确认Linux系统内核是否已经支持VLAN功能,然后配置物理网卡、子网卡和虚拟VLAN网卡的关系。接着介绍了在Linux配置VLAN Trunk的步骤,包括将物理网卡添加到VLAN、检查添加的VLAN虚拟网卡信息以及重启网络服务等。最后,通过验证连通性来确认配置是否成功。 ... [详细]
  • 如何使用PLEX播放组播、抓取信号源以及设置路由器
    本文介绍了如何使用PLEX播放组播、抓取信号源以及设置路由器。通过使用xTeve软件和M3U源,用户可以在PLEX上实现直播功能,并且可以自动匹配EPG信息和定时录制节目。同时,本文还提供了从华为itv盒子提取组播地址的方法以及如何在ASUS固件路由器上设置IPTV。在使用PLEX之前,建议先使用VLC测试是否可以正常播放UDPXY转发的iptv流。最后,本文还介绍了docker版xTeve的设置方法。 ... [详细]
  • PatchODAX8: ... [详细]
author-avatar
手机用户2502880821
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有