[OS/Linux] Linux核心参数:net.core.somaxconn(高并发场景核心参数)
0 序言
- 近期工作在搞压力测试,我负责开发维护的、基于
sring-cloud-gateway
的大数据网关微服务,其底层是基于spring-webflux
-->reactor-netty
-->netty
。 - 在压测过程中(200并发),发现大数据网关屡报ConnectException: finishConnect(..) failed: Connection refused错误。
Caused by: java.net.ConnectException: finishConnect(..) failed: Connection refused
at io.netty.channel.unix.Errors.newConnectException0(Errors.java:155) ~[netty-transport-native-unix-common-4.1.65.Final.jar!/:4.1.65.Final]
at io.netty.channel.unix.Errors.handleConnectErrno(Errors.java:128) ~[netty-transport-native-unix-common-4.1.65.Final.jar!/:4.1.65.Final]
at io.netty.channel.unix.Socket.finishConnect(Socket.java:278) ~[netty-transport-native-unix-common-4.1.65.Final.jar!/:4.1.65.Final]
at io.netty.channel.epoll.AbstractEpollChannel$AbstractEpollUnsafe.doFinishConnect(AbstractEpollChannel.java:710) [netty-transport-native-epoll-4.1.65.Final-linux-x86_64.jar!/:4.1.65.Final]
关键行:
io.netty.channel.unix.Socket.finishConnect(Socket.java:278) ~[netty-transport-native-unix-common-4.1.65.Final.jar!/:4.1.65.Final]
- 经过长时间、大量的分析(Debug spring-cloud-gateway 源码、观测服务所属主机资源),倾向于本微服务所属主机的
net.core.somaxconn
不足这种原因。
博主的做法:
128 --> 1024
1 参数定义
net.core.somaxconn
- Linux 操作系统全局参数,每个
TCP连接
监听端口的队列长度。
somaxconn
- INTEGER
- Limit of socket listen() backlog,在用户空间中称为 SOMAXCONN。
- 默认值为 4096。(在 linux-128.5 之前是 4)
- 另请参阅
tcp_max_syn_backlog
,了解TCP 套接字
的其他调整。
- 在
CentOS/RHEL
7.9 中,默认值为128
,对于高并发场景
都建议调大该值。
- 在RHEL 6和RHEL 7中,socket结构的
sk_max_ack_backlog
字段被定义为无符号短整型,它将值限制为16位,最大值为65535。- 在 RHEL 8 中,socket结构的
sk_max_ack_backlog
字段定义为 u32,它将值限制为 32 位,最大值为 2147483647。
2 查看方法
2.1 Linux
- 方法1
cat /proc/sys/net/core/somaxconn
- 方法2
sysctl -a | grep somaxconn
3 不同应用的配置建议
3.1 Oracle WebLogic Server
- 客户端数:设置
somaxconn
应至少设置为1024
,以 允许大量客户端服务器连接。
排队的数据包数:将
netdev_max_backlog
设置为至少32768
,以最大程度地减少数据包丢失。
3.2 Apache Zookeeper
Configurable listen socket backlog for the client port - issues.apache.org/zookeeper
在 Linux 上,以下参数: net.core.somaxconn
需要大于“客户端端口积压工作”以上才能正确配置侦听套接字积压工作
3.3 TiDB
https://blog.csdn.net/weixin_43700866/articTiDBle/details/125667286
内核参数 - pingcap.com
- 内核参数
检查各项内核参数的值:
…
`net.core.somaxconn: 32768`
3.4 Nginx
将 net.core.somaxconn
内核参数的值从其默认值 (128
) 增加到足以容纳大量流量突发的值。在此示例中,它增加到 4096
sudo sysctl -w net.core.somaxconn=4096
...
3.5 Netty
推荐文献
Caused by: io.netty.channel.ChannelException: Unable to create Channel from class class io.netty.channel.socket.nio.NioSocketChannel
...
优化建议
- 在面对高并发场景下时,应当适当增大
BACKLOG
的值,使端口可以同时建立更多的TCP请求 - 当服务的QPS不高,且服务端进程响应请求的时间较长时,可以适当减小BACKLOG的值,避免大量连接占据
系统内存资源
。 - 在设置
BACKLOG
参数时,还需要记得修改somaxconn
参数,若设置的BACKLOG
参数超过了系统somaxconn
参数的值时,则无法生效。
netty 源码
netty : 4.1.65
- 默认:
ChannelOption.SO_BACKLOG
=io.netty.util.NetUtil#SOMAXCONN
=/proc/sys/net/core/somaxconn
(Windows中默认值:200,Linux中默认值:128)
io.netty.util.NetUtil
SOMAXCONN
https://github.com/netty/netty/issues/4936
/proc/sys/net/core/somaxconn
io.netty.channel.epoll.EpollServerChannelConfig extends EpollChannelConfig implements ServerSocketChannelConfig
private volatile int backlog = NetUtil.SOMAXCONN;
D:/Program_Data/maven_repository/io/netty/netty-common/4.1.65.Final/netty-common-4.1.65.Final-sources.jar!/io/netty/util/NetUtil.java:134
io.netty.util.NetUtil#SOMAXCONN
static {
...
int somaxconn = PlatformDependent.isWindows() ? 200 : 128;
File file = new File("/proc/sys/net/core/somaxconn");
...
}
//io.netty.util.internal.logging.InternalLogger | 如何将 netty 日志开关打开?
如下是:
gateway-service
[Debug 源码分析] 以本地电脑(8 core cpu)在启动后的1次请求调用为例(与 somaxcon 无关,仅是记录;NioEventLoop 取决于 CPU 核数)
io.netty.bootstrap.Bootstrap#config
reactor.netty.resources.DefaultLoopResources#cacheNioServerLoops
D:/Program_Data/maven_repository/io/projectreactor/netty/reactor-netty/0.9.20.RELEASE/reactor-netty-0.9.20.RELEASE-sources.jar!/reactor/netty/resources/DefaultLoopResources.java:195
reactor.netty.resources.DefaultLoopResources#cacheNioServerLoops
watch reactor.netty.resources.DefaultLoopResources cacheNioServerLoops returnObj
io.netty.channel.nio.NioEventLoopGroup
io.netty.channel.nio.NioEventLoop
4 配置方法
4.1.临时生效
sysctl -w net.core.somaxconn=10240
4.2.永久生效
echo "net.core.somaxconn = 10240" >>/etc/sysctl.conf
sysctl -p
X 参考文献
- Linux net.core.somaxconn 参数详解 - CSDN 【推荐】
- Netty-源码学习(1)-BACKLOG参数 - 掘金 【推荐】
- netty client 连接超时设置 - 博客园 【不推荐/因无关】
/**
* *******************************************************************
* 如果不设置超时,连接会一直占用本地线程,端口,连接客户端一多,阻塞在那里,会导致本地端口用尽及CPU压力
*/
bootstrap.option(ChannelOption.CONNECT_TIMEOUT_MILLIS, 5000);
未设置超时:
30
io.netty.channel.ConnectTimeoutException: connection timed out: /192.168.1.1:8866
at io.netty.channel.nio.AbstractNioChannel$AbstractNioUnsafe$1.run(AbstractNioChannel.java:206)
at io.netty.util.concurrent.PromiseTask$RunnableAdapter.call(PromiseTask.java:38)
at io.netty.util.concurrent.ScheduledFutureTask.run(ScheduledFutureTask.java:123)
at io.netty.util.concurrent.SingleThreadEventExecutor.runAllTasks(SingleThreadEventExecutor.java:354)
at io.netty.channel.nio.NioEventLoop.run(NioEventLoop.java:353)
at io.netty.util.concurrent.SingleThreadEventExecutor$2.run(SingleThreadEventExecutor.java:101)
at java.lang.Thread.run(Thread.java:745)
Process finished with exit code 0
设置后:
5
io.netty.channel.ConnectTimeoutException: connection timed out: /192.168.1.1:8866
at io.netty.channel.nio.AbstractNioChannel$AbstractNioUnsafe$1.run(AbstractNioChannel.java:206)
at io.netty.util.concurrent.PromiseTask$RunnableAdapter.call(PromiseTask.java:38)
at io.netty.util.concurrent.ScheduledFutureTask.run(ScheduledFutureTask.java:123)
at io.netty.util.concurrent.SingleThreadEventExecutor.runAllTasks(SingleThreadEventExecutor.java:354)
at io.netty.channel.nio.NioEventLoop.run(NioEventLoop.java:353)
at io.netty.util.concurrent.SingleThreadEventExecutor$2.run(SingleThreadEventExecutor.java:101)
at java.lang.Thread.run(Thread.java:745)
Process finished with exit code 0
本文链接: https://www.cnblogs.com/johnnyzen
关于博文:评论和私信会在第一时间回复,或直接私信我。
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!
日常交流:大数据与软件开发-QQ交流群: 774386015 【入群二维码】参见左下角。您的支持、鼓励是博主技术写作的重要动力!