2019独角兽企业重金招聘Python工程师标准>>>
最近在看一些dbcp的相关内容,顺便做一下记录,免得自己给忘记了。
1. 引入dbcp (选择1.4)
Java代码
-
com.alibaba.external -
jakarta.commons.dbcp -
1.4
2. dbcp的基本配置
相关配置说明:
- initialSize :连接池启动时创建的初始化连接数量(默认值为0)
- maxActive :连接池中可同时连接的最大的连接数(默认值为8,调整为20,高峰单机器在20并发左右,自己根据应用场景定)
- maxIdle:连接池中最大的空闲的连接数,超过的空闲连接将被释放,如果设置为负数表示不限制(默认为8个,maxIdle不能设置太小,因为假如在高负载的情况下,连接的打开时间比关闭的时间快,会引起连接池中idle的个数 上升超过maxIdle,而造成频繁的连接销毁和创建,类似于jvm参数中的Xmx设置)
- minIdle:连接池中最小的空闲的连接数,低于这个数量会被创建新的连接(默认为0,调整为5,该参数越接近maxIdle,性能越好,因为连接的创建和销毁,都是需要消耗资源的;但是不能太大,因为在机器很空闲的时候,也会创建低于minidle个数的连接,类似于jvm参数中的Xmn设置)
- maxWait :最大等待时间,当没有可用连接时,连接池等待连接释放的最大时间,超过该时间限制会抛出异常,如果设置-1表示无限等待(默认为无限,调整为60000ms,避免因线程池不够用,而导致请求被无限制挂起)
- poolPreparedStatements:开启池的prepared(默认是false,未调整,经过测试,开启后的性能没有关闭的好。)
- maxOpenPreparedStatements:开启池的prepared 后的同时最大连接数(默认无限制,同上,未配置)
- minEvictableIdleTimeMillis :连接池中连接,在时间段内一直空闲, 被逐出连接池的时间
- (默认为30分钟,可以适当做调整,需要和后端服务端的策略配置相关)
- removeAbandonedTimeout :超过时间限制,回收没有用(废弃)的连接(默认为 300秒,调整为180)
- removeAbandoned :超过removeAbandonedTimeout时间后,是否进 行没用连接(废弃)的回收(默认为false,调整为true)
removeAbandoned参数解释:
- 如果开启了removeAbandoned&#xff0c;当getNumIdle() <2) and (getNumActive() > getMaxActive() - 3)时被触发.
- 举例当maxActive&#61;20, 活动连接为18,空闲连接为1时可以触发"removeAbandoned".但是活动连接只有在没有被使用的时间超 过"removeAbandonedTimeout"时才被回收
- logAbandoned&#xff1a; 标记当连接被回收时是否打印程序的stack traces日志&#xff08;默认为false&#xff0c;未调整&#xff09;
一般会是几种情况出现需要removeAbandoned&#xff1a;
- 代码未在finally释放connection , 不过我们都用sqlmapClientTemplate&#xff0c;底层都有链接释放的过程
- 遇到数据库死锁。以前遇到过后端存储过程做了锁表操作&#xff0c;导致前台集群中连接池全都被block住&#xff0c;后续的业务处理因为拿不到链接所有都处理失败了。
一份优化过的配置&#xff1a;
基本配置代码
-
-
-
xxxx -
xxxxx -
20 -
1 -
60000 -
20 -
3 -
true -
180 -
clientEncoding&#61;GBK
2. dbcp的链接validate配置
- dbcp是采用了commons-pool做为其连接池管理&#xff0c;testOnBorrow,testOnReturn, testWhileIdle是pool是提供的几种校验机制&#xff0c;通过外部钩子的方式回调dbcp的相关数据库链接(validationQuery)校验
- dbcp相关外部钩子类&#xff1a;PoolableConnectionFactory,继承于common-pool PoolableObjectFactory
- dbcp通过GenericObjectPool这一入口&#xff0c;进行连接池的borrow,return处理
- testOnBorrow : 顾明思义&#xff0c;就是在进行borrowObject进行处理时&#xff0c;对拿到的connection进行validateObject校验
- testOnReturn : 顾明思义&#xff0c;就是在进行returnObject对返回的connection进行validateObject校验&#xff0c;个人觉得对数据库连接池的管理意义不大
- testWhileIdle : 关注的重点&#xff0c;GenericObjectPool中针对pool管理&#xff0c;起了一个Evict的TimerTask定时线程进行控制(可通过设置参数timeBetweenEvictionRunsMillis>0),定时对线程池中的链接进行validateObject校验&#xff0c;对无效的链接进行关闭后&#xff0c;会调用ensureMinIdle&#xff0c;适当建立链接保证最小的minIdle连接数。
- timeBetweenEvictionRunsMillis,设置的Evict线程的时间&#xff0c;单位ms&#xff0c;大于0才会开启evict检查线程
- validateQuery&#xff0c; 代表检查的sql
- validateQueryTimeout&#xff0c; 代表在执行检查时&#xff0c;通过statement设置&#xff0c;statement.setQueryTimeout(validationQueryTimeout)
- numTestsPerEvictionRun&#xff0c;代表每次检查链接的数量&#xff0c;建议设置和maxActive一样大&#xff0c;这样每次可以有效检查所有的链接.
Validate配置代码
true -
false -
false -
select sysdate from dual -
1 -
30000 -
20
- 目前网站的应用大部分的瓶颈还是在I/O这一块&#xff0c;大部分的I/O还是在数据库的这一层面上&#xff0c;每一个请求可能会调用10来次SQL查询&#xff0c;如果不走事务&#xff0c;一个请求会重复获取链接&#xff0c;如果每次获取链接都进行validateObject&#xff0c;性能开销不是很能接受&#xff0c;可以假定一次SQL操作消毫0.5~1ms(一般走了网络请求基本就这数)
- 网站异常数据库重启&#xff0c;网络异常断开的频率是非常低的&#xff0c;一般也就在数据库升级&#xff0c;演习维护时才会进行&#xff0c;而且一般也是选在晚上&#xff0c;访问量相对比较低的请求&#xff0c;而且一般会有人员值班关注&#xff0c;所以异步的validateObject是可以接受&#xff0c;但一个前提需要确保能保证在一个合理的时间段内&#xff0c;数据库能完成自动重联。
从代码层面简单介绍下dbcp的validate实现&#xff1a;
1. common-pools提供的PoolableObjectFactory&#xff0c;针对pool池的管理操作接口
Java代码
- public interface PoolableObjectFactory {
- Object makeObject() throws Exception;
- void destroyObject(Object obj) throws Exception;
- boolean validateObject(Object obj);
- void activateObject(Object obj) throws Exception;
- void passivateObject(Object obj) throws Exception;
- }
2. dbcp实现的pool从池管理操作
这里贴了一个相关validate代码&#xff0c;具体类可见&#xff1a;PoolableConnectionFactory.validateConnection()
Java代码
- public class PoolableConnectionFactory implements PoolableObjectFactory {
- ......
- public boolean validateObject(Object obj) { //验证validateObject
- if(obj instanceof Connection) {
- try {
- validateConnection((Connection) obj);
- return true;
- } catch(Exception e) {
- return false;
- }
- } else {
- return false;
- }
- }
- public void validateConnection(Connection conn) throws SQLException {
- String query &#61; _validationQuery;
- if(conn.isClosed()) {
- throw new SQLException("validateConnection: connection closed");
- }
- if(null !&#61; query) {
- Statement stmt &#61; null;
- ResultSet rset &#61; null;
- try {
- stmt &#61; conn.createStatement();
- if (_validationQueryTimeout > 0) {
- stmt.setQueryTimeout(_validationQueryTimeout);
- }
- rset &#61; stmt.executeQuery(query);
- if(!rset.next()) {
- throw new SQLException("validationQuery didn&#39;t return a row");
- }
- } finally {
- if (rset !&#61; null) {
- try {
- rset.close();
- } catch(Exception t) {
- // ignored
- }
- }
- if (stmt !&#61; null) {
- try {
- stmt.close();
- } catch(Exception t) {
- // ignored
- }
- }
- }
- }
- }
- ....
- }
3. pool池的evict调用代码&#xff1a;GenericObjectPool (apache commons pool version 1.5.4)
Java代码
- protected synchronized void startEvictor(long delay) { //启动Evictor为TimerTask
- if(null !&#61; _evictor) {
- EvictionTimer.cancel(_evictor);
- _evictor &#61; null;
- }
- if(delay > 0) {
- _evictor &#61; new Evictor();
- EvictionTimer.schedule(_evictor, delay, delay);
- }
- }
- for (int i&#61;0,m&#61;getNumTests();i
- final ObjectTimestampPair pair;
- .......
- boolean removeObject &#61; false;
- // 空闲链接处理
- final long idleTimeMilis &#61; System.currentTimeMillis() - pair.tstamp;
- if ((getMinEvictableIdleTimeMillis() > 0) &&
- (idleTimeMilis > getMinEvictableIdleTimeMillis())) {
- removeObject &#61; true;
- } else if ((getSoftMinEvictableIdleTimeMillis() > 0) &&
- (idleTimeMilis > getSoftMinEvictableIdleTimeMillis()) &&
- ((getNumIdle() &#43; 1)> getMinIdle())) {
- removeObject &#61; true;
- }
- // testWhileIdle sql 检查处理
- if(getTestWhileIdle() && !removeObject) {
- boolean active &#61; false;
- try {
- _factory.activateObject(pair.value);
- active &#61; true;
- } catch(Exception e) {
- removeObject&#61;true;
- }
- if(active) {
- if(!_factory.validateObject(pair.value)) {
- removeObject&#61;true;
- } else {
- try {
- _factory.passivateObject(pair.value);
- } catch(Exception e) {
- removeObject&#61;true;
- }
- }
- }
- }
- // 真正关闭
- if (removeObject) {
- try {
- _factory.destroyObject(pair.value);
- } catch(Exception e) {
- // ignored
- }
- }
- ........
注意&#xff1a; 目前dbcp的pool的实现是使用了公用的apache common pools进行扩展处理&#xff0c;所以和原生的连接池处理&#xff0c;代码看上去有点别扭&#xff0c;感觉自动重连这块异常处理不怎么好&#xff0c;我也就只重点关注了这部分代码而已 .
3. dbcp的链接自动重链相关测试
相关场景&#xff1a;
- 数据库意外重启后&#xff0c;原先的数据库连接池能自动废弃老的无用的链接&#xff0c;建立新的数据库链接
- 网络异常中断后&#xff0c;原先的建立的tcp链接&#xff0c;应该能进行自动切换
测试需求1步骤
- 建立一testCase代码
- 配置mysql数据库
- 循环执行在SQL查询过程
- 异常重启mysql数据库
测试需求2步骤
- 建立一testCase代码
- 配置mysql数据库
- 循环执行在SQL查询过程
- 通过iptables禁用网络链接
/sbin/iptables -A INPUT -s 10.16.2.69 -j REJECT
/sbin/iptables -A FORWARD -p tcp -s 10.16.2.69 --dport 3306 -m state --state NEW,ESTABLISHED -j DROP
5. iptables -F 清空规则&#xff0c;恢复链接通道。
测试需求问题记录
分别测试了两种配置&#xff0c;有validateObject的配置和没有validateObject的相关配置。
1. 没有validate配置
问题一&#xff1a; 异常重启mysql数据库后&#xff0c;居然也可以自动恢复链接&#xff0c;sql查询正常
跟踪了一下代码&#xff0c;发现这么一个问题&#xff1a;
- 在数据库关闭的时候&#xff0c;client中pool通过borrowObject获取一个异常链接返回给client
- client在使用具体的异常链接进行sql调用出错了&#xff0c;抛了异常
- 在finally&#xff0c;调用connection.close()&#xff0c;本意是应该调用pool通过returnObject返回到的池中&#xff0c;但在跟踪代码时&#xff0c;未见调用GenericObjectPool的returnObject
- 继续查&#xff0c;发现在dbcp在中PoolingDataSource(实现DataSource接口)调用PoolableConnection(dbcp pool相关的delegate操作)进行相应关闭时&#xff0c;会检查_conn.isClosed()&#xff0c;针对DataSource如果isClosed返回为true的则不调用returnObject&#xff0c;直接丢弃了链接
解释&#xff1a;
- 正因为在获取异常链接后&#xff0c;因为做了_conn.isClosed()判断&#xff0c;所以异常链接并没有返回到连接池中&#xff0c;所以到数据库重启恢复后&#xff0c;每次都是调用pool重新构造一个新的connection&#xff0c;所以后面就正常了
- _conn.isClosed()是否保险&#xff0c;从jdk的api描述中&#xff1a; A connection is closed if the method close has been called on it or if certain fatal errors have occurred. 里面提供两种情况&#xff0c;一种就是被调用了closed方法&#xff0c;另一种就是出现一些异常也说的比较含糊。
问题二&#xff1a;validateObject调用时&#xff0c;dbcp设置的validationQueryTimeout居然没效果
看了mysql statement代码实现&#xff0c;找到了答案。
mysql com.mysql.jdbc.statemen 部分代码
timeout时间处理&#xff1a;
Java代码
- timeoutTask &#61; new CancelTask();
- //通过TimerTask启动一定时任务
- Connection.getCancelTimer().schedule(timeoutTask, this.timeoutInMillis);
对应的CancelTask的代码&#xff1a;
Java代码
- class CancelTask extends TimerTask {
- long connectionId &#61; 0;
- CancelTask() throws SQLException {
- connectionId &#61; connection.getIO().getThreadId();
- }
- public void run() {
- Thread cancelThread &#61; new Thread() {
- public void run() {
- Connection cancelConn &#61; null;
- java.sql.Statement cancelStmt &#61; null;
- try {
- cancelConn &#61; connection.duplicate();
- cancelStmt &#61; cancelConn.createStatement();
- // 简单暴力&#xff0c;再发起一条KILL SQL&#xff0c;关闭先前的sql thread id
- cancelStmt.execute("KILL QUERY " &#43; connectionId);
- wasCancelled &#61; true;
- } catch (SQLException sqlEx) {
- throw new RuntimeException(sqlEx.toString());
- } finally {
- if (cancelStmt !&#61; null) {
- try {
- cancelStmt.close();
- } catch (SQLException sqlEx) {
- throw new RuntimeException(sqlEx.toString());
- }
- }
- if (cancelConn !&#61; null) {
- try {
- cancelConn.close();
- } catch (SQLException sqlEx) {
- throw new RuntimeException(sqlEx.toString());
- }
- }
- }
- }
- };
- cancelThread.start();
- }
- }
原因总结一句话&#xff1a; queryTimeout的实现是通过底层数据库提供的机制&#xff0c;比如KILL QUERY pid. 如果此时的网络不通&#xff0c;出现阻塞现象&#xff0c;对应的kill命令也发不出去&#xff0c;所以timeout设置的超时没效果。
4.最后最后还是决定配置testWhileIdle扫描&#xff0c;主要考虑&#xff1a;
- pool池中的链接如果未被使用&#xff0c;可以通过testWhileIdle进行链接检查&#xff0c;避免在使用时后总要失败那么一次&#xff0c;可以及时预防
- 配合连接池的minEvictableIdleTimeMillis(空闲链接)&#xff0c;removeAbandoned(未释放的链接)&#xff0c;可以更好的去避免因为一些异常情况引起的问题&#xff0c;防范于未然。比如使用一些分布式数据库的中间件&#xff0c;会有空闲链接关闭的动作&#xff0c;动态伸缩连接池&#xff0c;这时候需要能及时的发现&#xff0c;避免请求失败。
- testOnBorrow个人不太建议使用&#xff0c;存在性能问题&#xff0c;试想一下连接一般会在什么情况出问题&#xff0c;网络或者服务端异常终端空闲链接&#xff0c;网络中断你testOnBorrow检查发现不对再取一个链接还是不对&#xff0c;针对空闲链接处理异常关闭&#xff0c;可以从好业务端的重试策略进行考虑&#xff0c;同时配置客户端的空闲链接超时时间&#xff0c;maxIdle,minIdle等。
--------------------------------------------
新加的内容&#xff1a;
5.dbcp密码加密处理
以前使用jboss的jndi数据源的方式&#xff0c;是通过配置oracle-ds.xml&#xff0c;可以设置
Java代码
-
-
-
${username} -
${password_encrypt} -
jboss.jca:service&#61;LocalTxCM,name&#61;${jndiName}
为了能达到同样的效果&#xff0c;切换为spring dbcp配置时&#xff0c;也有类似密码加密的功能&#xff0c;运行期进行密码decode,最后进行数据链接。
实现方式很简单&#xff0c;分析jboss的对应SecureIdentityLoginModule的实现&#xff0c;无非就是走了Blowfish加密算法&#xff0c;自己拷贝实现一份。
Java代码
- private static String encode(String secret) throws NoSuchPaddingException, NoSuchAlgorithmException,
- InvalidKeyException, BadPaddingException, IllegalBlockSizeException {
- byte[] kbytes &#61; "jaas is the way".getBytes();
- SecretKeySpec key &#61; new SecretKeySpec(kbytes, "Blowfish");
- Cipher cipher &#61; Cipher.getInstance("Blowfish");
- cipher.init(Cipher.ENCRYPT_MODE, key);
- byte[] encoding &#61; cipher.doFinal(secret.getBytes());
- BigInteger n &#61; new BigInteger(encoding);
- return n.toString(16);
- }
- private static char[] decode(String secret) throws NoSuchPaddingException, NoSuchAlgorithmException,
- InvalidKeyException, BadPaddingException, IllegalBlockSizeException {
- byte[] kbytes &#61; "jaas is the way".getBytes();
- SecretKeySpec key &#61; new SecretKeySpec(kbytes, "Blowfish");
- BigInteger n &#61; new BigInteger(secret, 16);
- byte[] encoding &#61; n.toByteArray();
- Cipher cipher &#61; Cipher.getInstance("Blowfish");
- cipher.init(Cipher.DECRYPT_MODE, key);
- byte[] decode &#61; cipher.doFinal(encoding);
- return new String(decode).toCharArray();
- }
最后的配置替换为&#xff1a;
Xml代码
- ......
-
-
-
- ........
--------------------------------------------
新加的内容&#xff1a;
6.数据库重连机制常见的问题&#xff1a;
1. 数据库意外重启后&#xff0c;原先的数据库连接池能自动废弃老的无用的链接&#xff0c;建立新的数据库链接
2. 网络异常中断后&#xff0c;原先的建立的tcp链接&#xff0c;应该能进行自动切换。比如网站演习中的交换机重启会导致网络瞬断
3. 分布式数据库中间件&#xff0c;比如amoeba会定时的将空闲链接异常关闭&#xff0c;客户端会出现半开的空闲链接。
大致的解决思路&#xff1a;
1. sql心跳检查
主动式 ,即我前面提到的sql validate相关配置
2. 请求探雷
牺牲小我&#xff0c;完成大我的精神。 拿链接尝试一下&#xff0c;发现处理失败丢弃链接&#xff0c;探雷的请求总会失败几个&#xff0c;就是前面遇到的问题一&#xff0c;dbcp已经支持该功能&#xff0c;不需要额外置。
3. 设置合理的超时时间&#xff0c;
解决半开链接. 一般数据库mysql,oracle都有一定的链接空闲断开的机制&#xff0c;而且当你使用一些分布式中间件(软件一类的)&#xff0c;空闲链接控制会更加严格&#xff0c;这时候设置合理的超时时间可以有效避免半开链接。
一般超时时间&#xff0c;dbcp主要是minEvictableIdleTimeMillis(空闲链接) , removeAbandonedTimeout(链接泄漏)。可以见前面的参数解释。
参考文献&#xff1a;http://agapple.iteye.com/blog/772507