热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

oracel中字符串分割成集合详解

文章分享一篇关于自己的学习笔记,oracel中字符串分割成集合详解有需要学习的同学可以看看。

文章分享一篇关于自己的学习笔记,oracel中字符串分割成集合详解有需要学习的同学可以看看。

首先分别使用两种方式构造两个函数

代码如下

-- use conventional plsql
create or replace function f_str2list_pls
(
p_str varchar2,
p_separator varchar2 default ','
) return my_tk_str_tab_type is
l_idx pls_integer := 0;
l_str varchar2(32767) := trim(p_str);
l_elmt varchar2(100) := null;
l_list my_tk_str_tab_type := my_tk_str_tab_type();
begin
while l_str is not null loop
l_idx := instr(l_str, p_separator);
if l_idx = 0 then
l_elmt := l_str;
l_str := null;
else
l_elmt := substr(l_str, 1, l_idx - 1);
l_str := substr(l_str, l_idx + 1);
end if;

l_list.extend;
l_list(l_list.last) := trim(l_elmt);
end loop;

return l_list;
end;
/

-- use single sql
create or replace function f_str2list_sql
(
p_str varchar2,
p_separator varchar2 default ','
) return my_tk_str_tab_type is
l_list my_tk_str_tab_type := my_tk_str_tab_type();
begin
substr(a.str,
instr(p_separator || a.str, p_separator, 1, rn),
instr(a.str || p_separator, p_separator, 1, rn) -
instr(p_separator || a.str, p_separator, 1, rn)) q
bulk collect into l_list
from (select p_str as str from dual) a,
(select rownum rn from dual connect by rownum <= length(p_str)) b
where instr(p_separator || a.str, p_separator, 1, rn) > 0;

return l_list;
end;
/


确认两种方法完成同样的功能

----------------------------------------------------

代码如下

-- same result
declare
l_list my_tk_str_tab_type := my_tk_str_tab_type();
l_str varchar2(1000) := 'a,b,c';
begin
l_list := f_str2list_pls(l_str,',');
for i in 1..l_list.count loop
dbms_output.put_line(l_list(i));
end loop;

dbms_output.put_line('');
l_list := f_str2list_sql(l_str,',');
for i in 1..l_list.count loop
dbms_output.put_line(l_list(i));
end loop;
end;
/

SQL> set serveroutput on
a
b
c

a
b
c

我们知道在PL/SQL和SQL里面,varchar2类型的长度限制是不同的。那么这两种方法是否也存在同样的限制?验证一下

先测试PL/SQL版本

-- 这里使用单个字母作为元素,加上必要的逗号分割符,一个元素占用长度2. PL/SQL中上限32767。当取(32767/2 = 16383)个元素的时候,运行成功
----------------------------------------------------

代码如下

-- pls versions tring length limit
declare
l_list my_tk_str_tab_type := my_tk_str_tab_type();
l_str varchar2(32767) := '';
l_max pls_integer := 16383;
begin
-- construct string
for i in 1 .. l_max loop
l_str := l_str || ',' || 'a';
end loop;
l_str := substr(l_str, 2);

l_list := f_str2list_pls(l_str, ',');
end;
/

PL/SQL procedure successfully completed

-- 增加一个元素,当取(16384)个元素的时候,超过了varchar2的限制,所以无法运行。(构造字符串就报错了,这个时候其实还没有调用f_str2list_pls)
代码如下

declare
l_list my_tk_str_tab_type := my_tk_str_tab_type();
l_str varchar2(32767) := '';
l_max pls_integer := 16384;
begin
-- construct string
for i in 1 .. l_max loop
l_str := l_str || ',' || 'a';
end loop;

l_list := f_str2list_pls(l_str, ',');
end;
/

ORA-06502: PL/SQL: numeric or value error: character string buffer too small
ORA-06512: at line 9

-- 修改一下代码,实际调用这个函数。从结果可以看到,f_str2list_pls()内部报超长错误
declare
l_list my_tk_str_tab_type := my_tk_str_tab_type();
l_str varchar2(32767) := '';
l_max pls_integer := 16383;
begin
-- construct string
for i in 1 .. l_max loop
l_str := l_str || ',' || 'a';
end loop;

l_list := f_str2list_pls(l_str||',a', ',');
end;

ORA-06502: PL/SQL: numeric or value error: character string buffer too small
ORA-06512: at "T2.F_STR2LIST_PLS", line 7
ORA-06512: at line 12


下面测试SQL版本

代码如下

-- 因为SQL中varchar2上限是4000,所以使用2000个元素。一切正常。
----------------------------------------------------
-- sql versions tring length limit
declare
l_list my_tk_str_tab_type := my_tk_str_tab_type();
l_str varchar2(32767) := '';
l_max pls_integer := 2000;
begin
-- construct string
for i in 1 .. l_max loop
l_str := l_str || ',' || 'a';
end loop;
l_str := substr(l_str, 2);

l_list := f_str2list_sql(l_str, ',');
end;
/

PL/SQL procedure successfully completed

-- 直接增加到2001个元素,发现f_str2list_sql()内部报错,说明构造字符串的成功传入,但是函数不能处理
代码如下

declare
l_list my_tk_str_tab_type := my_tk_str_tab_type();
l_str varchar2(32767) := '';
l_max pls_integer := 2001;
begin
-- construct string
for i in 1 .. l_max loop
l_str := l_str || ',' || 'a';
end loop;
l_str := substr(l_str, 2);

l_list := f_str2list_sql(l_str, ',');
end;

ORA-01460: unimplemented or unreasonable conversion ed
ORA-06512: at "T2.F_STR2LIST_SQL", line 8
ORA-06512: at line 13

备注:ORA-01460的描述很不清楚,其实这里就是varchar2超长

测试比较两种方式在不同数据量下的性能

代码如下

----------------------------------------------------
-- performance test
declare
l_list my_tk_str_tab_type := my_tk_str_tab_type();
l_str varchar2(32767) := '';
l_max pls_integer := 2000;
begin
-- construct string
for i in 1 .. l_max loop
l_str := l_str || ',' || 'a';
end loop;
l_str := substr(l_str, 2);

-- warm up before actually calculation
l_list := f_str2list_sql(l_str, ',');
l_list := f_str2list_pls(l_str, ',');

-- begin calc and diff
my_rs.rs_start;
-- 1. pls version
l_list := f_str2list_pls(l_str, ',');
my_rs.rs_middle;
-- 2. sql version
l_list := f_str2list_sql(l_str, ',');
my_rs.rs_stop();
end;
/


我们分别测试当元素个数为100, 200, 500, 1000, 2000的情况。每种情况进行3-5次然后取平均

元素个数

PL/SQL 运行时间 (1/100 second)

SQL 运行时间 (1/100 second)

PCT

100

1

1

100%

200

1

1 - 2

50% - 100%

500

1 - 2

2 - 3

30% - 50%

1000

1

4

25%

2000

2

10

20%

总结:

SQL版本的书写简便,并且可以脱离PL/SQL环境直接使用(单条SQL进行行列转换)。

SQL版本只能处理长度小于4000的字符串,实际最大只能包含2000个元素。PL/SQL版本可以处理长度小于32767的字符串。

小数据量情况下,两者性能相当。随着数据量增大,PL/SQL版本性能明显占优

推荐阅读
  • 如何实现织梦DedeCms全站伪静态
    本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态,以提高管理和SEO效果。全站伪静态可以避免重复URL的问题,同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式,可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具,如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]
  • 本文介绍了在SQL中查询分组后每组行数的统计方法。通过使用count()函数和GROUP BY子句可以统计每组的行数,但是如何统计所有组的行数呢?本文提供了一种实现方法,并给出了相应的SQL查询语句。 ... [详细]
  • 在数据分析工作中,我们通常会遇到这样的问题,一个业务部门由若干业务组构成,需要筛选出每个业务组里业绩前N名的业务员。这其实是一个分组排序的 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • Oracle Database 10g许可授予信息及高级功能详解
    本文介绍了Oracle Database 10g许可授予信息及其中的高级功能,包括数据库优化数据包、SQL访问指导、SQL优化指导、SQL优化集和重组对象。同时提供了详细说明,指导用户在Oracle Database 10g中如何使用这些功能。 ... [详细]
  • 本文介绍了adg架构设置在企业数据治理中的应用。随着信息技术的发展,企业IT系统的快速发展使得数据成为企业业务增长的新动力,但同时也带来了数据冗余、数据难发现、效率低下、资源消耗等问题。本文讨论了企业面临的几类尖锐问题,并提出了解决方案,包括确保库表结构与系统测试版本一致、避免数据冗余、快速定位问题等。此外,本文还探讨了adg架构在大版本升级、上云服务和微服务治理方面的应用。通过本文的介绍,读者可以了解到adg架构设置的重要性及其在企业数据治理中的应用。 ... [详细]
  • 在说Hibernate映射前,我们先来了解下对象关系映射ORM。ORM的实现思想就是将关系数据库中表的数据映射成对象,以对象的形式展现。这样开发人员就可以把对数据库的操作转化为对 ... [详细]
  • 本文介绍了使用postman进行接口测试的方法,以测试用户管理模块为例。首先需要下载并安装postman,然后创建基本的请求并填写用户名密码进行登录测试。接下来可以进行用户查询和新增的测试。在新增时,可以进行异常测试,包括用户名超长和输入特殊字符的情况。通过测试发现后台没有对参数长度和特殊字符进行检查和过滤。 ... [详细]
  • 本文详细介绍了MysqlDump和mysqldump进行全库备份的相关知识,包括备份命令的使用方法、my.cnf配置文件的设置、binlog日志的位置指定、增量恢复的方式以及适用于innodb引擎和myisam引擎的备份方法。对于需要进行数据库备份的用户来说,本文提供了一些有价值的参考内容。 ... [详细]
  • 使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]
  • 本文由编程笔记小编整理,介绍了PHP中的MySQL函数库及其常用函数,包括mysql_connect、mysql_error、mysql_select_db、mysql_query、mysql_affected_row、mysql_close等。希望对读者有一定的参考价值。 ... [详细]
  • 本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取,用于解析LOCAL_LISTENER,并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例,并展示了listener.ora文件的内容。 ... [详细]
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • Java String与StringBuffer的区别及其应用场景
    本文主要介绍了Java中String和StringBuffer的区别,String是不可变的,而StringBuffer是可变的。StringBuffer在进行字符串处理时不生成新的对象,内存使用上要优于String类。因此,在需要频繁对字符串进行修改的情况下,使用StringBuffer更加适合。同时,文章还介绍了String和StringBuffer的应用场景。 ... [详细]
  • Oracle分析函数first_value()和last_value()的用法及原理
    本文介绍了Oracle分析函数first_value()和last_value()的用法和原理,以及在查询销售记录日期和部门中的应用。通过示例和解释,详细说明了first_value()和last_value()的功能和不同之处。同时,对于last_value()的结果出现不一样的情况进行了解释,并提供了理解last_value()默认统计范围的方法。该文对于使用Oracle分析函数的开发人员和数据库管理员具有参考价值。 ... [详细]
author-avatar
手机用户2502892083
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有