tsql 正则

阅读: 评论:0

tsql 正则

tsql 正则

科研管理数据库中由于后台代码中关于项目查看的部分出现bug,导致数据库中学科代码如7403510变成了7403510语言教学,现在要修复这些问题数据,首先需要在数据库中检索出所有的问题数据,在网上搜索有关Oracle中在SQL语句中使用正则表达式的知识。

起初,我想用 select c_project_name,c_year, c_discipline from t_general where not regexp_like(c_discipline,'[0-9]') and c_year = '2014';来检索出除学科代码全由数字组成的数据之外的所有数据,但是发现不行,具体原因有待考察。

换一种思路,检索出除学科代码全由数字结尾的数据之外的所有数据,select c_project_name,c_year, c_discipline from t_general where not regexp_like(c_discipline,'[0-9]$') and c_year = '2014';得到我想要的结果:

当我们要进行一些简单的糊涂查询时用百分号(%),通配符(_)就可以了.其中%表达任意长度的字符串,_表示任意的某一个字符.

比如select * from emp where ename like 's%' or ename like 's_';

但如果在一些复杂的查询中关用这两个符号sql语句就会非常复杂,而且也不一定能实现.从Oracle 10g开始引入了在其他程序语言中普通使用的正则表达式.

主要有regexp_like,regexp_replace,regexp_substr,regexp_instr四个正则表达式函数.

正则表达式中的元字符:

元字符

意思

例子

说明要匹配的字符是一个特殊字符、常量或者后者引用。(后引用重复上一次的匹配)

n 匹配换行符

\ 匹配

( 匹配 (

) 匹配 )

^

匹配字符串的开头位置

^a匹配arwen.但不匹配barwen.

$

匹配字符串的末尾位置

en$匹配arwen.但不匹配arwenb.

*

匹配前面的字符0次或多次

a*rwen可以匹配rwen或aaarwen.

+

匹配前面的字符1次或多次

a+rwen可以匹配arwen或aarwen.但不能匹配rwen.

?

匹配前面的字符0次或1次

a?rwen可以匹配arwen或rwen.但不能匹配aarwen.

{n}

匹配前面的字符恰好是n次,其中n是整数

ar{2}wen可以匹配arrwen.但不能匹配arwen或arrrwen.

{n,m}

匹配前面的字符至少是n次,最多是m次.如果写成

{n,}表示最少匹配n次.没有上限.

ar{1,2}wen可以匹配arwen,arrwen.但不匹配awen或arrrwen.

.

点号,匹配除null,换行以外的任意单个字符

<可以匹配arwen,arwin.但不能匹配arween或arwn.

(pattern)

括号中pattern是一个子正则表达式,匹配指定pattern模式的一个子表达式。

其实括号就像一般语言表达式中的括号.有时多加些括号可增强可读性.另外的用处见下面关于n的描述.

x|y

匹配“或”

x|y可以匹配x或者y

[abc]

可以匹配abc中的任何单个字符

hello[abc]可以匹配helloa,hellob,helloc

[a-z]

可以匹配指定范围内的任何单个字符

hell[a-z]可以匹配hello或者hellz

[::]

指定一个字符类,可以匹配该类中的任何字符

[:alphanum:]可以匹配字符0-9、A-Z、a-z

[:alpha:]可以匹配字符A-Z、a-z

[:blank:]可以匹配空格或tab键

[:digit:]可以匹配数字0-9

[:graph:]可以匹配非空字符

[:lower:]可以匹配小写字母a-z

[:print:]与[:graph:]类似,不同之处在于[:print:]包括空格字符

[:punct:]可以匹配标点符号.,""等等

[:space:]可以匹配所有的空字符

[:upper:]可以匹配大写字母A-Z

[:xdigit:]可以匹配十六进制数字0-9、A-F、a-f

n

这是对前一次匹配命中的一个后引用,其中n是一个正整数

arw(en)1可以匹配arwenen.注意1前面必须是个加括号的子表达式.

regexp_like(x,pattern[,match_option]),查看x是否与pattern相匹配,该函数还可以提供一个可选的参数match_option字符串说明默认的匹配选项。match_option的取值如下:

‘c’   说明在进行匹配时区分大小写(缺省值);

'i'   说明在进行匹配时不区分大小写;

'n'   (.)点号能表示所有单个字符,包括换行(俺还不知道什么地方有用到换行.只知道sql里面可以用chr(10)表示换行.

'm'   字符串存在换行的时候当作多行处理.这样$就可匹配每行的结尾.不然的话$只匹配字符串最后的位置.

示例:select * from emp where

regexp_like(ename,'^a[a-z]*n$');可以查找ename中以a开头以n结尾的行.例如ename为arwen或arwin

或anden.但Arwen不能被匹配.因为默认是区分大小写.如果是select * from emp where

regexp_like(ename,'^a[a-z]*n$','i')则可以查找ename为Arwen的行记录.

REGEXP_INSTR(x,pattern[,start[,occurrence[,return_option[,

match_option]]]])用于在x中查找pattern。返回pattern在x中出现的位置。匹配位置从1开始。可以参考字符串函数

INSTR(),参数相关:

'start'   开始查找的位置;

'occurrence'   说明应该返回第几次出现pattern的位置;

'return_option'   说明应该返回什么整数。若该参数为0,则说明要返回的整数是x中的一个字符的位置;若该参数为非0的整数,则说明要返回的整数为x中出现在pattern之后   的字符的位置;

'match_option'   修改默认的匹配设置.与regexp_like里面的相同.

示例:

DECLARE

V_RESULT INTEGER;

BEGIN

SELECTREGEXP_INSTR('hello world','o',1,1,0)INTOV_RESULT

FROMDUAL;

DBMS_OUTPUT.PUT_LINE(V_RESULT);

END;

结果为5.即字母o第一个次出现的位置

如果regexp_instr('hello world','o',1,1,n)其中n为除0之外的整数.比如1,3.则结果为6.表示第一次出现字母o的后面一个字符的位置.

如果regexp_instr('hello world','o',1,2,0)则结果为9.表示第二次出现字母o的位置.

我做的实验及总结

SELECT  REGEXP_INSTR('hello world','o',6,2,1) from dual;

其中:

6:开始查找的位置(初始位置为1)

1:返回第一次出现o的地方

1:该参数为非0的整数,则说明要返回的整数为o中出现在pattern之后的字符的位置(为9),为0是结果是8;

REGEXP_REPLACE(x,pattern[,replace_string[,start[,occurrence[,

match_option]]]])用于在x中查找pattern,并将其替换为replae_string。可以参考字符串函数

REPLACE(),参数同REGEXP_INSTR函数

示例:

DECLARE

V_RESULT varchar2(90);

BEGIN

SELECTREGEXP_REPLACE('hello world','o','x',1,1)INTOV_RESULT

FROMDUAL;

DBMS_OUTPUT.PUT_LINE(V_RESULT);

END;

结果为hellx world.

如果REGEXP_REPLACE('hello world','o','x'),则结果为hellx wxrld.

如果 REGEXP_REPLACE('hello world','o','x',1,2)则结果为hello wxrld.

我做的实验及总结

SELECT  REGEXP_REPLACE('hello world','o','x',6,1) from dual;

6:从第六个开始查找(初始位置为1)

1:第一次出现o

与REGEXP_INSTR相比,少了return_option(0和非0的选项)

REGEXP_SUBSTR(x,pattern[,start[,occurrence[, match_option]]])用于在x中查找pattern并返回。可以参考字符串函数 SUBSTR(),参数同REGEXP_INSTR函数.

例如:

DECLARE

V_RESULT VARCHAR2(255);

BEGIN

SELECTREGEXP_SUBSTR('hello world','l{2}')INTOV_RESULT

FROMDUAL;

DBMS_OUTPUT.PUT_LINE(V_RESULT);

END;

结果为ll

查询到匹配的字符串才返回匹配的字符.没查到就返回空.

本文发布于:2024-02-02 15:16:55,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170685821644652.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:正则   tsql
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23