主要解决问题字符串中存在中文将中文识别出来并替换为想要的字符串。实现原理1用REGEXP_REPLACE函数将字符串里的中文字符替换为所需要的字符串。2正则表达式[\u4e00-\u9fa5]用于匹配中文字符。3由于识别到的中文每个中文字符占3个字节折合一个英文字符这里需要去重。正则表达式(Chinese)的含义是匹配一个或多个连续的Chinese字符串。其中(Chinese)是一个捕获组它将Chinese当作一个整体表示前面的元素也就是捕获组里的Chinese出现一次或多次。再次REGEXP_REPLACE函数嵌套即可实现去重效果。实现方式gbase select a,REGEXP_REPLACE( REGEXP_REPLACE(a,[^\u4e00-\u9fa5], Chinese) ,(Chinese), Chinese ) from zhao ; ----------------------------------------------------------------------------------------------------------- | a | REGEXP_REPLACE( REGEXP_REPLACE(a,[^\u4e00-\u9fa5], Chinese) ,(Chinese), Chinese ) | ----------------------------------------------------------------------------------------------------------- | abc | abc | | ab赵钱孙c | abChinesec | | abc周润发 | abcChinese | | 周星驰haha | Chinesehaha | ----------------------------------------------------------------------------------------------------------- 4 rows in set (Elapsed: 00:00:00.06)