SQL 字符串处理遵循“定位—提取—转换—拼接—校验”五步闭环逻辑。定位用 CHARINDEX/INSTR 等找位置;提取用 SUBSTRING 截取;转换用 UPPER/REPLACE 等清洗;拼接用 CONCAT 避免 NULL;校验用 LEN、LIKE 等确保有效性。

SQL 字符串处理不是零散函数堆砌,而是围绕“定位—提取—转换—拼接—校验”五步闭环展开的系统性操作。掌握这个逻辑框架,比死记函数更能应对复杂业务场景。
定位:先搞清目标字符在哪
所有字符串操作的前提是准确找到目标位置。SQL 里最常用的是CHARINDEX(SQL Server)、INSTR(MySQL/Oracle)或POSITION(PostgreSQL)。它们返回子串首次出现的起始索引(注意:SQL Server 从 1 开始,不是 0)。
- 查 邮箱 中 @符号的位置:
CHARINDEX('@', email) - 找第二个“-”的位置(需嵌套):
CHARINDEX('-', email, CHARINDEX('-', email) + 1) - 若没找到,这些函数统一返回 0(不是 NULL),判断时用
> 0而非IS NOT NULL
提取:按需切出有效片段
定位之后,用SUBSTRING(或SUBSTR)截取内容。关键在三个参数:原字符串、起始位置、长度。长度不能为负,超长会自动截断到末尾。
- 取用户名(@前部分):
SUBSTRING(email, 1, CHARINDEX('@', email) - 1) - 取域名(@后到第一个点):
SUBSTRING(email, CHARINDEX('@', email) + 1, CHARINDEX('.', email, CHARINDEX('@', email)) - CHARINDEX('@', email) - 1) - 安全写法:加 CASE WHEN 防异常,比如
CASE WHEN CHARINDEX('@', email) > 0 THEN …… ELSE NULL END
转换:大小写、空格、特殊字符一步到位
清洗和标准化常靠这几个函数组合:UPPER/LOWER 做大小写,LTRIM/RTRIM/TRIM 去空格,REPLACE 做批量替换。注意 TRIM 只在较新版本支持(SQL Server 2017+,MySQL 8.0+),旧版仍需 LTRIM(RTRIM())。
- 统一转小写并去首尾空格:
LOWER(LTRIM(RTRIM(name))) - 把中文顿号、英文逗号都换成英文逗号:
REPLACE(REPLACE(descr, '、', ','), ',', ',') - 删掉所有空格(含中间):
REPLACE(full_name, '',''),但慎用——可能误伤人名中的空格
拼接与校验:让结果可靠又可读
拼接多用 +(SQL Server) 或CONCAT(通用)。CONCAT 优势在于自动把 NULL 转为空字符串,避免整个结果变 NULL;而 + 遇到 NULL 直接得 NULL。校验则常用 LEN(长度)、ISNUMERIC(粗筛数字)、或正则(如 SQL Server 2022+ 的 STRING_SPLIT 配合模式匹配)。
- 生成标准编号:
CONCAT('ORD-', YEAR(create_time), '-', RIGHT('000' + CAST(id AS VARCHAR), 4)) - 检查手机号是否 11 位纯数字:
LEN(mobile) = 11 AND mobile NOT LIKE '%[^0-9]%' - 拆分逗号列表并逐条处理(SQL Server):
SELECT value FROM STRING_SPLIT(tags, ',') WHERE RTRIM(value) != ''
基本上就这些。字符串处理不复杂,但容易忽略边界情况——比如空值、无分隔符、嵌套层级深。按“定位→提取→转换→拼接→校验”顺序推演一遍,多数问题自然浮现解法。