DISTINCT 用于去除查询重复行,返回唯一数据,语法为 SELECT DISTINCT column_name FROM table_name;2. 可对单列或多列组合去重,多列时需所有列值相同才视为重复;3. 可与 WHERE 结合先过滤后去重;4. 使用时注意性能,大表应建立索引,NULL 值仅保留一个,复杂去重建议用 GROUP BY。

在 MySQL 中使用 DISTINCT 可以有效去除查询结果中的重复行,只返回唯一的数据记录。它通常用于需要对某一列或多列进行去重的场景,比如统计不同用户、不同地区或组合字段的唯一值。
DISTINCT 基本语法
DISTINCT 关键字放在 SELECT 之后,用于指定要去重的列:
SELECT DISTINCT column_name FROM table_name;
例如,有一个用户表 user_info,其中 city 字段有重复数据,只想查看所有不同的城市:
SELECT DISTINCT city FROM user_info;
这样返回的结果中每个城市只出现一次。
对多列进行去重
DISTINCT 也可以作用于多个列,表示“组合去重”。只有当所有指定列的值都相同时,才视为重复:
SELECT DISTINCT column1, column2 FROM table_name;
比如查询不同城市的用户姓名组合:
SELECT DISTINCT city, name FROM user_info;
即使两个用户同名,只要所在城市不同,也会被当作两条独立记录保留。
结合 WHERE 条件使用
DISTINCT 可以和 WHERE 一起使用,在过滤数据后再去重:
SELECT DISTINCT status FROM orders WHERE user_id = 1001;
这条语句查找用户 ID 为 1001 的所有订单状态,并去除重复状态值。
注意事项与性能建议
DISTINCT 操作会触发排序或哈希处理,数据量大时可能影响性能:
- 尽量避免在大表上对大量数据使用 DISTINCT
- 为涉及去重的列建立索引可提升效率
- DISTINCT 不能去除 NULL 值之间的重复(但多个 NULL 会被视为相同并只保留一个)
- 如果需要更复杂的去重逻辑(如保留某条完整记录),应考虑使用 GROUP BY 配合 聚合函数
基本上就这些。DISTINCT 是简单高效的去重方式,适用于大多数单一或组合字段的唯一值提取需求。掌握其用法能帮助你快速清理冗余数据,提升查询结果的清晰度。