1. Group_concat 返回结果的长度

函数 group_concat 返回结果的长度受参数 group_concat_max_len 控制,默认值是 1024,即默认返回1024字节长度结果。

#参数名称默认值最小值最大值作用
1group_concat_max_len102441844674407370954752group_concat 函数返回结果的最大长度,单位字节
注:该参数可以在控制台  参数设置中配置(全局生效),也可以在会话级别设置(当前会话生效)。

set group_concat_max_len=90; -- 设置当前会话 group_concat_max_len 为 90 字节show variables like 'group_concat_max_len'; -- 查看当前会话的 group_concat_max_len 值select group_concat(distinct concat_ws(' ', t1.col0, t1.col2, t1.col3, t1.col4) separator "---")from grp_con_test t1, grp_con_test t2 \G  -- 查询结果select length(group_concat(distinct concat_ws(' ', t1.col0, t1.col2, t1.col3, t1.col4) separator "---"))from grp_con_test t1, grp_con_test t2 \G  -- 查询结果的长度

2. Group_concat(distinct) 去除重复数据失效的处理

2.1 失效原因

当设置 group_concat_max_len 为较大值时,会出现使用 group_concat 和 distinct 来去除结果中重复数据失效的情况,比如:
select group_concat(distinct concat_ws(' ', t1.col0, t1.col2, t1.col3, t1.col4) separator "---")from grp_con_test t1, grp_con_test t2 \G -- 查询结果
可以看到,结果中出现多个重复值。 出现这个问题的原因是,当 group_concat 返回结果集比较大,则会出现内存临时表无法承载全部结果集数据,进而会使用磁盘临时表;而 group_concat 在使用磁盘临时表时会触发 bug 导致无法去除重复数据。
show variables like 'tmp_table_size'; -- 显示当前会话 tmp_table_size 参数设置

2.2 解决方法

调整 tmp_table_size 参数设置,增大内存临时表的最大尺寸。

set tmp_table_size=1*1024*1024 -- 设置当前会话 tmp_table_size 为 1 MBshow variables like 'tmp_table_size' -- 查看当前会话 tmp_table_size 的设置select group_concat(distinct concat_ws(' ', t1.col0, t1.col2, t1.col3, t1.col4) separator "---")from grp_con_test t1, grp_con_test t2 \G

注:
  • 1. Bug 信息请参考:Bug 68145
  • 2. 参数 tmp_table_size 可以在控制台  参数设置中设置(全局生效,但对设置前已经连接的会话不生效),也可以在会话级别设置(当前会话生效)。
Posted by in 云服务 | Comments

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

产品、资讯、其他内容 请搜索

分类