Apache Doris ALTER TABLE COLUMN 操作全面指南
2025-06-27 13:09:47作者:鲍丁臣Ursa
概述
在Apache Doris中,ALTER TABLE COLUMN语句用于对已有表进行结构变更操作。本文将详细介绍各种表结构变更的语法、使用场景和最佳实践,帮助用户更好地管理Doris表结构。
基本概念
在深入ALTER TABLE操作前,需要了解几个关键概念:
-
物化索引:Doris表创建后会有一个基表(base table)和基索引(base index),基于基表可以创建rollup索引,两者都是物化索引。
-
轻量级schema变更:Doris 1.2.0+版本支持轻量级结构变更,对值列的加减操作可以更快同步完成。2.0.0+版本默认开启此功能。
列操作详解
1. 添加单列
语法格式:
ALTER TABLE [database.]table
ADD COLUMN column_name column_type [KEY | agg_type] [DEFAULT "default_value"]
[AFTER column_name|FIRST]
[TO rollup_index_name]
使用场景:
- 在非聚合模型表中添加KEY列:
ALTER TABLE example_db.my_table
ADD COLUMN new_col INT KEY DEFAULT "0" AFTER key_1;
- 在聚合模型表中添加SUM聚合列:
ALTER TABLE example_db.my_table
ADD COLUMN new_col INT SUM DEFAULT "0" AFTER value_1;
注意事项:
- 聚合模型添加值列必须指定聚合类型(SUM, MIN, MAX等)
- 非聚合模型添加KEY列需要指定KEY关键字
- 不能向rollup索引中添加基索引已存在的列
2. 添加多列
语法格式:
ALTER TABLE [database.]table
ADD COLUMN (column_name1 column_type [KEY | agg_type] DEFAULT "default_value", ...)
[TO rollup_index_name]
示例:
ALTER TABLE example_db.my_table
ADD COLUMN (new_col1 INT key DEFAULT "0", new_col2 INT DEFAULT "0");
3. 删除列
语法格式:
ALTER TABLE [database.]table DROP COLUMN column_name
[FROM rollup_index_name]
限制条件:
- 不能删除分区列
- 聚合模型不能删除KEY列
- 从基索引删除的列如果存在于rollup索引中也会被删除
4. 修改列属性
语法格式:
ALTER TABLE [database.]table
MODIFY COLUMN column_name column_type [KEY | agg_type] [NULL | NOT NULL] [DEFAULT "default_value"]
[AFTER column_name|FIRST]
[FROM rollup_index_name]
类型转换支持:
- 数值类型间的扩大转换(TINYINT→BIGINT等)
- 数值与VARCHAR间的相互转换
- VARCHAR最大长度修改
- DATE与DATETIME间的相互转换
- FLOAT→DOUBLE转换
示例:
-- 修改列类型并调整位置
ALTER TABLE example_db.my_table
MODIFY COLUMN col1 BIGINT KEY DEFAULT "1" AFTER col2;
-- 修改VARCHAR列长度
ALTER TABLE example_db.my_table
MODIFY COLUMN val1 VARCHAR(64) REPLACE DEFAULT "abc";
5. 列重排序
语法格式:
ALTER TABLE [database.]table
ORDER BY (column_name1, column_name2, ...)
[FROM rollup_index_name]
特点:
- 需要列出索引中的所有列
- 键列必须位于值列之前
- 键列只能在键列范围内调整顺序,值列同理
复合操作示例:
ALTER TABLE example_db.my_table
ADD COLUMN col INT DEFAULT "0" AFTER v_1,
ORDER BY (k_2,k_1,v_3,v_2,v_1,col);
最佳实践
-
大表变更建议:
- 在业务低峰期执行ALTER操作
- 对于超大表,考虑分批执行变更
-
类型转换注意事项:
- VARCHAR转数值类型需确保数据格式正确
- 缩小类型范围可能导致数据截断
-
性能优化:
- 使用轻量级schema变更(light_schema_change)加速值列加减
- 单次ALTER尽量合并多个操作
-
监控变更进度:
- 使用专用命令查看ALTER任务进度
- 长时间运行的任务需要特别关注
总结
Apache Doris的ALTER TABLE COLUMN功能提供了灵活的表结构变更能力,支持添加、删除、修改列属性以及列重排序等操作。合理使用这些功能可以满足业务发展过程中的表结构调整需求,同时保证数据的一致性和查询性能。在实际使用中,建议充分测试变更操作,并遵循最佳实践以确保系统稳定性。
登录后查看全文
热门项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0191
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0118
Step-3.7-FlashStep-3.7-Flash是一个拥有 1980 亿参数的稀疏混合专家(MoE)视觉语言模型,由 1960 亿参数的语言主干网络和 18 亿参数的视觉编码器组合而成,具备原生图像理解能力。Python00
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
fun-rec推荐系统入门教程,在线阅读地址:https://datawhalechina.github.io/fun-rec/Python03
so-large-lm大模型基础: 一文了解大模型基础知识01
热门内容推荐
最新内容推荐
项目优选
收起
暂无描述
Dockerfile
765
4.97 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
857
1.93 K
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
680
1.33 K
Ascend Extension for PyTorch
Python
719
879
deepin linux kernel
C
32
16
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
456
438
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.08 K
1.1 K
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
151
252
CANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。
Jupyter Notebook
303
118
昇腾LLM分布式训练框架
Python
178
220