Oracle Docker镜像中部署RAC集群的权限问题分析与解决
2025-06-01 14:55:54作者:何举烈Damon
问题背景
在使用Oracle官方提供的docker-images项目中OracleRealApplicationClusters容器部署RAC集群时,许多用户会遇到权限配置和存储挂载方面的问题。本文详细分析了一个典型部署失败案例,并提供了完整的解决方案。
关键错误现象
部署过程中主要出现以下几类错误:
-
ASM磁盘权限问题:
- 磁盘映像文件的所有者和组不符合要求
- 预期所有者应为"grid",但实际为"oracle"
- 预期组应为"asmadmin",但实际为"oinstall"
-
存储挂载配置问题:
- NFS挂载选项不符合Oracle要求
- 缺少必要的挂载参数如rsize、wsize等
-
系统资源检查失败:
- 交换空间不足(要求16GB)
- 内存配置不符合最低要求
根本原因分析
经过深入分析,这些问题主要源于以下几个配置不当:
- 存储卷挂载方式错误:直接使用了主机目录挂载而非通过Docker volume机制
- NFS挂载参数不完整:缺少Oracle RAC必需的NFS挂载选项
- 容器资源限制不足:未配置足够的内存和交换空间
完整解决方案
1. 正确配置网络环境
首先需要创建两个隔离的网络环境:
docker network create --driver=bridge --subnet=172.16.1.0/24 rac_pub1_nw
docker network create --driver=bridge --subnet=192.168.17.0/24 rac_priv1_nw
2. 部署DNS服务器容器
docker create --hostname racdns \
--dns-search=example.com \
--cap-add=AUDIT_WRITE \
-e DOMAIN_NAME="example.com" \
-e WEBMIN_ENABLED=false \
-e RAC_NODE_NAME_PREFIXD="racnoded" \
-e SETUP_DNS_CONFIG_FILES="setup_true" \
--privileged=false \
--name rac-dnsserver \
oracle/rac-dnsserver:latest
3. 配置存储服务器容器
export ORACLE_DBNAME=ORCLCDB
mkdir -p /docker_volumes/asm_vol/$ORACLE_DBNAME
docker run -d -t --hostname racnode-storage \
--dns-search=example.com \
--cap-add SYS_ADMIN \
--cap-add AUDIT_WRITE \
--volume /docker_volumes/asm_vol/$ORACLE_DBNAME:/oradata \
--init \
--network=rac_priv1_nw \
--ip=192.168.17.80 \
--tmpfs=/run \
--volume /sys/fs/cgroup:/sys/fs/cgroup:ro \
--name racnode-storage \
oracle/rac-storage-server:19.3.0
4. 创建并配置存储卷
关键步骤是正确创建NFS类型的Docker volume:
docker volume create --driver local \
--opt type=nfs \
--opt o=addr=192.168.17.80,rw,bg,hard,tcp,vers=3,timeo=600,rsize=32768,wsize=32768,actimeo=0 \
--opt device=192.168.17.80:/oradata \
racstorage
5. 部署RAC节点容器
docker create -t -i \
--hostname racnoded1 \
--volume /boot:/boot:ro \
--volume /dev/shm \
--tmpfs /dev/shm:rw,exec,size=4G \
--volume /opt/containers/rac_host_file:/etc/hosts \
--volume /opt/.secrets:/run/secrets:ro \
--dns=172.16.1.25 \
--dns-search=example.com \
--privileged=false \
--volume racstorage:/oradata \
--cap-add=SYS_NICE \
--cap-add=SYS_RESOURCE \
--cap-add=NET_ADMIN \
-e DNS_SERVERS="172.16.1.25" \
-e NODE_VIP=172.16.1.130 \
-e VIP_HOSTNAME=racnoded1-vip \
-e PRIV_IP=192.168.17.100 \
-e PRIV_HOSTNAME=racnoded1-priv \
-e PUBLIC_IP=172.16.1.100 \
-e PUBLIC_HOSTNAME=racnoded1 \
-e SCAN_NAME=racnodedc1-scan \
-e OP_TYPE=INSTALL \
-e DOMAIN=example.com \
-e ASM_DISCOVERY_DIR=/oradata \
-e ASM_DEVICE_LIST=/oradata/asm_disk01.img,/oradata/asm_disk02.img,/oradata/asm_disk03.img,/oradata/asm_disk04.img,/oradata/asm_disk05.img \
-e CMAN_HOSTNAME=racnodedc1-cman \
-e CMAN_IP=172.16.1.164 \
-e COMMON_OS_PWD_FILE=common_os_pwdfile.enc \
-e PWD_KEY=pwd.key \
-e RESET_FAILED_SYSTEMD="true" \
--restart=always \
--tmpfs=/run \
-v /sys/fs/cgroup:/sys/fs/cgroup:ro \
--cpu-rt-runtime=95000 \
--ulimit rtprio=99 \
--memory 16G \
--memory-swap 32G \
--name racnoded1 \
oracle/database-rac:21.3.0
关键配置要点
- 必须使用Docker volume:不能直接挂载主机目录,必须通过NFS类型的Docker volume挂载
- NFS挂载参数:必须包含rw,bg,hard,tcp,vers=3,timeo=600等关键参数
- 资源限制:确保配置足够的内存(16G)和交换空间(32G)
- 网络隔离:公共网络和私有网络必须分开配置
- 权限继承:通过正确的volume配置确保ASM磁盘文件具有正确的所有者和组
验证部署成功
成功部署后,容器日志中会显示以下信息:
ORACLE RAC DATABASE IS READY TO USE!
通过遵循上述步骤和配置要点,可以避免常见的权限问题和存储配置错误,顺利完成Oracle RAC在Docker环境中的部署。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0194
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0121
MiMo-V2.5-Pro-FP4-DFlashMiMo-V2.5-Pro-FP4-DFlash 是驱动 MiMo-V2.5-Pro-UltraSpeed 的底层模型: FP4 量化骨干网络:对 MoE 专家采用 MXFP4 量化,同时保持模型其他部分的更高精度,在几乎无损质量的前提下,显著减小模型体积并降低内存带宽压力。 BF16 DFlash 草稿生成器:用于块扩散推测解码,每次前向传播可生成一整个块的 tokens,并让骨干网络一步完成验证。 两者协同作用,既降低了每参数的位宽,又减少了骨干网络前向传播的次数,而这两者正是万亿参数模型解码过程中的两大主要成本来源。Python00
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
AstrBot✨ 易上手的多平台 LLM 聊天机器人及开发框架 ✨ 平台支持 QQ、QQ频道、Telegram、微信、企微、飞书 | OpenAI、DeepSeek、Gemini、硅基流动、月之暗面、Ollama、OneAPI、Dify 等。附带 WebUI。Python05
handy-ollama动手学Ollama,CPU玩转大模型部署,在线阅读地址:https://datawhalechina.github.io/handy-ollama/Jupyter Notebook06
项目优选
收起
暂无描述
Dockerfile
766
4.99 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
857
1.94 K
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
686
1.34 K
Ascend Extension for PyTorch
Python
721
892
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.08 K
1.1 K
deepin linux kernel
C
32
16
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
458
445
本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本,由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用,3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。
Dart
1.01 K
262
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
151
253
CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。
Python
1 K
617