【亲测免费】 Scan2CAD 项目使用教程
1. 项目介绍
Scan2CAD 是一个用于将 3D CAD 模型对齐到 RGB-D 扫描数据中的研究项目。该项目在 CVPR 2019 上发表,提供了一个数据集和代码,用于学习和实现 CAD 模型在 RGB-D 扫描中的对齐。Scan2CAD 的核心目标是自动将 3D 扫描数据中的对象与预定义的 CAD 模型进行匹配和对齐,从而实现更精确的 3D 重建和场景理解。
2. 项目快速启动
2.1 克隆项目仓库
首先,克隆 Scan2CAD 项目仓库到本地:
git clone https://github.com/skanti/Scan2CAD.git
cd Scan2CAD
2.2 获取数据集
为了使用 Scan2CAD 数据集,您需要填写一个 Google 表单来获取下载链接。下载完成后,将数据集内容复制到项目目录中的 /Routines/Script/ 文件夹。
2.3 可视化数据
使用以下命令可视化数据:
python3 /Routines/Script/Annotation2Mesh.py
2.4 编译 C++ 程序
进入 C++ 程序目录并编译:
cd [Vox2Mesh, DFGen, CropCentered]
make
2.5 生成数据
生成对应关系数据:
python3 /Routines/Script/GenerateCorrespondences.py
2.6 开始训练
进入 PyTorch 训练目录并启动训练:
cd /Network/pytorch
./run.sh
2.7 运行对齐算法
运行对齐算法并查看结果:
cd Routines/Scripts
python3 Alignment9DoF.py --projectdir /Network/pytorch/output/dummy
python3 Alignment2Mesh.py --alignment /tmp/alignments/dummy/scene0470_00.csv --out /
3. 应用案例和最佳实践
3.1 3D 重建
Scan2CAD 可以用于自动将 3D 扫描数据中的对象与 CAD 模型对齐,从而实现更精确的 3D 重建。这在建筑、室内设计和机器人导航等领域有广泛应用。
3.2 场景理解
通过对齐 CAD 模型,Scan2CAD 可以帮助理解复杂场景中的对象布局和结构,从而提高场景理解的准确性。
3.3 自动化检测
Scan2CAD 还可以用于自动化检测和识别场景中的特定对象,例如在工业检测中自动识别和定位特定零件。
4. 典型生态项目
4.1 ScanNet
ScanNet 是一个大规模的 RGB-D 扫描数据集,用于室内场景的 3D 重建和理解。Scan2CAD 使用了 ScanNet 数据集来训练和验证其模型。
4.2 ShapeNet
ShapeNet 是一个大规模的 3D 模型数据集,包含了各种类别的 3D CAD 模型。Scan2CAD 使用了 ShapeNet 数据集中的 CAD 模型来进行对齐和匹配。
4.3 PyTorch
PyTorch 是一个开源的深度学习框架,Scan2CAD 使用了 PyTorch 来实现其深度学习模型,并进行训练和推理。
通过以上步骤,您可以快速启动 Scan2CAD 项目,并了解其在 3D 重建、场景理解和自动化检测等领域的应用。
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
GLM-4.7-FlashGLM-4.7-Flash 是一款 30B-A3B MoE 模型。作为 30B 级别中的佼佼者,GLM-4.7-Flash 为追求性能与效率平衡的轻量化部署提供了全新选择。Jinja00
VLOOKVLOOK™ 是优雅好用的 Typora/Markdown 主题包和增强插件。 VLOOK™ is an elegant and practical THEME PACKAGE × ENHANCEMENT PLUGIN for Typora/Markdown.Less00
PaddleOCR-VL-1.5PaddleOCR-VL-1.5 是 PaddleOCR-VL 的新一代进阶模型,在 OmniDocBench v1.5 上实现了 94.5% 的全新 state-of-the-art 准确率。 为了严格评估模型在真实物理畸变下的鲁棒性——包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化——我们提出了 Real5-OmniDocBench 基准测试集。实验结果表明,该增强模型在新构建的基准测试集上达到了 SOTA 性能。此外,我们通过整合印章识别和文本检测识别(text spotting)任务扩展了模型的能力,同时保持 0.9B 的超紧凑 VLM 规模,具备高效率特性。Python00
KuiklyUI基于KMP技术的高性能、全平台开发框架,具备统一代码库、极致易用性和动态灵活性。 Provide a high-performance, full-platform development framework with unified codebase, ultimate ease of use, and dynamic flexibility. 注意:本仓库为Github仓库镜像,PR或Issue请移步至Github发起,感谢支持!Kotlin07
compass-metrics-modelMetrics model project for the OSS CompassPython00