Semantic Segmentation Editor 安装与使用指南
1. 项目介绍
Semantic Segmentation Editor 是一个基于 Web 的标注工具,专门用于创建机器学习训练数据集(2D 和 3D)。该工具由日立汽车工业实验室(Hitachi Automotive And Industry Lab)开发,主要用于自动驾驶研究,但也适用于其他类型的语义目标数据库标注。它支持普通相机拍摄的 2D 图像(jpg 和 png 文件)以及 LiDAR 生成的 3D 点云(pcd 文件)中目标的标注。
2. 项目快速启动
2.1 使用 Docker 启动
-
下载 Docker Compose 堆栈文件:
wget https://raw.githubusercontent.com/Hitachi-Automotive-And-Industry-Lab/semantic-segmentation-editor/master/sse-docker-stack.yml -
下载配置文件:
wget https://raw.githubusercontent.com/Hitachi-Automotive-And-Industry-Lab/semantic-segmentation-editor/master/settings.json -
设置环境变量并启动 Docker Compose:
METEOR_SETTINGS=$(cat settings.json) SSE_IMAGES=YOUR_IMAGES_PATH docker-compose -f sse-docker-stack.yml up
2.2 从源码启动
-
安装 Meteor(适用于 OSX 或 Linux):
curl https://install.meteor.com/ | sh -
克隆项目并进入项目目录:
git clone https://github.com/Hitachi-Automotive-And-Industry-Lab/semantic-segmentation-editor.git cd semantic-segmentation-editor -
安装依赖并启动应用:
meteor npm install meteor npm start -
访问应用: 默认情况下,应用运行在
http://localhost:3000。
3. 应用案例和最佳实践
3.1 自动驾驶数据标注
Semantic Segmentation Editor 最初是为自动驾驶研究开发的,特别适用于标注道路、车辆、行人等目标。通过该工具,研究人员可以快速创建高质量的训练数据集,用于训练语义分割模型。
3.2 其他领域应用
除了自动驾驶,该工具还可用于其他需要语义分割标注的领域,如医学影像分析、遥感图像处理等。用户可以根据具体需求自定义标注类别和颜色。
4. 典型生态项目
4.1 Meteor
Semantic Segmentation Editor 是基于 Meteor 框架开发的。Meteor 是一个全栈 JavaScript 框架,适用于快速构建实时 Web 应用。
4.2 React
前端界面使用 React 构建,提供了良好的用户体验和交互性能。
4.3 Three.js
用于处理 3D 点云的渲染和交互,提供了强大的 3D 图形处理能力。
4.4 Paper.js
用于处理 2D 图像的标注,提供了丰富的图形绘制和编辑功能。
通过这些生态项目的支持,Semantic Segmentation Editor 能够提供高效、灵活的标注功能,满足不同应用场景的需求。
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
PaddleOCR-VL-1.5PaddleOCR-VL-1.5 是 PaddleOCR-VL 的新一代进阶模型,在 OmniDocBench v1.5 上实现了 94.5% 的全新 state-of-the-art 准确率。 为了严格评估模型在真实物理畸变下的鲁棒性——包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化——我们提出了 Real5-OmniDocBench 基准测试集。实验结果表明,该增强模型在新构建的基准测试集上达到了 SOTA 性能。此外,我们通过整合印章识别和文本检测识别(text spotting)任务扩展了模型的能力,同时保持 0.9B 的超紧凑 VLM 规模,具备高效率特性。Python00
xw-cli实现国产算力大模型零门槛部署,一键跑通 Qwen、GLM-4.7、Minimax-2.1、DeepSeek-OCR 等模型Go06
yuanrongopenYuanrong runtime:openYuanrong 多语言运行时提供函数分布式编程,支持 Python、Java、C++ 语言,实现类单机编程高性能分布式运行。Go051
pc-uishopTNT开源商城系统使用java语言开发,基于SpringBoot架构体系构建的一套b2b2c商城,商城是满足集平台自营和多商户入驻于一体的多商户运营服务系统。包含PC 端、手机端(H5\APP\小程序),系统架构以及实现案例中应满足和未来可能出现的业务系统进行对接。Vue00
ebook-to-mindmapepub、pdf 拆书 AI 总结TSX01