Semantic Segmentation Editor 安装与使用指南
1. 项目介绍
Semantic Segmentation Editor 是一个基于 Web 的标注工具,专门用于创建机器学习训练数据集(2D 和 3D)。该工具由日立汽车工业实验室(Hitachi Automotive And Industry Lab)开发,主要用于自动驾驶研究,但也适用于其他类型的语义目标数据库标注。它支持普通相机拍摄的 2D 图像(jpg 和 png 文件)以及 LiDAR 生成的 3D 点云(pcd 文件)中目标的标注。
2. 项目快速启动
2.1 使用 Docker 启动
-
下载 Docker Compose 堆栈文件:
wget https://raw.githubusercontent.com/Hitachi-Automotive-And-Industry-Lab/semantic-segmentation-editor/master/sse-docker-stack.yml -
下载配置文件:
wget https://raw.githubusercontent.com/Hitachi-Automotive-And-Industry-Lab/semantic-segmentation-editor/master/settings.json -
设置环境变量并启动 Docker Compose:
METEOR_SETTINGS=$(cat settings.json) SSE_IMAGES=YOUR_IMAGES_PATH docker-compose -f sse-docker-stack.yml up
2.2 从源码启动
-
安装 Meteor(适用于 OSX 或 Linux):
curl https://install.meteor.com/ | sh -
克隆项目并进入项目目录:
git clone https://github.com/Hitachi-Automotive-And-Industry-Lab/semantic-segmentation-editor.git cd semantic-segmentation-editor -
安装依赖并启动应用:
meteor npm install meteor npm start -
访问应用: 默认情况下,应用运行在
http://localhost:3000。
3. 应用案例和最佳实践
3.1 自动驾驶数据标注
Semantic Segmentation Editor 最初是为自动驾驶研究开发的,特别适用于标注道路、车辆、行人等目标。通过该工具,研究人员可以快速创建高质量的训练数据集,用于训练语义分割模型。
3.2 其他领域应用
除了自动驾驶,该工具还可用于其他需要语义分割标注的领域,如医学影像分析、遥感图像处理等。用户可以根据具体需求自定义标注类别和颜色。
4. 典型生态项目
4.1 Meteor
Semantic Segmentation Editor 是基于 Meteor 框架开发的。Meteor 是一个全栈 JavaScript 框架,适用于快速构建实时 Web 应用。
4.2 React
前端界面使用 React 构建,提供了良好的用户体验和交互性能。
4.3 Three.js
用于处理 3D 点云的渲染和交互,提供了强大的 3D 图形处理能力。
4.4 Paper.js
用于处理 2D 图像的标注,提供了丰富的图形绘制和编辑功能。
通过这些生态项目的支持,Semantic Segmentation Editor 能够提供高效、灵活的标注功能,满足不同应用场景的需求。
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
GLM-4.7-FlashGLM-4.7-Flash 是一款 30B-A3B MoE 模型。作为 30B 级别中的佼佼者,GLM-4.7-Flash 为追求性能与效率平衡的轻量化部署提供了全新选择。Jinja00
VLOOKVLOOK™ 是优雅好用的 Typora/Markdown 主题包和增强插件。 VLOOK™ is an elegant and practical THEME PACKAGE × ENHANCEMENT PLUGIN for Typora/Markdown.Less00
PaddleOCR-VL-1.5PaddleOCR-VL-1.5 是 PaddleOCR-VL 的新一代进阶模型,在 OmniDocBench v1.5 上实现了 94.5% 的全新 state-of-the-art 准确率。 为了严格评估模型在真实物理畸变下的鲁棒性——包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化——我们提出了 Real5-OmniDocBench 基准测试集。实验结果表明,该增强模型在新构建的基准测试集上达到了 SOTA 性能。此外,我们通过整合印章识别和文本检测识别(text spotting)任务扩展了模型的能力,同时保持 0.9B 的超紧凑 VLM 规模,具备高效率特性。Python00
KuiklyUI基于KMP技术的高性能、全平台开发框架,具备统一代码库、极致易用性和动态灵活性。 Provide a high-performance, full-platform development framework with unified codebase, ultimate ease of use, and dynamic flexibility. 注意:本仓库为Github仓库镜像,PR或Issue请移步至Github发起,感谢支持!Kotlin07
compass-metrics-modelMetrics model project for the OSS CompassPython00