前端AI物体计数:5分钟实现图像中物体数量统计
2026-02-05 04:35:29作者:廉彬冶Miranda
你是否还在为电商商品库存盘点、工业零件计数等重复劳动烦恼?本文将基于gh_mirrors/fr/frontend-stuff项目提供的前端工具链,教你如何使用浏览器端AI技术实现图像中物体的自动计数。读完本文你将获得:
- 无需后端服务器的纯前端物体计数方案
- 基于TensorFlow.js的图像识别模型集成方法
- 完整的前端实现代码与项目结构解析
技术选型与项目资源
本方案主要依赖项目中收录的两个核心库:
| 技术库 | 用途 | 项目文档 |
|---|---|---|
| TensorFlow.js | 浏览器端机器学习框架 | 项目README中"Neural Networks"分类 |
| canvas-sketch | 图像处理与可视化工具 | 项目README中"Canvas and SVG"分类 |
通过分析package.json可知,项目已集成@tensorflow/tfjs和tfjs-models/coco-ssd作为图像识别基础,无需额外安装依赖。
实现步骤
1. 环境准备
首先克隆项目仓库并安装依赖:
git clone https://gitcode.com/gh_mirrors/fr/frontend-stuff.git
cd frontend-stuff
npm install
2. 核心代码实现
创建src/object-counter.js文件,实现物体检测与计数功能:
import * as tf from '@tensorflow/tfjs';
import * as cocossd from '@tensorflow-models/coco-ssd';
import { createCanvas } from 'canvas-sketch';
class ObjectCounter {
constructor() {
this.model = null;
this.canvas = null;
this.ctx = null;
}
// 初始化模型
async initModel() {
this.model = await cocossd.load();
console.log('模型加载完成');
}
// 创建画布
setupCanvas(imageElement) {
const canvas = createCanvas(imageElement.width, imageElement.height);
this.ctx = canvas.getContext('2d');
this.ctx.drawImage(imageElement, 0, 0);
return canvas;
}
// 检测并计数物体
async detectAndCount(imageElement) {
if (!this.model) await this.initModel();
this.canvas = this.setupCanvas(imageElement);
const predictions = await this.model.detect(this.canvas);
// 绘制检测结果
this.drawPredictions(predictions);
// 统计各类物体数量
const counts = this.countObjects(predictions);
return counts;
}
// 绘制检测框和标签
drawPredictions(predictions) {
predictions.forEach(prediction => {
this.ctx.strokeStyle = '#FF0000';
this.ctx.lineWidth = 2;
this.ctx.strokeRect(
prediction.bbox[0],
prediction.bbox[1],
prediction.bbox[2],
prediction.bbox[3]
);
this.ctx.fillStyle = '#FF0000';
this.ctx.fillText(
`${prediction.class}: ${prediction.score.toFixed(2)}`,
prediction.bbox[0],
prediction.bbox[1] - 5
);
});
}
// 计数不同类别的物体
countObjects(predictions) {
const counts = {};
predictions.forEach(prediction => {
const label = prediction.class;
counts[label] = (counts[label] || 0) + 1;
});
return counts;
}
}
// 导出实例
export const objectCounter = new ObjectCounter();
3. 前端界面集成
创建public/index.html文件,实现用户交互界面:
<!DOCTYPE html>
<html>
<head>
<title>前端AI物体计数工具</title>
<style>
.container {
max-width: 800px;
margin: 0 auto;
padding: 20px;
}
#imageInput {
margin: 20px 0;
}
#result {
margin-top: 20px;
padding: 10px;
border: 1px solid #ccc;
}
#canvasContainer {
margin-top: 20px;
}
</style>
</head>
<body>
<div class="container">
<h1>AI物体计数工具</h1>
<input type="file" id="imageInput" accept="image/*">
<div id="canvasContainer"></div>
<div id="result"></div>
</div>
<script type="module">
import { objectCounter } from '../src/object-counter.js';
const imageInput = document.getElementById('imageInput');
const canvasContainer = document.getElementById('canvasContainer');
const resultElement = document.getElementById('result');
imageInput.addEventListener('change', async (e) => {
const file = e.target.files[0];
if (!file) return;
// 显示上传的图片
const imageElement = new Image();
imageElement.src = URL.createObjectURL(file);
imageElement.onload = async () => {
// 检测并计数物体
const counts = await objectCounter.detectAndCount(imageElement);
// 显示结果
canvasContainer.appendChild(objectCounter.canvas);
// 格式化计数结果
let resultHTML = '<h3>计数结果:</h3><ul>';
for (const [label, count] of Object.entries(counts)) {
resultHTML += `<li>${label}: ${count}个</li>`;
}
resultHTML += '</ul>';
resultElement.innerHTML = resultHTML;
};
});
</script>
</body>
</html>
4. 运行与测试
启动开发服务器:
npm run dev
在浏览器中访问http://localhost:8080,上传包含多个物体的图片即可看到计数结果。
优化与扩展
性能优化
- 使用WebWorker进行模型推理,避免阻塞UI线程:
// worker.js
import * as tf from '@tensorflow/tfjs';
import * as cocossd from '@tensorflow-models/coco-ssd';
let model;
self.onmessage = async (e) => {
if (e.data.type === 'INIT_MODEL') {
model = await cocossd.load();
self.postMessage({ type: 'MODEL_READY' });
} else if (e.data.type === 'DETECT_OBJECTS') {
const predictions = await model.detect(e.data.imageData);
self.postMessage({ type: 'DETECTION_RESULT', predictions });
}
};
- 模型选择与量化:
// 加载量化模型,减小体积提升速度
model = await cocossd.load({
modelUrl: 'https://storage.googleapis.com/tfjs-models/tfjs/coco-ssd/mobilenet_v1/model.json',
base: 'mobilenet_v1',
modelSize: 'small'
});
功能扩展
可结合项目中的chart.js实现计数结果可视化,或使用fabric.js添加交互式标注功能。
总结
本文基于gh_mirrors/fr/frontend-stuff项目实现了一个纯前端的AI物体计数工具,利用TensorFlow.js在浏览器中直接运行物体检测模型,无需后端支持。通过这种方案,开发者可以快速构建出商品盘点、零件计数等实用工具,大大提高工作效率。
完整代码与更多示例可在项目的examples/object-counter目录下找到。如需深入学习,建议参考项目文档中的jscodeshift-tutorial和TensorFlow.js官方文档。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0153- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
LongCat-Video-Avatar-1.5最新开源LongCat-Video-Avatar 1.5 版本,这是一款经过升级的开源框架,专注于音频驱动人物视频生成的极致实证优化与生产级就绪能力。该版本在 LongCat-Video 基础模型之上构建,可生成高度稳定的商用级虚拟人视频,支持音频-文本转视频(AT2V)、音频-文本-图像转视频(ATI2V)以及视频续播等原生任务,并能无缝兼容单流与多流音频输入。00
auto-devAutoDev 是一个 AI 驱动的辅助编程插件。AutoDev 支持一键生成测试、代码、提交信息等,还能够与您的需求管理系统(例如Jira、Trello、Github Issue 等)直接对接。 在IDE 中,您只需简单点击,AutoDev 会根据您的需求自动为您生成代码。Kotlin03
Intern-S2-PreviewIntern-S2-Preview,这是一款高效的350亿参数科学多模态基础模型。除了常规的参数与数据规模扩展外,Intern-S2-Preview探索了任务扩展:通过提升科学任务的难度、多样性与覆盖范围,进一步释放模型能力。Python00
skillhubopenJiuwen 生态的 Skill 托管与分发开源方案,支持自建与可选 ClawHub 兼容。Python0112
热门内容推荐
最新内容推荐
项目优选
收起
暂无描述
Dockerfile
733
4.75 K
deepin linux kernel
C
31
16
Ascend Extension for PyTorch
Python
651
797
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed.
Get Started
Rust
1.25 K
153
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
1.1 K
611
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.01 K
1.01 K
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
147
237
昇腾LLM分布式训练框架
Python
168
200
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
434
395
暂无简介
Dart
986
253