前端AI物体计数:5分钟实现图像中物体数量统计
2026-02-05 04:35:29作者:廉彬冶Miranda
你是否还在为电商商品库存盘点、工业零件计数等重复劳动烦恼?本文将基于gh_mirrors/fr/frontend-stuff项目提供的前端工具链,教你如何使用浏览器端AI技术实现图像中物体的自动计数。读完本文你将获得:
- 无需后端服务器的纯前端物体计数方案
- 基于TensorFlow.js的图像识别模型集成方法
- 完整的前端实现代码与项目结构解析
技术选型与项目资源
本方案主要依赖项目中收录的两个核心库:
| 技术库 | 用途 | 项目文档 |
|---|---|---|
| TensorFlow.js | 浏览器端机器学习框架 | 项目README中"Neural Networks"分类 |
| canvas-sketch | 图像处理与可视化工具 | 项目README中"Canvas and SVG"分类 |
通过分析package.json可知,项目已集成@tensorflow/tfjs和tfjs-models/coco-ssd作为图像识别基础,无需额外安装依赖。
实现步骤
1. 环境准备
首先克隆项目仓库并安装依赖:
git clone https://gitcode.com/gh_mirrors/fr/frontend-stuff.git
cd frontend-stuff
npm install
2. 核心代码实现
创建src/object-counter.js文件,实现物体检测与计数功能:
import * as tf from '@tensorflow/tfjs';
import * as cocossd from '@tensorflow-models/coco-ssd';
import { createCanvas } from 'canvas-sketch';
class ObjectCounter {
constructor() {
this.model = null;
this.canvas = null;
this.ctx = null;
}
// 初始化模型
async initModel() {
this.model = await cocossd.load();
console.log('模型加载完成');
}
// 创建画布
setupCanvas(imageElement) {
const canvas = createCanvas(imageElement.width, imageElement.height);
this.ctx = canvas.getContext('2d');
this.ctx.drawImage(imageElement, 0, 0);
return canvas;
}
// 检测并计数物体
async detectAndCount(imageElement) {
if (!this.model) await this.initModel();
this.canvas = this.setupCanvas(imageElement);
const predictions = await this.model.detect(this.canvas);
// 绘制检测结果
this.drawPredictions(predictions);
// 统计各类物体数量
const counts = this.countObjects(predictions);
return counts;
}
// 绘制检测框和标签
drawPredictions(predictions) {
predictions.forEach(prediction => {
this.ctx.strokeStyle = '#FF0000';
this.ctx.lineWidth = 2;
this.ctx.strokeRect(
prediction.bbox[0],
prediction.bbox[1],
prediction.bbox[2],
prediction.bbox[3]
);
this.ctx.fillStyle = '#FF0000';
this.ctx.fillText(
`${prediction.class}: ${prediction.score.toFixed(2)}`,
prediction.bbox[0],
prediction.bbox[1] - 5
);
});
}
// 计数不同类别的物体
countObjects(predictions) {
const counts = {};
predictions.forEach(prediction => {
const label = prediction.class;
counts[label] = (counts[label] || 0) + 1;
});
return counts;
}
}
// 导出实例
export const objectCounter = new ObjectCounter();
3. 前端界面集成
创建public/index.html文件,实现用户交互界面:
<!DOCTYPE html>
<html>
<head>
<title>前端AI物体计数工具</title>
<style>
.container {
max-width: 800px;
margin: 0 auto;
padding: 20px;
}
#imageInput {
margin: 20px 0;
}
#result {
margin-top: 20px;
padding: 10px;
border: 1px solid #ccc;
}
#canvasContainer {
margin-top: 20px;
}
</style>
</head>
<body>
<div class="container">
<h1>AI物体计数工具</h1>
<input type="file" id="imageInput" accept="image/*">
<div id="canvasContainer"></div>
<div id="result"></div>
</div>
<script type="module">
import { objectCounter } from '../src/object-counter.js';
const imageInput = document.getElementById('imageInput');
const canvasContainer = document.getElementById('canvasContainer');
const resultElement = document.getElementById('result');
imageInput.addEventListener('change', async (e) => {
const file = e.target.files[0];
if (!file) return;
// 显示上传的图片
const imageElement = new Image();
imageElement.src = URL.createObjectURL(file);
imageElement.onload = async () => {
// 检测并计数物体
const counts = await objectCounter.detectAndCount(imageElement);
// 显示结果
canvasContainer.appendChild(objectCounter.canvas);
// 格式化计数结果
let resultHTML = '<h3>计数结果:</h3><ul>';
for (const [label, count] of Object.entries(counts)) {
resultHTML += `<li>${label}: ${count}个</li>`;
}
resultHTML += '</ul>';
resultElement.innerHTML = resultHTML;
};
});
</script>
</body>
</html>
4. 运行与测试
启动开发服务器:
npm run dev
在浏览器中访问http://localhost:8080,上传包含多个物体的图片即可看到计数结果。
优化与扩展
性能优化
- 使用WebWorker进行模型推理,避免阻塞UI线程:
// worker.js
import * as tf from '@tensorflow/tfjs';
import * as cocossd from '@tensorflow-models/coco-ssd';
let model;
self.onmessage = async (e) => {
if (e.data.type === 'INIT_MODEL') {
model = await cocossd.load();
self.postMessage({ type: 'MODEL_READY' });
} else if (e.data.type === 'DETECT_OBJECTS') {
const predictions = await model.detect(e.data.imageData);
self.postMessage({ type: 'DETECTION_RESULT', predictions });
}
};
- 模型选择与量化:
// 加载量化模型,减小体积提升速度
model = await cocossd.load({
modelUrl: 'https://storage.googleapis.com/tfjs-models/tfjs/coco-ssd/mobilenet_v1/model.json',
base: 'mobilenet_v1',
modelSize: 'small'
});
功能扩展
可结合项目中的chart.js实现计数结果可视化,或使用fabric.js添加交互式标注功能。
总结
本文基于gh_mirrors/fr/frontend-stuff项目实现了一个纯前端的AI物体计数工具,利用TensorFlow.js在浏览器中直接运行物体检测模型,无需后端支持。通过这种方案,开发者可以快速构建出商品盘点、零件计数等实用工具,大大提高工作效率。
完整代码与更多示例可在项目的examples/object-counter目录下找到。如需深入学习,建议参考项目文档中的jscodeshift-tutorial和TensorFlow.js官方文档。
登录后查看全文
热门项目推荐
相关项目推荐
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00- QQwen3-Coder-Next2026年2月4日,正式发布的Qwen3-Coder-Next,一款专为编码智能体和本地开发场景设计的开源语言模型。Python00
xw-cli实现国产算力大模型零门槛部署,一键跑通 Qwen、GLM-4.7、Minimax-2.1、DeepSeek-OCR 等模型Go06
PaddleOCR-VL-1.5PaddleOCR-VL-1.5 是 PaddleOCR-VL 的新一代进阶模型,在 OmniDocBench v1.5 上实现了 94.5% 的全新 state-of-the-art 准确率。 为了严格评估模型在真实物理畸变下的鲁棒性——包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化——我们提出了 Real5-OmniDocBench 基准测试集。实验结果表明,该增强模型在新构建的基准测试集上达到了 SOTA 性能。此外,我们通过整合印章识别和文本检测识别(text spotting)任务扩展了模型的能力,同时保持 0.9B 的超紧凑 VLM 规模,具备高效率特性。Python00
KuiklyUI基于KMP技术的高性能、全平台开发框架,具备统一代码库、极致易用性和动态灵活性。 Provide a high-performance, full-platform development framework with unified codebase, ultimate ease of use, and dynamic flexibility. 注意:本仓库为Github仓库镜像,PR或Issue请移步至Github发起,感谢支持!Kotlin08
VLOOKVLOOK™ 是优雅好用的 Typora/Markdown 主题包和增强插件。 VLOOK™ is an elegant and practical THEME PACKAGE × ENHANCEMENT PLUGIN for Typora/Markdown.Less00
项目优选
收起
deepin linux kernel
C
27
11
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
532
3.75 K
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
336
178
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
886
596
Ascend Extension for PyTorch
Python
340
405
暂无简介
Dart
772
191
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
12
1
openJiuwen agent-studio提供零码、低码可视化开发和工作流编排,模型、知识库、插件等各资源管理能力
TSX
986
247
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
416
4.21 K
React Native鸿蒙化仓库
JavaScript
303
355