Polichombr项目API接口详解与使用指南
2025-06-24 16:39:24作者:何举烈Damon
项目概述
Polichombr是一个专业的恶意软件分析平台,提供了一套完整的HTTP API接口,方便用户以编程方式与平台交互。本文将从技术角度深入解析Polichombr的API设计、功能特性以及实际应用场景,帮助安全研究人员和开发人员更好地利用这套接口进行恶意软件分析工作。
API基础配置
Polichombr的API采用RESTful风格设计,所有接口均通过/api/1.0/端点提供服务。API支持JSON格式的数据交换,POST请求必须使用JSON格式传递参数。
认证机制
Polichombr采用基于令牌(Token)的认证方式,工作流程如下:
- 用户首先需要向
/auth_token端点提交API密钥 - 服务器验证通过后返回一个临时令牌
- 后续请求需要在HTTP头中添加
X-Api-Key字段携带该令牌 - 如果令牌无效,服务器将返回401错误
这种认证机制既保证了安全性,又便于自动化脚本的编写和执行。
样本管理接口
样本上传与查询
创建新样本(POST /samples/)
- 支持multipart/form-data格式上传
- 必需参数:
file: 样本文件数据(需使用文件对象格式)filename: 原始文件名
- 可选参数:
tlp_level: 样本敏感度级别(参考models.py中的枚举定义)
获取样本列表(GET /samples/)
- 返回系统中所有样本的基本信息
获取特定样本信息
/samples/<hash>/: 通过MD5/SHA1/SHA256哈希值查询样本/samples/<int:sid>/: 通过样本ID获取详细信息
样本分析数据获取
Polichombr提供了丰富的样本分析数据接口:
-
样本下载
/samples/<int:sid>/download/: 获取样本原始二进制文件
-
家族关联
/samples/<int:sid>/families/: 查询样本所属的恶意软件家族
-
摘要信息
/samples/<int:sid>/abstract/: 获取样本的分析摘要
-
匹配信息
/samples/<int:sid>/matches/: 获取样本的匹配信息
-
命名信息
/samples/<int:sid>/names/: 获取样本中重命名的函数- 支持按地址或时间戳过滤查询
- 时间戳格式要求:
%Y-%m-%dT%H:%M:%S.%f
-
注释信息
/samples/<int:sid>/comments/: 获取样本中的注释- 同样支持地址和时间戳过滤
-
结构体信息
/samples/<int:sid>/structs/: 获取样本中定义的结构体
恶意软件家族管理
家族查询与创建
获取所有家族(GET /families/)
- 返回完整的家族层次结构
- 包含每个家族的以下信息:
- TLP敏感度级别
- 摘要(Markdown格式)
- 家族ID和名称
- 父家族ID(如果是子家族)
- 关联样本列表
- 子家族列表
- 关联用户信息
创建新家族(POST /family/)
- 必需参数:
name: 家族名称
- 可选参数:
parent: 父家族名称(用于创建子家族)tlp_level: 敏感度级别
- 返回创建的家族ID
YARA规则管理
规则查询与创建
获取所有规则(GET /yaras/)
- 返回系统中所有YARA规则的详细信息,包括:
- 规则ID和名称
- 创建时间
- 原始规则内容
- 版本号
- TLP敏感度级别
创建新规则(POST /yaras/)
- 必需参数:
name: 规则名称(需唯一)rule: YARA规则文本
- 可选参数:
tlp_level: 敏感度级别
- 返回创建的规则ID
函数匹配接口
Machoc哈希匹配(GET /machoc/)
- 通过Machoc哈希值查询匹配的函数
- 参数:Machoc哈希值(整数形式)
- 返回匹配的函数列表,包含:
- 函数地址
- 函数ID
- Machoc哈希值
- 函数名称
- 所属样本ID
最佳实践与使用技巧
-
批量处理样本
- 结合样本上传和家族关联接口,可以自动化处理大量样本
- 先上传样本,获取样本ID后再关联到相应家族
-
时间戳过滤
- 在分析大型样本时,可以利用时间戳过滤只获取最新的分析数据
- 特别适合持续监控样本分析进度
-
YARA规则管理
- 建议将常用检测规则存储在Polichombr中
- 通过版本号追踪规则变更历史
-
函数匹配分析
- 利用Machoc哈希匹配可以快速发现样本间的代码复用
- 适用于家族关联分析和变种检测
总结
Polichombr的API设计全面考虑了恶意软件分析的实际需求,从样本管理到分析结果查询,再到家族关联和规则管理,提供了一套完整的编程接口。通过合理利用这些接口,安全研究人员可以构建自动化分析流程,提高工作效率。本文详细介绍了各接口的功能和使用方法,希望能为使用者提供有价值的参考。
登录后查看全文
热门项目推荐
ERNIE-4.5-VL-28B-A3B-ThinkingERNIE-4.5-VL-28B-A3B-Thinking 是 ERNIE-4.5-VL-28B-A3B 架构的重大升级,通过中期大规模视觉-语言推理数据训练,显著提升了模型的表征能力和模态对齐,实现了多模态推理能力的突破性飞跃Python00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
MiniMax-M2MiniMax-M2是MiniMaxAI开源的高效MoE模型,2300亿总参数中仅激活100亿,却在编码和智能体任务上表现卓越。它支持多文件编辑、终端操作和复杂工具链调用Python00
HunyuanVideo-1.5暂无简介00
MiniCPM-V-4_5MiniCPM-V 4.5 是 MiniCPM-V 系列中最新且功能最强的模型。该模型基于 Qwen3-8B 和 SigLIP2-400M 构建,总参数量为 80 亿。与之前的 MiniCPM-V 和 MiniCPM-o 模型相比,它在性能上有显著提升,并引入了新的实用功能Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00
GOT-OCR-2.0-hf阶跃星辰StepFun推出的GOT-OCR-2.0-hf是一款强大的多语言OCR开源模型,支持从普通文档到复杂场景的文字识别。它能精准处理表格、图表、数学公式、几何图形甚至乐谱等特殊内容,输出结果可通过第三方工具渲染成多种格式。模型支持1024×1024高分辨率输入,具备多页批量处理、动态分块识别和交互式区域选择等创新功能,用户可通过坐标或颜色指定识别区域。基于Apache 2.0协议开源,提供Hugging Face演示和完整代码,适用于学术研究到工业应用的广泛场景,为OCR领域带来突破性解决方案。00
项目优选
收起
deepin linux kernel
C
24
7
Ascend Extension for PyTorch
Python
177
195
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
647
264
TorchAir 支持用户基于PyTorch框架和torch_npu插件在昇腾NPU上使用图模式进行推理。
Python
270
94
暂无简介
Dart
623
140
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
378
3.34 K
React Native鸿蒙化仓库
JavaScript
242
315
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.1 K
621
仓颉编译器源码及 cjdb 调试工具。
C++
126
856
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
9
1