高效智能arXiv论文推荐：Zotero-arXiv-Daily自动化推送全指南

2026-04-05 09:05:14作者：曹令琨Iris

Zotero-arXiv-Daily是一款能够根据Zotero图书馆内容自动生成个性化arXiv论文推荐的开源工具，通过论文自动推送机制，帮助用户无需人工干预即可获取领域最新研究动态。本文将系统介绍如何利用这一工具构建专属的学术情报网络，从核心价值解析到实际应用场景，再到高级配置技巧，全方位帮助用户实现学术追踪的自动化与智能化。

核心价值：为什么选择arXiv论文推荐自动化

在信息爆炸的学术环境中，研究人员、学生和科技从业者常常面临"信息过载"与"信息遗漏"的双重挑战。Zotero-arXiv-Daily通过以下三大核心优势解决这一痛点：

智能关联推荐：基于Zotero图书馆内容自动分析研究兴趣，推荐高度相关的最新论文，如同为你配备了24小时不间断的学术助理
零成本自动化：依托GitHub Actions工作流，无需本地部署服务器，完全免费实现每日定时推送
个性化定制：支持从论文数量、分类偏好到邮件格式的全方位自定义，满足不同用户的个性化需求

图1：Zotero-arXiv-Daily生成的论文推荐邮件样例，包含相关性评分和论文摘要

5分钟环境部署：arXiv论文推荐系统快速搭建

准备工作：获取项目代码

首先通过命令行工具将项目代码克隆到本地或直接在Git平台创建副本：

git clone https://gitcode.com/GitHub_Trending/zo/zotero-arxiv-daily

项目结构中，配置文件位于config/目录下，包含base.yaml、custom.yaml和default.yaml三个模板文件，用户可根据需求修改自定义配置。

环境变量配置：四大核心模块设置

进入项目仓库的"Settings > Secrets"页面，添加以下环境变量（按功能模块分组配置）：

图2：GitHub仓库环境变量配置界面，箭头指示关键操作位置

🔧 Zotero连接模块

ZOTERO_ID：你的Zotero账户ID（可在Zotero设置中找到）
ZOTERO_KEY：具有读取权限的Zotero API密钥（在Zotero官网"设置>Feeds/API"中生成）

📧 邮件服务模块

SMTP_SERVER：邮件发送服务器地址（如Gmail为smtp.gmail.com）
SMTP_PORT：邮件服务器端口（通常为587或465）
SENDER：发送邮件的邮箱地址
SENDER_PASSWORD：邮箱密码或应用专用密码
RECEIVER：接收推荐邮件的邮箱地址

⚙️ 推荐参数模块

ARXIV_QUERY：arXiv论文分类（如"cs.AI+cs.LG"表示人工智能和机器学习领域）
MAX_PAPER_NUM：每次推荐的最大论文数量（建议设置10-20篇）
SEND_EMPTY：当没有新论文时是否发送空邮件（设为"true"或"false"）

🤖 LLM增强模块（可选）

USE_LLM_API：是否启用AI摘要功能（设为"true"启用）
OPENAI_API_KEY：AI服务API密钥
MODEL_NAME：使用的AI模型名称（如"gpt-3.5-turbo"）

工作流触发：首次运行与测试

完成配置后，在项目仓库的"Actions"页面选择"Send emails daily"工作流，点击"Run workflow"按钮手动触发首次运行：

图3：GitHub Actions工作流手动触发界面，红箭头指示运行按钮

建议首次运行后检查接收邮箱，确认是否收到测试邮件。如未收到，可在Actions日志中查看错误信息进行排查。

个性化推荐设置：打造专属arXiv论文流

精准分类配置

通过ARXIV_QUERY参数可以精确控制推荐范围，格式为用"+"连接的arXiv分类代码：

单领域："cs.CV"（计算机视觉）
多领域："cs.AI+stat.ML"（人工智能+统计机器学习）
细分领域："cs.LG+eess.IV"（机器学习+图像处理）

arXiv分类代码可在其官网查询，建议根据Zotero图书馆中论文的主题进行设置，以获得最高相关性推荐。

邮件展示优化

通过修改配置文件config/custom.yaml可以自定义邮件展示效果：

调整摘要长度：修改email.summary_length参数控制TLDR长度
显示优先级：设置email.show_relevance为"true"显示相关性评分
链接样式：通过email.include_links控制是否显示PDF和代码链接

智能过滤规则

高级用户可通过修改src/zotero_arxiv_daily/executor.py中的过滤逻辑，实现更精准的论文筛选：

关键词过滤：添加特定关键词的包含/排除规则
作者筛选：设置关注作者列表，优先推荐其新论文
引用阈值：设置最低引用数过滤低影响力论文

扩展生态：arXiv论文推荐系统的创新应用

场景一：科研团队知识管理助手

应用场景：某高校NLP实验室需要跟踪领域最新进展，但团队成员各自关注不同子方向。

实施方案：

创建团队共享Zotero库，按研究方向建立子文件夹
配置ARXIV_QUERY为"cs.CL+cs.NE+cs.SD"（计算语言学+神经计算+语音处理）
设置MAX_PAPER_NUM为30，SEND_EMPTY为"false"
配置团队邮件列表作为接收者，实现每日团队学术简报

价值：团队成员无需各自搜索文献，通过统一的推荐邮件即可掌握领域动态，每周团队例会可直接基于推荐论文进行讨论，显著提升信息共享效率。

场景二：科技企业技术情报监测

应用场景：某AI创业公司需要监测竞争对手和学术机构的最新研究成果，及时调整产品研发方向。

实施方案：

在Zotero中建立"竞争对手论文"和"关键机构论文"两个收藏夹
配置USE_LLM_API为"true"，启用AI摘要功能
设置MODEL_NAME为"gpt-4"，提高摘要质量
编写自定义脚本（基于src/zotero_arxiv_daily/protocol.py扩展），自动提取论文中的技术创新点和应用场景
配置工作日8:00发送，确保团队在上班第一时间获取情报

价值：技术团队能够快速了解前沿技术趋势和竞争格局，将原本需要2-3小时的文献筛选工作压缩到15分钟内完成，显著提升研发决策效率。

问题排查与性能优化

常见错误解决

邮件发送失败：检查SMTP服务器设置和端口是否正确，确保邮箱开启SMTP服务
推荐相关性低：增加Zotero图书馆中的样本论文数量，或调整ARXIV_QUERY分类范围
工作流执行超时：在config/base.yaml中减小retriever.max_results参数，减少单次检索论文数量

性能优化建议

对于Zotero库较大的用户，建议定期清理不相关文献，提高推荐准确性
如启用LLM功能，可通过设置LLM_TEMPERATURE参数（0.3-0.5）控制摘要生成的创造性
对于网络不稳定的环境，可配置本地缓存（修改utils.py中的缓存逻辑）减少重复网络请求

通过本文介绍的方法，你可以快速搭建起一个高效智能的arXiv论文推荐系统，让最新学术研究主动找到你。无论是科研工作者、学生还是技术从业者，都能通过这一工具大幅提升学术信息获取效率，将更多时间投入到创造性工作中。

zotero-arxiv-daily

Recommend new arxiv papers of your interest daily according to your Zotero libarary.

项目地址：https://gitcode.com/GitHub_Trending/zo/zotero-arxiv-daily

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

C++

415

298