Zotero-arXiv-Daily：零成本构建个性化学术推送系统

2026-04-07 12:56:23作者：尤峻淳Whitney

一、核心价值：重新定义学术文献发现方式

1.1 自动化工作流的学术价值

Zotero-arXiv-Daily 是一款基于 GitHub Actions 的开源工具，它能深度分析你的 Zotero 图书馆内容，每天自动推送个性化的 arXiv 论文推荐到邮箱。整个流程无需本地部署，完全依托 GitHub 的免费算力运行，真正实现"一次配置，终身受益"的学术追踪体验 🔬

1.2 三大核心优势解析

零成本自动化：利用 GitHub Actions 定时任务机制，省去服务器维护成本
个性化推荐：基于你的 Zotero 文献库内容进行相关性匹配，避免信息过载
极简配置：无需编程背景，通过界面化操作即可完成全部设置

二、场景化配置：从入门到精通的实践指南

2.1 快速启动：5分钟最小化配置

2.1.1 获取项目代码

# 克隆项目到本地
git clone https://gitcode.com/GitHub_Trending/zo/zotero-arxiv-daily

⚠️ 注意：确保你的 GitHub 账户已登录，否则可能无法正常访问仓库。如果遇到网络问题，可尝试使用 SSH 协议克隆。

2.1.2 核心四步配置法

创建项目副本
访问项目页面后点击右上角"Fork"按钮，将项目复制到你的个人仓库中。
获取Zotero凭证
登录 Zotero 账户，在"设置 > 隐私"页面找到你的 User ID，然后在"设置 > 应用"中创建 API Key。
配置关键环境变量
在仓库的"Settings > Secrets and variables > Actions"页面添加以下必要配置：
- ZOTERO_ID: 你的Zotero用户ID
- ZOTERO_KEY: 创建的API密钥
- ARXIV_QUERY: 感兴趣的论文分类（如cs.AI+stat.ML）
- RECEIVER: 接收邮件的地址
手动触发首次运行
在仓库的"Actions"页面选择"Send emails daily"工作流，点击"Run workflow"按钮启动第一次执行。

2.2 完整配置指南：进阶参数详解

2.2.1 环境变量配置表

配置类别	参数名称	说明	必要性
Zotero配置	ZOTERO_ID	Zotero账户唯一标识	必需
	ZOTERO_KEY	API访问密钥	必需
邮件配置	SMTP_SERVER	邮件服务器地址	必需
	SMTP_PORT	邮件服务器端口	必需
	SENDER	发件人邮箱	必需
	SENDER_PASSWORD	发件人密码/授权码	必需
	RECEIVER	收件人邮箱	必需
内容控制	MAX_PAPER_NUM	最大推荐论文数	可选（默认10）
	SEND_EMPTY	无新论文时是否发送邮件	可选（默认false）
LLM增强	USE_LLM_API	是否启用AI摘要	可选（默认false）
	OPENAI_API_KEY	AI服务访问密钥	可选

2.2.2 配置项优先级说明

仓库Secrets（加密存储）优先于Variables（明文存储）
环境变量会覆盖config目录下的YAML配置文件
未设置的参数将使用default.yaml中的默认值

效率Tip：对于非敏感的自定义配置，可在Actions Variables中设置CUSTOM_CONFIG变量，通过YAML格式统一管理多个参数。

2.3 常见问题预判与解决

2.3.1 邮件发送失败

排查步骤：检查SMTP服务器设置是否正确，特别是端口号（通常587或465）
常见原因：未开启邮箱SMTP服务，或使用了邮箱登录密码而非授权码
解决方案：在邮箱设置中开启"SMTP服务"，生成专用授权码

2.3.2 推荐结果相关性低

优化方案：
1. 丰富Zotero库中相关领域的文献
2. 调整ARXIV_QUERY参数，使用更精确的分类
3. 启用LLM增强功能提升摘要质量

三、实践拓展：从工具到学术生产力系统

3.1 行业应用场景深度解析

3.1.1 科研工作者的文献追踪系统

应用场景：计算机视觉研究者需要跟踪最新论文 实施步骤：

在Zotero中建立"计算机视觉"分类文件夹
配置ARXIV_QUERY为"cs.CV"
设置MAX_PAPER_NUM=15，确保覆盖重要研究
启用LLM摘要功能，自动生成论文核心观点

效果：每天早晨收到包含15篇最新CV论文的邮件，每篇附带相关性评分和AI生成的TLDR摘要，帮助快速筛选重要文献。

3.1.2 研究生开题阶段的文献调研

应用场景：研究生在开题阶段需要全面了解某领域研究现状 实施策略：

收集该领域经典文献存入Zotero
设置ARXIV_QUERY为多个相关分类（如cs.AI+cs.LG+stat.ML）
配置SEND_EMPTY=true，确保即使无新论文也收到状态报告
定期导出推荐历史，分析领域研究趋势

价值：避免遗漏重要研究，同时通过历史推荐构建领域知识图谱。

3.2 进阶功能探索

3.2.1 API扩展开发示例

项目提供了灵活的扩展接口，以下是添加新论文来源的示例代码：

# 在src/zotero_arxiv_daily/retriever/目录下创建新文件
from .base import BaseRetriever

class PubMedRetriever(BaseRetriever):
    """PubMed论文检索器"""
    
    def __init__(self, api_key):
        self.api_key = api_key
        self.base_url = "https://eutils.ncbi.nlm.nih.gov/entrez/eutils/"
    
    def search(self, query, max_results=10):
        # 实现PubMed API调用逻辑
        pass

3.2.2 本地运行与调试

对于开发者，可在本地环境运行项目进行调试：

# 创建虚拟环境
python -m venv venv
source venv/bin/activate  # Linux/Mac
venv\Scripts\activate     # Windows

# 安装依赖
pip install -r requirements.txt

# 本地运行
python src/zotero_arxiv_daily/main.py --config config/custom.yaml

3.3 生态系统与资源扩展

3.3.1 推荐系统增强工具

Zotero Better BibTeX：优化文献元数据管理，提升推荐准确性
arxiv-sanity-preserver：构建个人论文数据库，与本项目互补使用

3.3.2 学术工作流整合

将Zotero-arXiv-Daily与以下工具结合，构建完整学术工作流：

Notion：将重要论文摘要同步到Notion数据库
Obsidian：通过Zotero插件实现文献笔记双向链接
Zotero Connector：一键将推荐论文添加到图书馆

3.4 实际应用效果展示

成功配置后，你将收到类似以下内容的每日邮件，包含论文标题、作者、相关性评分和简要摘要：

每篇论文都提供直达PDF和代码仓库的链接，方便快速获取全文。通过持续使用，系统会逐渐学习你的研究兴趣，推荐质量将不断提升。

结语

Zotero-arXiv-Daily不仅是一个工具，更是学术研究者的"文献雷达"。通过将Zotero的文献管理能力与GitHub Actions的自动化优势相结合，它彻底改变了传统的学术追踪方式。无论是初入科研领域的研究生，还是需要保持学术敏感度的资深学者，都能从中获得显著的效率提升。现在就开始配置，让最新研究动态主动找到你！ 🚀

zotero-arxiv-daily

Recommend new arxiv papers of your interest daily according to your Zotero libarary.

项目地址：https://gitcode.com/GitHub_Trending/zo/zotero-arxiv-daily

登录后查看全文