zotero-arxiv-daily完全指南:Zotero驱动的自动化论文推送的零成本学术追踪方案
zotero-arxiv-daily是一款基于Zotero图书馆内容的开源项目,能够每日推荐相关的arXiv论文并发送到指定邮箱。该项目借助GitHub Actions工作流,实现了无需安装、零成本配置的每日自动推送功能,为科研工作者提供了高效的学术追踪解决方案。
【1. 价值解析:重新定义学术追踪方式】
传统学术追踪需要手动检索 arXiv 论文,耗时且容易遗漏重要文献。zotero-arxiv-daily 项目通过深度整合 Zotero 图书馆数据与 arXiv 论文库,实现了个性化推荐的自动化。用户只需完成一次配置,即可每日收到与自己研究方向高度匹配的最新论文,将科研人员从繁琐的文献筛选工作中解放出来,让学术追踪变得轻松高效。
【2. 环境准备:启动前的必要检查】
【2.1 账户准备】
在开始使用 zotero-arxiv-daily 之前,需要确保拥有以下账户:
- Zotero 账户:用于提供个人图书馆数据
- GitHub 账户:用于运行自动化工作流
- 邮箱账户:用于接收论文推荐邮件(建议使用 QQ 邮箱、163 邮箱等支持 SMTP 服务的邮箱)
【2.2 环境依赖】
该项目基于 GitHub Actions 运行,无需在本地安装任何软件。只需确保您的 GitHub 账户具有创建仓库和配置 Secrets 的权限。
【3. 流程配置:从基础到高级的完整设置】
【3.1 项目部署】
git clone https://gitcode.com/GitHub_Trending/zo/zotero-arxiv-daily
将克隆的项目推送到您自己的 GitHub 仓库,以便进行后续配置。
【3.2 基础参数配置】
在项目仓库中,进入 Settings > Secrets,添加以下系统配置项:
核心配置项说明
| 配置项名称 | 说明 | 示例值 |
|---|---|---|
| ZOTERO_ID | Zotero账户的用户ID | 1234567 |
| ZOTERO_KEY | 具有读取权限的Zotero API密钥 | 789abcdef123456 |
| ARXIV_QUERY | 目标arXiv论文分类,用+连接多个分类 | cs.AI+cs.LG |
| SMTP_SERVER | 发送邮件的SMTP服务器 | smtp.qq.com |
| SMTP_PORT | SMTP服务器端口 | 465 |
| SENDER | 发送者邮件账户 | example@qq.com |
| SENDER_PASSWORD | 发送者账户密码(部分邮箱需使用授权码) | abcdef123456 |
| RECEIVER | 接收论文列表的邮件地址 | research@example.com |
💡小贴士:推荐使用QQ邮箱SMTP服务(端口465),配置简单且稳定性高。获取ZOTERO_ID的方法:登录Zotero后,在设置页面的Feeds标签页中可以找到您的用户ID。
【3.3 高级参数配置】
除了基础配置外,还可以添加以下高级配置项来优化推荐效果:
高级配置项说明
| 配置项名称 | 说明 | 默认值 |
|---|---|---|
| MAX_PAPER_NUM | 邮件中展示的论文最大数量 | 10 |
| SEND_EMPTY | 是否在没有新论文时发送空邮件 | false |
| USE_LLM_API | 是否使用云端LLM API进行智能推荐 | false |
| OPENAI_API_KEY | LLM API访问密钥(当USE_LLM_API为true时需要) | 无 |
| MODEL_NAME | 使用的LLM模型名称 | gpt-3.5-turbo |
【3.4 工作流触发】
完成配置后,在项目仓库的Actions页面中,选择"Send emails daily"工作流,点击"Run workflow"按钮手动触发工作流,测试配置是否正确。
📌触发工作流后,系统将开始执行论文推荐流程,通常在几分钟内完成。您可以在Actions页面查看工作流执行状态和日志信息。
【4. 个性化推荐调优】
【4.1 ARXIV_QUERY高级用法】
ARXIV_QUERY参数支持复杂的检索表达式,帮助您精确筛选感兴趣的论文:
- 使用+连接多个分类:
cs.AI+cs.LG表示同时关注人工智能和机器学习领域 - 使用"-"排除特定分类:
cs.AI -cat:cs.CV表示关注人工智能但排除计算机视觉 - 使用关键词检索:
ti:reinforcement+learning表示标题包含"reinforcement learning"的论文
💡小贴士:可以在arXiv官网先测试检索表达式,获得满意结果后再将其填入ARXIV_QUERY配置项。
【4.2 推荐算法调整】
项目支持通过修改配置文件来自定义推荐算法的行为。在config/custom.yaml文件中,您可以调整以下参数:
similarity_threshold:相似度阈值,控制推荐结果的相关性max_history_days:考虑的历史论文时间范围category_weight:不同论文分类的权重设置
【5. 场景拓展:从个人到团队的应用方案】
【5.1 研究生版:个人学术追踪方案】
对于研究生而言,zotero-arxiv-daily可以帮助您:
- 保持对研究领域最新进展的关注
- 发现潜在的参考文献和研究方向
- 减少文献检索时间,专注于研究本身
配置建议:
- ARXIV_QUERY设置为自己的研究方向(如cs.AI+stat.ML)
- MAX_PAPER_NUM设置为15-20,确保不会错过重要文献
- 定期更新Zotero图书馆,保持推荐的准确性
【5.2 科研团队版:多账户协作方案】
对于科研团队,可以通过以下方式配置共享的论文推荐系统:
- 创建团队共享的Zotero群组图书馆
- 使用团队共享邮箱接收推荐邮件
- 配置多个ARXIV_QUERY分类,覆盖团队的多个研究方向
实现方法:
- 在Zotero中创建群组,邀请团队成员加入
- 在项目配置中使用群组ID和API密钥
- 设置RECEIVER为团队邮件列表
【6. 常见问题速解】
Q1: 为什么我没有收到推荐邮件?
A1: 可能的原因包括:
- 工作流执行失败:检查Actions页面的工作流日志
- 邮件被归类为垃圾邮件:检查邮箱的垃圾邮件文件夹
- 没有符合条件的新论文:可以将SEND_EMPTY设置为true,在没有新论文时也发送通知邮件
Q2: 如何提高推荐论文的相关性?
A2: 可以通过以下方法优化:
- 丰富Zotero图书馆内容,添加更多相关领域的论文
- 调整ARXIV_QUERY参数,使用更精确的检索表达式
- 启用LLM API功能,通过人工智能提升推荐质量
Q3: 工作流执行频率可以调整吗?
A3: 可以。默认配置为每日执行一次,您可以修改.github/workflows/main.yml文件中的schedule参数来自定义执行频率。例如,设置为每12小时执行一次:
schedule:
- cron: '0 */12 * * *'
通过以上配置和优化,zotero-arxiv-daily将成为您学术研究的得力助手,帮助您高效追踪领域前沿,发现有价值的研究成果。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
LongCat-AudioDiT-1BLongCat-AudioDiT 是一款基于扩散模型的文本转语音(TTS)模型,代表了当前该领域的最高水平(SOTA),它直接在波形潜空间中进行操作。00
jiuwenclawJiuwenClaw 是一款基于openJiuwen开发的智能AI Agent,它能够将大语言模型的强大能力,通过你日常使用的各类通讯应用,直接延伸至你的指尖。Python0248- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
AtomGit城市坐标计划AtomGit 城市坐标计划开启!让开源有坐标,让城市有星火。致力于与城市合伙人共同构建并长期运营一个健康、活跃的本地开发者生态。01
HivisionIDPhotos⚡️HivisionIDPhotos: a lightweight and efficient AI ID photos tools. 一个轻量级的AI证件照制作算法。Python05


