GoToSocial v0.19.0 发布:社交网络服务的重大升级
GoToSocial 是一个轻量级的 ActivityPub 社交网络服务器,采用 Go 语言编写,旨在提供 Mastodon 兼容的联邦社交网络服务。它特别适合个人或小型社区使用,具有资源占用低、配置简单等特点。
最新发布的 v0.19.0 版本代号为"Seditious Sloth"(叛逆的树懒),带来了多项重要功能更新和安全增强,是 GoToSocial 发展历程中的一个重要里程碑。
核心功能增强
OAuth 令牌范围强制实施
在此版本中,OAuth 令牌的范围(如 read、write 等)终于实现了真正的功能控制。这意味着应用开发者现在可以精确控制第三方应用对用户账户的访问权限,与 Mastodon API 的令牌范围保持一致,为开发者提供了更熟悉的开发体验。
令牌管理与应用控制
新增了令牌审查和撤销功能,用户现在可以在设置面板中查看和管理所有已授权的访问令牌,增强了账户安全性。同时,用户可以直接在设置面板中创建和管理应用程序,这对运行机器人和开发第三方应用的用户特别有用。
个人资料布局选项
引入了"画廊"风格的资料布局选项,用户可以选择以类似 Instagram 的网格形式展示个人资料。这种布局特别适合主要发布媒体内容的用户,能够更好地突出展示图片和视频。
双重认证(2FA)支持
对于未配置 OIDC 提供者的实例,现在支持通过二维码和认证应用设置双重认证。启用 2FA 后,登录时需要提供基于时间的一次性密码(TOTP),大大增强了账户安全性。
技术改进与优化
数据库迁移注意事项
此版本包含重要的数据库迁移,特别是对 accounts 表进行了重构。管理员在升级时需要特别注意:
- 确保有足够的磁盘空间(建议等于当前数据库大小)
- 备份数据库(SQLite 用户只需复制 sqlite.db 文件)
- 不要中断迁移过程
- 迁移时间可能从几秒到十分钟不等,取决于硬件性能
Web 界面优化
新版本对 Web 界面进行了多项改进:
- Chrome 浏览器上更美观的媒体渲染
- 完整的 blurhash 支持
- 大幅改进的键盘导航支持
- 更广泛的字体支持(针对不同文字系统)
- 更整洁的状态信息栏
兼容性修复
特别修复了与 bandwagon.fm 的兼容性问题,现在用户可以关注 Bandwagon.fm 艺术家并接收他们的帖子和公告。同时改进了域权限管理,现在可以直接编辑混淆、公开和私有注释字段,而无需删除并重新创建权限。
升级建议
对于系统管理员,升级时需要注意:
- 停止 GoToSocial 服务
- 备份数据库
- 下载并解压新版本(包含 Web 资源和 HTML 模板)
- 根据需要编辑 config.yaml 文件
- 启动服务并等待迁移完成
- 注意所有用户将被登出设置面板,需要重新登录
Docker 用户可以使用 superseriousbusiness/gotosocial:0.19.0 或 superseriousbusiness/gotosocial:latest 镜像进行升级。
总结
GoToSocial v0.19.0 通过引入 OAuth 范围控制、2FA 认证、应用管理等重要功能,显著提升了平台的安全性和可用性。同时,性能优化和界面改进也提升了用户体验。对于正在寻找轻量级、自托管社交网络解决方案的用户和开发者来说,这个版本值得考虑升级。
特别值得注意的是,项目团队在保持轻量级特性的同时,不断向主流社交网络功能靠拢,体现了 GoToSocial 作为 ActivityPub 生态系统重要成员的持续发展态势。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00