Prosodic 技术文档
1. 安装指南
1.1 安装 Python 包
首先,您需要通过 pip 安装 Prosodic 包。确保您的 Python 版本 >= 3.9。
pip install prosodic
1.2 安装 espeak
Prosodic 依赖于 espeak 来进行文本到语音的转换。请根据您的操作系统安装 espeak:
-
Mac: 使用 Homebrew 安装:
brew install espeak如果尚未安装 Homebrew,请先安装 Homebrew。
-
Linux: 使用 apt-get 安装:
sudo apt-get install espeak libespeak1 libespeak-dev -
Windows: 从 espeak-ng 的 GitHub 页面 下载并安装。
2. 项目的使用说明
2.1 Web 应用
Prosodic 提供了一个基于 Web 的图形用户界面(GUI)。安装完成后,您可以通过以下命令启动 Web 应用:
prosodic web
启动后,在浏览器中访问 http://127.0.0.1:8181/ 即可使用 Prosodic 的 Web 界面。
2.2 Python 使用
2.2.1 读取文本
您可以通过 Python 脚本加载并分析文本。以下是一个简单的示例:
import prosodic
# 加载文本
sonnet = prosodic.Text("""
Those hours, that with gentle work did frame
The lovely gaze where every eye doth dwell,
Will play the tyrants to the very same
And that unfair which fairly doth excel;
For never-resting time leads summer on
To hideous winter, and confounds him there;
Sap checked with frost, and lusty leaves quite gone,
Beauty o’er-snowed and bareness every where:
Then were not summer’s distillation left,
A liquid prisoner pent in walls of glass,
Beauty’s effect with beauty were bereft,
Nor it, nor no remembrance what it was:
But flowers distill’d, though they with winter meet,
Leese but their show; their substance still lives sweet.
""")
# 也可以通过文件名加载文本
shaksonnets = prosodic.Text(fn='corpora/corppoetry_en/en.shakespeare.txt')
2.2.2 文本结构
Prosodic 将文本组织成树状结构。Text 对象的 .children 属性是一个 Stanza 列表,每个 Stanza 的 .parent 属性指向 Text 对象。每个 Stanza 的 .children 属性是一个 Line 列表,依此类推。
# 查看文本的树状结构
sonnet.show(maxlines=30, incl_phons=True)
2.2.3 数据框表示
您还可以将文本转换为数据框形式进行查看:
# 查看音节级别的数据框表示
sonnet.df
3. 项目 API 使用文档
3.1 prosodic.Text
prosodic.Text 是 Prosodic 的核心类,用于加载和分析文本。它支持从字符串或文件加载文本。
3.1.1 方法
Text(text=None, fn=None): 初始化一个Text对象。text参数为文本字符串,fn参数为文件名。show(maxlines=None, incl_phons=False): 显示文本的树状结构。maxlines参数限制显示的行数,incl_phons参数决定是否包含音素信息。df: 返回文本的音节级别数据框表示。
3.2 prosodic.Stanza 和 prosodic.Line
Stanza 和 Line 类分别表示文本中的诗节和行。它们通过 .children 和 .parent 属性与 Text 对象关联。
4. 项目安装方式
Prosodic 的安装方式已在 1. 安装指南 中详细介绍。您可以通过 pip 安装 Prosodic 包,并根据操作系统安装 espeak 以支持文本到语音的转换。
通过本文档,您应该能够顺利安装并使用 Prosodic 进行文本分析。如果您有任何问题,请参考官方文档或联系开发者。
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00- QQwen3-Coder-Next2026年2月4日,正式发布的Qwen3-Coder-Next,一款专为编码智能体和本地开发场景设计的开源语言模型。Python00
xw-cli实现国产算力大模型零门槛部署,一键跑通 Qwen、GLM-4.7、Minimax-2.1、DeepSeek-OCR 等模型Go06
PaddleOCR-VL-1.5PaddleOCR-VL-1.5 是 PaddleOCR-VL 的新一代进阶模型,在 OmniDocBench v1.5 上实现了 94.5% 的全新 state-of-the-art 准确率。 为了严格评估模型在真实物理畸变下的鲁棒性——包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化——我们提出了 Real5-OmniDocBench 基准测试集。实验结果表明,该增强模型在新构建的基准测试集上达到了 SOTA 性能。此外,我们通过整合印章识别和文本检测识别(text spotting)任务扩展了模型的能力,同时保持 0.9B 的超紧凑 VLM 规模,具备高效率特性。Python00
KuiklyUI基于KMP技术的高性能、全平台开发框架,具备统一代码库、极致易用性和动态灵活性。 Provide a high-performance, full-platform development framework with unified codebase, ultimate ease of use, and dynamic flexibility. 注意:本仓库为Github仓库镜像,PR或Issue请移步至Github发起,感谢支持!Kotlin08
VLOOKVLOOK™ 是优雅好用的 Typora/Markdown 主题包和增强插件。 VLOOK™ is an elegant and practical THEME PACKAGE × ENHANCEMENT PLUGIN for Typora/Markdown.Less00