ChinesePinyin 项目技术文档
2024-12-20 08:36:42作者:裴麒琰
1. 安装指南
通过 RubyGems 安装
你可以通过以下命令使用 RubyGems 安装 chinese_pinyin:
gem install chinese_pinyin
通过 Gemfile 安装
如果你使用的是 Ruby 项目,可以在 Gemfile 中添加以下内容:
gem 'chinese_pinyin'
然后运行 bundle install 来安装依赖。
2. 项目的使用说明
通过 CLI 使用
chinese_pinyin 提供了命令行工具 ch2py,可以通过命令行直接将中文转换为拼音。以下是一些常用的命令行选项:
$ ch2py -h
Usage: ch2py [opts]
-c, --camelcase Camelcase of each word
-i, --stdin Read from stdard input
-t, --tone Show tone at end of word
-m, --tonemarks Show tone at top of letter, this
would cover -t option
-s, --splitter <splitter> Splitter of each word, use a space
by default
-v, --version Show version
-h, --help Show this help
$ ch2py 中文
zhong wen
通过代码使用
你也可以在 Ruby 代码中使用 chinese_pinyin 库。以下是一些示例代码:
require 'chinese_pinyin'
# 基本用法
Pinyin.t('中国') # => "zhong guo"
# 自定义分隔符
Pinyin.t('中国', splitter: '-') # => "zhong-guo"
Pinyin.t('中国', splitter: '') # => "zhongguo"
# 显示声调
Pinyin.t('中国', tone: true) # => "zhong1 guo2"
Pinyin.t('中国', tonemarks: true) # => "zhōng guó"
# 自定义处理拼音
Pinyin.t('北京') { |letters| letters[0].upcase } # => 'BJ'
Pinyin.t('北京') { |letters, i| letters[0].upcase if i == 0 } # => 'B'
3. 项目API使用文档
Pinyin.t(text, options = {})
-
参数:
text(String): 需要转换的中文字符串。options(Hash): 可选参数,用于自定义转换行为。splitter(String): 拼音之间的分隔符,默认为空格。tone(Boolean): 是否在拼音后显示声调数字,默认为false。tonemarks(Boolean): 是否在拼音字母上显示声调符号,默认为false。
-
返回值:
- (String): 转换后的拼音字符串。
-
示例:
Pinyin.t('中国', splitter: '-') # => "zhong-guo" Pinyin.t('中国', tone: true) # => "zhong1 guo2"
自定义多音字处理
chinese_pinyin 支持通过 Words.dat 文件自定义多音字的处理方式。你可以通过设置环境变量 WORDS_FILE 来指定 Words.dat 文件的路径。
ENV['WORDS_FILE'] = "Words.dat path"
Pinyin.t('广州') # => "guang zhou"
4. 项目安装方式
通过 RubyGems 安装
gem install chinese_pinyin
通过 Gemfile 安装
在 Gemfile 中添加:
gem 'chinese_pinyin'
然后运行:
bundle install
通过以上步骤,你可以成功安装并使用 chinese_pinyin 项目。
登录后查看全文
热门项目推荐
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00
项目优选
收起
deepin linux kernel
C
24
9
Ascend Extension for PyTorch
Python
223
245
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
9
1
暂无简介
Dart
672
157
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
662
313
React Native鸿蒙化仓库
JavaScript
262
323
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
64
19
仓颉编译器源码及 cjdb 调试工具。
C++
134
867
仓颉编程语言测试用例。
Cangjie
37
860
openGauss kernel ~ openGauss is an open source relational database management system
C++
160
218