Python-glob2 项目技术文档
1. 安装指南
Python-glob2 是 Python 标准库中内置 glob 模块的扩展版本,它增加了一些新特性。要安装 Python-glob2,请按照以下步骤进行:
- 确保您的系统已安装 Python 2 或 Python 3(已测试 3.3 版本)。
- 打开命令行工具。
- 输入以下命令安装 Python-glob2:
pip install glob2
确保您的 pip 版本是最新的,如果不是,请先升级 pip:
pip install --upgrade pip
2. 项目使用说明
Python-glob2 提供了以下功能:
- 支持捕获与 glob 模式匹配的文本,并返回这些匹配项以及文件名。
- 支持递归的 '**' globbing 语法,类似于 bash shell 的
globstar选项。 - 允许替换文件系统函数,以便在虚拟文件系统上进行 glob 操作。
以下是使用 Python-glob2 的一些示例:
匹配返回
import glob2
for filename, (version,) in glob2.iglob('./binaries/project-*.zip', with_matches=True):
print(version)
递归 glob
import glob2
all_header_files = glob2.glob('src/**/*.h')
# 输出类似于 ['src/fs.h', 'src/media/mp3.h', 'src/media/mp3/frame.h', ...]
注意,** 必须单独出现在目录元素中才具有特殊含义。**h 将不会得到期望的效果。
** 将匹配当前目录下的点("."),如果这不是您想要的,可以使用 */**/*.py。
自定义 Globber
from glob2 import Globber
class VirtualStorageGlobber(Globber):
def __init__(self, storage):
self.storage = storage
def listdir(self, path):
# 如果路径不是目录,则必须引发 os.error
return self.storage.listdir(path)
def exists(self, path):
return self.storage.exists(path)
def isdir(self, path):
# 仅用于以斜杠结尾的语法(如:`foo/`)。
return self.storage.isdir(path)
def islink(self, path):
# 仅用于递归 glob(如:`**`)。
return self.storage.islink(path)
globber = VirtualStorageGlobber(sftp_storage)
globber.glob('/var/www/**/*.js')
如果无法为存储实现 isdir 和/或 islink 方法,可以将它们设置为返回一个固定值,这将导致以下后果:
-
如果
isdir返回True,则目录结尾的 glob 表达式将返回所有项目(包括非目录),如果返回False,则同样表达式将不返回任何内容。 -
如果
islink返回True,递归 globbing 语法**将跟随所有链接。如果返回False,它将完全不起作用。
3. 项目 API 使用文档
Python-glob2 的 API 包括以下方法和功能:
-
iglob(pattern, recursive=False, with_matches=False):返回一个生成器,生成所有与模式匹配的路径名。如果recursive为True,将使用递归搜索。with_matches为True时,将返回匹配的文本。 -
glob(pattern, recursive=False, with_matches=False):与iglob类似,但返回一个列表而不是生成器。 -
Globber类:允许自定义文件系统函数,用于在虚拟文件系统上进行 glob 操作。
4. 项目安装方式
请参考本文档的“安装指南”部分,安装方式是通过 pip 包管理工具进行安装。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00