在Inkwell中使用LLVM IR实现标准输入读取功能

2025-06-30 08:20:35作者：舒璇辛Bertina

Inkwell是一个基于Rust的LLVM绑定库，它允许开发者在Rust中生成LLVM IR代码。本文将介绍如何在Inkwell项目中实现从标准输入读取数据的功能，这是许多程序都需要的基础操作。

理解标准输入读取的原理

在C语言中，我们通常使用fgets函数从标准输入(stdin)读取数据。fgets需要三个参数：

用于存储读取数据的字符缓冲区指针
要读取的最大字符数
文件指针(FILE*)，对于标准输入通常是stdin

在Unix-like系统中，标准输入的文件描述符(fd)固定为0。我们可以使用fdopen函数将这个文件描述符转换为FILE*指针。

在Inkwell中声明外部函数

首先需要在Inkwell模块中声明这两个C标准库函数：

// 声明fdopen函数: FILE* fdopen(int fildes, const char *mode)
let fn_type = ptr_ty.fn_type(&[i32_ty.into(), ptr_ty.into()], false);
module.add_function("fdopen", fn_type, Some(Linkage::External));

// 声明fgets函数: char* fgets(char*, int, FILE*)
let fn_type = ptr_ty.fn_type(&[ptr_ty.into(), i32_ty.into(), ptr_ty.into()], false);
module.add_function("fgets", fn_type, Some(Linkage::External));

这里ptr_ty表示指针类型，i32_ty表示32位整数类型。Linkage::External表示这些函数是在外部定义的。

获取标准输入的文件指针

在LLVM IR中调用fdopen来获取标准输入的文件指针：

let zero = i32_ty.const_zero();  // 文件描述符0表示标准输入
let mode_array = (创建表示"r"模式的字符数组);
let mode_ptr = builder.build_alloca(mode_array.get_type(), "mode").unwrap();
builder.build_store(mode_ptr, mode_array).unwrap();

let stdin = builder.build_call(
    module.get_function("fdopen").unwrap(),
    &[zero.into(), mode_ptr.into()],
    "call_to_fdopen"
).unwrap().try_as_basic_value().left().unwrap();

调用fgets读取输入

有了文件指针后，就可以调用fgets读取输入了：

let max = i32_ty.const_int(MAX_IN_STRING_LEN, false);  // 最大读取长度
let _ = builder.build_call(
    module.get_function("fgets").unwrap(),
    &[dest_ptr.into(), max.into(), stdin.into()],
    "call_to_fgets"
).unwrap().try_as_basic_value().left().unwrap();