基于Kotlin与Spring AI构建智能文档问答系统实践指南

2025-06-09 11:02:15作者：宣聪麟

前言

在现代应用开发中，将人工智能能力集成到系统中已成为提升用户体验的重要手段。本文将详细介绍如何使用Kotlin语言结合Spring AI框架，构建一个基于检索增强生成(RAG)技术的智能文档问答系统。该系统能够自动理解用户问题，并从Kotlin标准库文档中检索相关信息，生成专业准确的回答。

技术栈概述

本项目采用以下核心技术组件：

Spring Boot 3.4.3：现代Java/Kotlin应用框架
Kotlin 1.9.21：JetBrains开发的现代化编程语言
Spring AI：Spring生态的AI集成框架
Qdrant：高性能向量数据库
OpenAI GPT：大型语言模型服务

环境准备

1. 获取OpenAI API密钥

访问OpenAI平台创建API密钥，这是访问GPT模型服务的凭证。创建后设置环境变量：

# macOS/Linux
export OPENAI_API_KEY="your_api_key_here"

# Windows
setx OPENAI_API_KEY "your_api_key_here"

注意：OpenAI API是付费服务，使用前请了解其定价策略。Spring AI也支持其他LLM提供商，可根据需要切换。

2. 部署Qdrant向量数据库

使用Docker快速启动Qdrant服务：

docker run -p 6333:6333 -p 6334:6334 qdrant/qdrant

端口6333：Qdrant管理界面
端口6334：应用交互端口

项目初始化

1. 创建Spring Boot项目

使用Gradle构建工具创建项目，主要依赖包括：

spring-boot-starter-web
spring-ai-starter-model-openai
spring-ai-starter-vector-store-qdrant

build.gradle.kts关键配置示例：

plugins {
    kotlin("jvm") version "2.1.21"
    id("org.springframework.boot") version "3.5.0"
}

dependencies {
    implementation("org.springframework.boot:spring-boot-starter-web")
    implementation("org.springframework.ai:spring-ai-starter-model-openai")
    implementation("org.springframework.ai:spring-ai-starter-vector-store-qdrant")
    implementation("org.springframework.ai:spring-ai-advisors-vector-store")
}

2. 应用配置

application.properties关键配置：

# OpenAI配置
spring.ai.openai.api-key=${OPENAI_API_KEY}
spring.ai.openai.chat.options.model=gpt-4

# Qdrant配置
spring.ai.vectorstore.qdrant.host=localhost
spring.ai.vectorstore.qdrant.port=6334
spring.ai.vectorstore.qdrant.collection-name=kotlinDocs

核心功能实现

1. 文档加载模块

创建REST控制器加载Kotlin标准库文档：

@RestController
@RequestMapping("/kotlin")
class KotlinSTDController(
    private val restTemplate: RestTemplate,
    private val vectorStore: VectorStore
) {
    @PostMapping("/load-docs")
    fun load() {
        val topics = listOf("collections-overview", "constructing-collections", /*...*/)
        topics.forEach { topic ->
            val content = restTemplate.getForObject("$BASE_URL$topic.md", String::class.java)
            content?.let {
                val doc = Document.builder()
                    .id(UUID.randomUUID().toString())
                    .text(it)
                    .metadata("topic", topic)
                    .build()
                vectorStore.add(listOf(doc))
            }
        }
    }
}

2. 文档检索功能

实现相似度搜索接口：

@GetMapping("/docs")
fun query(
    @RequestParam query: String,
    @RequestParam topK: Int = 2
): List<Document>? {
    return vectorStore.similaritySearch(
        SearchRequest.builder()
            .query(query)
            .topK(topK)
            .build()
    )
}

3. RAG问答系统

集成检索增强生成技术：

@PostMapping("/chat/ask")
fun chatAsk(@RequestBody request: ChatRequest): String? {
    val promptTemplate = PromptTemplate("""
        {query}.
        请基于"Kotlin标准库"文档提供简洁回答。
    """.trimIndent())
    
    val retrievalAdvisor = QuestionAnswerAdvisor.builder(vectorStore)
        .searchRequest(SearchRequest.builder()
            .similarityThreshold(0.7)
            .topK(request.topK)
            .build())
        .build()
    
    return chatClient.prompt(promptTemplate.create(mapOf("query" to request.query)))
        .advisors(retrievalAdvisor)
        .call()
        .content()
}

系统测试

1. 加载文档

curl -X POST http://localhost:8080/kotlin/load-docs

2. 执行查询

curl -X GET "http://localhost:8080/kotlin/docs?query=collection operations"

3. 智能问答

curl -X POST "http://localhost:8080/kotlin/chat/ask" \
     -H "Content-Type: application/json" \
     -d '{"query": "Kotlin中序列(Sequence)与集合(Collection)的主要性能区别是什么？"}'

预期获得基于文档的专业回答，解释两种数据结构在不同场景下的性能特点。