语音识别前端开发新手指南：用Vue实战FunASR实时转写组件

2026-04-12 09:57:59作者：贡沫苏Truman

A Fundamental End-to-End Speech Recognition Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Recognition, Voice Activity Detection, Text Post-processing etc.

项目地址：https://gitcode.com/GitHub_Trending/fun/FunASR

场景介绍：为什么需要实时语音转写？

在视频会议、在线教育、智能客服等场景中，实时语音转写能极大提升沟通效率。想象一下：会议记录自动生成、直播内容实时字幕、客服对话即时存档——这些都离不开高效的语音识别前端组件。但开发过程中你可能会遇到：

音频流传输延迟导致转写不同步
识别结果刷新时界面闪烁
移动端兼容性问题
网络波动时连接中断

本文将带你用Vue框架从零构建一个稳定、高效的FunASR实时语音转写组件，解决这些痛点！

核心功能拆解：实时语音转写的技术要点

1. 音频流处理与WebSocket通信

实时语音转写的核心是建立稳定的音频数据传输通道。FunASR采用WebSocket协议实现低延迟通信，主要解决：

音频分块实时上传
识别结果流式返回
网络异常自动重连

2. 前端状态管理

需要维护的关键状态包括：

录音状态（准备/录制/暂停）
连接状态（未连接/连接中/已连接）
转写结果（临时结果/最终结果）
错误信息（网络错误/权限不足）

3. 视觉反馈设计

为提升用户体验，需实现：

音频波形动态显示
转写结果逐句追加
加载状态动画提示
错误状态清晰提示

开发步骤：从零搭建FunASR前端组件

环境准备

首先克隆项目并安装依赖：

git clone https://gitcode.com/GitHub_Trending/fun/FunASR
cd FunASR/web-pages
npm install

核心组件开发

1. WebSocket服务封装

创建src/services/funasrService.js封装通信逻辑：

export default class FunASRService {
  constructor() {
    this.ws = null;
    this.isConnected = false;
    this.callbacks = {
      onResult: () => {}, // 识别结果回调
      onError: () => {},  // 错误回调
      onStatusChange: () => {} // 状态变化回调
    };
  }

  // 建立WebSocket连接
  connect(serverUrl) {
    // 关闭已有连接
    if (this.ws) this.ws.close();
    
    this.ws = new WebSocket(serverUrl);
    
    // 连接成功处理
    this.ws.onopen = () => {
      this.isConnected = true;
      this.callbacks.onStatusChange('connected');
    };
    
    // 接收识别结果
    this.ws.onmessage = (event) => {
      const data = JSON.parse(event.data);
      this.callbacks.onResult(data);
    };
    
    // 错误处理
    this.ws.onerror = (error) => {
      this.callbacks.onError(error);
    };
    
    // 连接关闭处理
    this.ws.onclose = () => {
      this.isConnected = false;
      this.callbacks.onStatusChange('disconnected');
      // 自动重连逻辑
      setTimeout(() => this.connect(serverUrl), 3000);
    };
  }
  
  // 发送音频数据
  sendAudioChunk(chunk) {
    if (this.isConnected) {
      this.ws.send(chunk);
    } else {
      this.callbacks.onError(new Error('WebSocket未连接'));
    }
  }
  
  // 注册回调函数
  on(event, callback) {
    if (this.callbacks[event]) {
      this.callbacks[event] = callback;
    }
  }
  
  // 关闭连接
  disconnect() {
    if (this.ws) {
      this.ws.close();
    }
  }
}

2. 语音转写组件实现

创建src/components/SpeechTranscriber.vue：

<template>
  <div class="transcriber-container">
    <!-- 控制按钮区域 -->
    <div class="control-panel">
      <button 
        @click="toggleRecording" 
        :disabled="!isConnected"
        :class="{ recording: isRecording }"
      >
        {{ isRecording ? '停止录音' : '开始录音' }}
      </button>
      <div class="status-indicator" :class="connectionStatus"></div>
    </div>
    
    <!-- 音频波形显示 -->
    <div class="waveform" v-if="isRecording">
      <div class="wave-bar" v-for="(height, index) in wave Heights" :key="index" :style="{ height: `${height}px` }"></div>
    </div>
    
    <!-- 转写结果区域 -->
    <div class="transcriptBox">
      <div class="result-item" v-for="(item, index) in transcriptionResults" :key="index">
        <span class="timestamp">{{ item.timestamp }}</span>
        <span class="text" :class="{ final: item.isFinal }">{{ item.text }}</span>
      </div>
    </div>
  </div>
</template>

<script>
import FunASRService from '../services/funasrService';

export default {
  data() {
    return {
      isRecording: false,
      connectionStatus: 'disconnected',
      transcriptionResults: [],
      waveHeights: Array(30).fill(5), // 音频波形高度数组
      mediaRecorder: null,
      funasrService: new FunASRService()
    };
  },
  
  mounted() {
    // 初始化WebSocket连接
    this.funasrService.connect('wss://your-funasr-server/ws');
    
    // 注册回调
    this.funasrService.on('onResult', this.handleResult);
    this.funasrService.on('onStatusChange', (status) => {
      this.connectionStatus = status;
    });
  },
  
  methods: {
    // 处理识别结果
    handleResult(result) {
      this.transcriptionResults.push({
        text: result.text,
        timestamp: new Date().toLocaleTimeString(),
        isFinal: result.isFinal // 是否为最终结果
      });
      // 自动滚动到底部
      this.$nextTick(() => {
        const container = this.$el.querySelector('.transcriptBox');
        container.scrollTop = container.scrollHeight;
      });
    },
    
    // 开始/停止录音
    async toggleRecording() {
      if (this.isRecording) {
        this.stopRecording();
      } else {
        await this.startRecording();
      }
    },
    
    // 开始录音
    async startRecording() {
      try {
        const stream = await navigator.mediaDevices.getUserMedia({ audio: true });
        this.mediaRecorder = new MediaRecorder(stream);
        
        // 每100ms发送一次音频数据
        this.mediaRecorder.ondataavailable = (e) => {
          if (e.data.size > 0) {
            this.funasrService.sendAudioChunk(e.data);
            // 更新波形显示
            this.updateWaveform();
          }
        };
        
        this.mediaRecorder.start(100);
        this.isRecording = true;
      } catch (error) {
        console.error('录音权限获取失败:', error);
        alert('无法访问麦克风，请检查权限设置');
      }
    },
    
    // 停止录音
    stopRecording() {
      this.mediaRecorder.stop();
      this.mediaRecorder.stream.getTracks().forEach(track => track.stop());
      this.isRecording = false;
      // 重置波形
      this.waveHeights = Array(30).fill(5);
    },
    
    // 更新音频波形
    updateWaveform() {
      this.waveHeights = this.waveHeights.map(() => 
        Math.floor(Math.random() * 40) + 5
      );
    }
  },
  
  beforeDestroy() {
    this.funasrService.disconnect();
  }
};
</script>

<style scoped>
/* 样式省略 */
</style>

集成到主应用

在主页面中引入组件：

<template>
  <div id="app">
    <h1>FunASR实时语音转写</h1>
    <SpeechTranscriber />
  </div>
</template>

<script>
import SpeechTranscriber from './components/SpeechTranscriber.vue';

export default {
  components: {
    SpeechTranscriber
  }
};
</script>

避坑指南：常见问题解决方案

1. 音频数据格式问题

问题：不同浏览器对音频格式支持不同，导致服务端无法解析
解决方案：统一使用WebM格式录制音频

// 修改MediaRecorder初始化代码
this.mediaRecorder = new MediaRecorder(stream, {
  mimeType: 'audio/webm;codecs=opus'
});

2. 网络延迟导致结果不同步

问题：网络波动时，识别结果返回顺序混乱
解决方案：实现序列号机制

// 在发送音频时添加序列号
let sequenceNumber = 0;
this.mediaRecorder.ondataavailable = (e) => {
  if (e.data.size > 0) {
    const data = {
      sequence: sequenceNumber++,
      audio: e.data
    };
    this.funasrService.sendAudioChunk(JSON.stringify(data));
  }
};

3. 移动端兼容性问题

问题：部分移动浏览器不支持MediaRecorder API
解决方案：添加特性检测和降级处理

// 在startRecording方法中添加
if (!window.MediaRecorder) {
  alert('您的浏览器不支持录音功能，请使用最新版Chrome或Edge浏览器');
  return;
}

实际应用案例

案例1：在线会议实时记录

某企业会议系统集成FunASR组件后，实现：

多发言人实时转写
按发言人区分的文本颜色
会议内容实时存档
关键词快速检索

案例2：智能客服系统

客服平台接入后：

通话实时转写为文本
自动提取客户问题关键词
基于转写内容推荐回复话术
通话结束自动生成工单

案例3：在线教育实时字幕

教学平台应用场景：

讲师语音实时生成字幕
支持多语言实时翻译
学生可复制重点内容
课程内容自动索引

语音转写系统架构图：展示了从音频采集到最终文本输出的完整流程

总结

通过本文的实战指南，你已经掌握了使用Vue开发FunASR实时语音转写组件的核心技能。关键要点包括：

WebSocket实时通信的稳定实现
音频流的高效处理与传输
用户体验优化的视觉反馈设计
常见问题的解决方案

FunASR提供的强大语音识别能力，结合Vue的组件化开发模式，能帮助你快速构建专业的语音应用。无论是企业级会议系统还是个人项目，这套方案都能满足你的需求。现在就动手试试，打造属于你的语音转写应用吧！

FunASR

A Fundamental End-to-End Speech Recognition Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Recognition, Voice Activity Detection, Text Post-processing etc.

项目地址：https://gitcode.com/GitHub_Trending/fun/FunASR

登录后查看全文

项目优选

收起

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

Rust

581

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

语音识别前端开发新手指南：用Vue实战FunASR实时转写组件

场景介绍：为什么需要实时语音转写？

核心功能拆解：实时语音转写的技术要点

1. 音频流处理与WebSocket通信

2. 前端状态管理

3. 视觉反馈设计

开发步骤：从零搭建FunASR前端组件

环境准备

核心组件开发

1. WebSocket服务封装

2. 语音转写组件实现

集成到主应用

避坑指南：常见问题解决方案

1. 音频数据格式问题

2. 网络延迟导致结果不同步

3. 移动端兼容性问题

实际应用案例

案例1：在线会议实时记录

案例2：智能客服系统

案例3：在线教育实时字幕

总结

热门内容推荐

最新内容推荐

项目优选

语音识别前端开发新手指南：用Vue实战FunASR实时转写组件

场景介绍：为什么需要实时语音转写？

核心功能拆解：实时语音转写的技术要点

1. 音频流处理与WebSocket通信

2. 前端状态管理

3. 视觉反馈设计

开发步骤：从零搭建FunASR前端组件

环境准备

核心组件开发

1. WebSocket服务封装

2. 语音转写组件实现

集成到主应用

避坑指南：常见问题解决方案

1. 音频数据格式问题

2. 网络延迟导致结果不同步

3. 移动端兼容性问题

实际应用案例

案例1：在线会议实时记录

案例2：智能客服系统

案例3：在线教育实时字幕

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选