SIP.js中实现音频通话转视频通话的技术方案

2025-07-06 11:47:53作者：裘旻烁

背景介绍

在基于WebRTC的实时通信应用中，经常需要实现通话过程中的媒体流切换功能，例如将纯音频通话升级为视频通话。SIP.js作为一款强大的JavaScript SIP协议库，为开发者提供了实现这一功能的完整工具链。

核心问题分析

在SIP.js 0.21.2版本中，开发者尝试通过重新发送INVITE请求（即Re-invite）来将已建立的音频通话转换为视频通话时，遇到了ICE候选信息相关的错误。这表明在媒体协商过程中，ICE（Interactive Connectivity Establishment）重新协商环节出现了问题。

技术原理

WebRTC的ICE框架负责建立和维护点对点连接。当需要更改媒体类型时，需要：

重新进行SDP协商
重新建立ICE连接
更新媒体流轨道

默认情况下，SIP.js的会话描述处理器(SessionDescriptionHandler)不会自动触发ICE重启，这会导致媒体流变更失败。

解决方案

通过深入研究SIP.js的源码和WebRTC规范，发现需要显式设置iceRestart选项来强制ICE重新协商：

sessionDescriptionHandlerOptions: {
  constraints: { 
    audio: true, 
    video: true 
  },
  offerOptions: {
    iceRestart: true
  }
}

实现细节

类型扩展：由于SIP.js的类型定义中默认不包含offerOptions，需要手动扩展SessionDescriptionHandlerOptions接口：

interface SessionDescriptionHandlerOptions {
  constraints?: object;
  offerOptions?: RTCOfferOptions;
}

完整调用流程：

// 初始音频呼叫
const inviter = new Inviter(userAgent, destination, {
  sessionDescriptionHandlerOptions: {
    constraints: { audio: true, video: false }
  }
});

// 建立连接后升级为视频
inviter.invite({
  sessionDescriptionHandlerOptions: {
    constraints: { audio: true, video: true },
    offerOptions: { iceRestart: true }
  }
});