grpc-java 1.68.1版本中RetryingNameResolver同步上下文问题分析

2025-05-19 06:33:14作者：曹令琨Iris

问题背景

在grpc-java 1.68.1版本中，用户在使用pekko-grpc时遇到了一个与RetryingNameResolver相关的重要兼容性问题。当尝试进行名称解析时，系统会抛出"Not called from the SynchronizationContext"的异常，导致服务无法正常工作。

问题现象

具体错误表现为：

java.lang.IllegalStateException: Not called from the SynchronizationContext
    at com.google.common.base.Preconditions.checkState(Preconditions.java:515)
    at io.grpc.SynchronizationContext.throwIfNotInThisSynchronizationContext(SynchronizationContext.java:134)
    at io.grpc.internal.ManagedChannelImpl$NameResolverListener.onResult2(ManagedChannelImpl.java:1686)
    at io.grpc.internal.RetryingNameResolver$RetryingListener.onResult2(RetryingNameResolver.java:107)
    at io.grpc.NameResolver$Listener2.onAddresses(NameResolver.java:228)

问题根源

这个问题源于grpc-java 1.68.1版本中对NameResolver接口实现的修改。在新版本中，gRPC要求所有对NameResolver.Listener的回调必须在SynchronizationContext上下文中执行。然而，pekko-grpc的实现使用了Scala的Future进行异步操作，这导致回调发生在错误的上下文中。

具体来说，NameResolver.Listener.onAddresses方法的抽象基类实现在调用onResult2时没有确保在同步上下文中执行，而ManagedChannelImpl的Listener2实现现在会严格检查这一点。

技术影响

这个问题对使用pekko-grpc的用户产生了以下影响：

无法直接升级到grpc-java 1.68.1版本
需要修改现有代码以确保回调在正确的上下文中执行
影响了基于Scala Future的异步名称解析实现

解决方案

grpc-java团队已经意识到这个问题并在1.68.2版本中修复了它。修复方式包括：

确保NameResolver.Listener.onAddresses方法在调用onResult2时处于正确的同步上下文中
修复了其他类似的调用点

对于使用pekko-grpc的用户，有以下几种应对方案：

暂时降级到grpc-java 1.67.1版本（推荐短期方案）
等待升级到包含修复的1.68.2版本
修改pekko-grpc的实现，在调用监听器前确保切换到正确的同步上下文

最佳实践建议

对于gRPC客户端开发者，建议：

在实现自定义NameResolver时，始终通过NameResolver.Args.getSynchronizationContext()获取同步上下文
所有对Listener的回调都应该在同步上下文中执行
对于异步操作的结果处理，使用syncContext.execute包装回调代码

对于pekko-grpc用户，建议暂时停留在1.67.1版本，直到可以安全升级到1.68.2或更高版本。

总结

这个问题展示了gRPC框架在演进过程中对线程模型和同步上下文要求的严格化。虽然短期内可以通过降级解决，但长期来看，所有gRPC客户端实现都需要适应这种更严格的线程安全要求。框架开发者应该注意在引入新的线程安全约束时，确保提供清晰的迁移路径和兼容性保障。

grpc-java

The Java gRPC implementation. HTTP/2 based RPC

项目地址：https://gitcode.com/GitHub_Trending/gr/grpc-java

登录后查看全文