OpenWhisk分布式部署中Invoker健康检查失败问题解析

2025-06-02 17:40:30作者：宗隆裙

开放 whisk（OpenWhisk）是一个强大的无服务器函数计算平台，让你无需管理服务器即可构建云应用。通过简洁的编程模型，开发者能轻松将函数转化为服务端API，实现功能模块化，并利用事件触发机制连接各个功能，驱动自动化流程。无论你是想快速原型开发还是部署到生产环境，OpenWhisk都提供了灵活性和扩展性。从本地“独立版”一键启动探索，到在Kubernetes上搭建企业级部署，OpenWhisk适应多种场景。结合Docker容器运行函数，它赋予了开发者前所未有的便捷性。加入Apache软件基金会的这一创新项目，探索无服务器的世界，无论是新手还是专家，在OpenWhisk社区都能找到详尽文档、命令指南及开发者支持，共同推动技术边界。立刻开始你的无服务器之旅吧！

项目地址：https://gitcode.com/gh_mirrors/op/openwhisk

问题背景

在OpenWhisk分布式部署环境中，用户尝试在两台Linux主机上搭建OpenWhisk集群时遇到了Invoker健康检查失败的问题。具体表现为无法成功调用一个简单的hello动作，同时Invoker日志中显示"runtime manifest is not valid"错误。

环境配置分析

用户的环境配置包括：

主节点：192.168.35.5
Invoker节点：192.168.35.8
使用CouchDB作为数据库后端
配置了ElasticSearch用于激活记录存储
采用分布式部署架构

关键错误现象

在部署过程中，系统表现出以下异常行为：

Invoker日志报错：

[ERROR] cannot create test action for invoker health because runtime manifest is not valid

控制器日志显示：

[ERROR] [StoreUtils] [GET] 'activations' internal error
org.apache.http.ConnectionClosedException: Connection closed

动作调用失败：

error: Unable to invoke action 'hello': There was an internal server error.

根本原因分析

经过深入排查，发现问题根源在于运行时清单(runtime manifest)配置不完整。具体来说：

健康检查动作依赖Node.js运行时：OpenWhisk的Invoker健康检查机制默认使用Node.js运行时来创建测试动作。当运行时清单中缺少Node.js配置时，健康检查无法正常进行。
用户配置的运行时清单仅包含Python运行时，没有包含Node.js运行时，导致系统无法创建健康检查所需的测试动作。
ElasticSearch连接问题是次级错误，主要由于健康检查失败后系统状态异常导致的连锁反应。

解决方案

要解决这个问题，需要完善运行时清单配置：

修改runtime.json文件，添加Node.js运行时配置：

{
  "runtimes": {
    "nodejs": [
      {
        "kind": "nodejs:20",
        "default": true,
        "image": {
          "prefix": "openwhisk",
          "name": "action-nodejs-v20",
          "tag": "nightly"
        },
        "deprecated": false,
        "attached": {
          "attachmentName": "codefile",
          "attachmentType": "text/plain"
        }
      }
    ],
    "python": [
      // 原有Python配置
    ]
  }
}

更新whisk.properties中的runtimes.manifest属性，确保包含完整的运行时信息。

重新部署系统：

ansible-playbook -i environments/$ENVIRONMENT wipe.yml
ansible-playbook -i environments/$ENVIRONMENT openwhisk.yml

最佳实践建议

运行时清单完整性：在配置OpenWhisk时，确保运行时清单包含系统所需的所有运行时环境，至少应包括Node.js运行时。
健康检查机制理解：了解OpenWhisk各组件间的健康检查机制，特别是Invoker依赖于特定运行时来执行健康检查。
日志分析优先级：当遇到多个错误时，应首先解决最早出现的根本性错误，其他错误可能是连锁反应。
测试验证：部署完成后，建议先测试系统内置动作和健康检查功能，再部署自定义动作。

总结

OpenWhisk分布式环境的配置需要特别注意各组件间的依赖关系。运行时清单的正确配置是系统正常工作的基础，特别是健康检查机制所依赖的运行时环境必须完整。通过完善运行时配置，可以解决因健康检查失败导致的系统异常问题，确保OpenWhisk集群稳定运行。

openwhisk

项目地址：https://gitcode.com/gh_mirrors/op/openwhisk

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

202

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理