首页
/ Apache OpenWhisk 分布式部署问题排查指南

Apache OpenWhisk 分布式部署问题排查指南

2025-06-01 00:00:24作者:申梦珏Efrain

问题背景

在部署Apache OpenWhisk分布式环境时,用户遇到了无法成功调用hello动作的问题。系统部署在两台Linux主机上,分别作为主节点(192.168.35.5)和调用节点(192.168.35.8)。尽管部署步骤全部完成,但在尝试调用动作时出现了失败。

关键错误现象

  1. 在调用hello动作时返回错误:error: Unable to invoke action 'hello': There was an internal server error. (code 716aef8948ee83567c132939f405d2fc)

  2. 调用节点日志中出现关键错误:cannot create test action for invoker health because runtime manifest is not valid

  3. 控制器日志显示Elasticsearch连接问题:org.apache.http.ConnectionClosedException: Connection closed

根本原因分析

经过深入排查,发现问题主要由两个因素导致:

  1. 运行时清单配置不完整:系统默认使用Node.js运行时来执行调用节点的健康检查动作,但在用户的运行时清单(runtimes.json)中只配置了Python运行时,缺少Node.js运行时配置。

  2. Elasticsearch连接问题:虽然Elasticsearch容器已成功启动,但系统与其的连接不稳定,导致激活记录存储失败。

解决方案

运行时清单配置修正

正确的运行时清单应包含Node.js运行时配置,示例如下:

{
  "runtimes": {
    "nodejs": [
      {
        "kind": "nodejs:20",
        "default": true,
        "image": {
          "prefix": "openwhisk",
          "name": "action-nodejs-v20",
          "tag": "nightly"
        },
        "deprecated": false,
        "attached": {
          "attachmentName": "codefile",
          "attachmentType": "text/plain"
        }
      }
    ],
    "python": [
      {
        "kind": "python:3.10",
        "default": true,
        "image": {
          "prefix": "openwhisk",
          "name": "action-python-v3.10",
          "tag": "nightly"
        },
        "deprecated": false,
        "attached": {
          "attachmentName": "codefile",
          "attachmentType": "text/plain"
        }
      }
    ]
  },
  "blackboxes": [
    {
      "prefix": "openwhisk",
      "name": "dockerskeleton",
      "tag": "nightly"
    }
  ]
}

Elasticsearch连接优化

  1. 确保Elasticsearch容器有足够的内存资源(建议至少1GB)
  2. 检查网络连接是否稳定,确保控制器能够访问Elasticsearch服务
  3. 验证Elasticsearch的认证配置是否正确
  4. 考虑增加Elasticsearch的连接超时设置

部署建议

  1. 多运行时支持:即使您的应用主要使用某一种语言运行时,也应配置完整的运行时清单,因为系统内部可能依赖多种运行时。

  2. 资源监控:部署后应监控各组件资源使用情况,特别是Elasticsearch这类资源密集型服务。

  3. 日志分析:定期检查各组件日志,及时发现潜在问题。

  4. 分阶段验证:部署完成后,先验证基础功能(如健康检查)是否正常,再测试业务动作。

总结

Apache OpenWhisk的分布式部署需要特别注意各组件的协同工作和配置完整性。运行时清单的完整配置是系统正常工作的基础,而存储服务的稳定性则直接影响动作调用的可靠性。通过本文的分析和解决方案,开发者可以避免类似问题的发生,构建更加稳定的OpenWhisk环境。

登录后查看全文
热门项目推荐
相关项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
22
6
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
166
2.05 K
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
8
0
openHiTLS-examplesopenHiTLS-examples
本仓将为广大高校开发者提供开源实践和创新开发平台,收集和展示openHiTLS示例代码及创新应用,欢迎大家投稿,让全世界看到您的精巧密码实现设计,也让更多人通过您的优秀成果,理解、喜爱上密码技术。
C
88
568
leetcodeleetcode
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
60
17
apintoapinto
基于golang开发的网关。具有各种插件,可以自行扩展,即插即用。此外,它可以快速帮助企业管理API服务,提高API服务的稳定性和安全性。
Go
22
0
cjoycjoy
一个高性能、可扩展、轻量、省心的仓颉应用开发框架。IoC,Rest,宏路由,Json,中间件,参数绑定与校验,文件上传下载,OAuth2,MCP......
Cangjie
94
15
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
199
279
giteagitea
喝着茶写代码!最易用的自托管一站式代码托管平台,包含Git托管,代码审查,团队协作,软件包和CI/CD。
Go
17
0
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
954
564