Galacean引擎v1.5.7版本发布:粒子系统与色彩空间全面升级
Galacean是一款专注于Web端高性能图形渲染的引擎,特别适合开发3D互动内容和游戏。本次发布的v1.5.7版本带来了多项重要更新,主要集中在粒子系统功能增强、色彩空间处理优化以及物理引擎改进等方面。
粒子系统功能全面增强
本次更新为粒子系统带来了多项重要改进:
-
新增力场模块:引入了ForceOverLifetime模块,允许开发者定义粒子在整个生命周期内受到的力场变化,为粒子运动效果提供了更多可能性。特别值得注意的是,开发团队还修复了在拉伸渲染模式下力场计算不准确的问题。
-
网格发射支持:粒子系统现在可以从3D网格表面发射粒子,这为创建更复杂的粒子效果打开了大门。开发团队特别处理了网格共享位置和法线缓冲区时的发射问题,确保了功能的稳定性。
-
自发光效果:粒子现在支持emissive属性,可以产生自发光效果,这对于创建火焰、魔法等视觉效果非常有帮助。
-
边界计算优化:修复了世界坐标系下粒子边界变换的问题,确保了粒子效果在不同坐标系下的正确表现。
色彩空间处理重大升级
色彩空间处理是本版本的另一大亮点:
-
sRGB支持:引擎现在完整支持sRGB色彩空间,这对于保证颜色在不同设备上的一致性显示非常重要。
-
线性空间转换:所有颜色属性都已重构为使用线性空间处理,这解决了之前混合模式下可能出现的问题,特别是透明画布情况下的加法混合模式问题。
-
HDR支持:相机现在可以配置HDR所需的alpha通道,为高动态范围渲染提供了更好的支持。
-
UI色彩空间修复:专门修复了UI元素在色彩空间处理上的问题,确保了2D和3D元素在色彩表现上的一致性。
渲染管线优化
渲染管线方面也有多项改进:
-
FXAA支持:新增了快速近似抗锯齿(FXAA)支持,可以在性能开销较小的情况下有效减少锯齿。
-
MSAA优化:对多重采样抗锯齿(MSAA)的配置、注释和内存使用进行了全面优化,修复了相机MSAA值不准确的问题。
-
透明画布处理:解决了透明画布渲染时的一些问题,提高了渲染质量。
物理引擎改进
物理系统方面也有重要更新:
-
碰撞组支持:新增了碰撞组功能,可以更精细地控制哪些物体之间应该发生碰撞。
-
同步问题修复:修复了角色控制器位置同步延迟的问题,提高了物理模拟的准确性。
-
自定义PhysX加载:现在支持自定义PhysX物理引擎的加载路径,为特殊部署场景提供了灵活性。
-
内存释放修复:解决了物理系统资源释放时可能出现的错误。
其他重要修复与改进
-
WebP解码:改进了WebP格式图片的解码能力检测,确保在不同环境下都能正确识别支持情况。
-
上下文丢失处理:修复了WebGL上下文丢失时的处理逻辑,提高了应用的健壮性。
-
相机视口修复:解决了相机像素视口为0时的问题。
-
文本测量:修复了在某些设备上文本测量不准确的问题,特别是actualBoundingBoxLeft和actualBoundingBoxRight属性的支持。
-
边界框序列化:BoundingBox现在支持toJson方法,方便数据的序列化和传输。
总结
Galacean引擎v1.5.7版本在粒子系统、色彩管理和物理模拟等方面都带来了显著改进。这些更新不仅增加了引擎的功能性,也提高了渲染质量和稳定性。特别是色彩空间处理的全面升级,为开发者提供了更专业的色彩控制能力,而粒子系统的增强则为创建更丰富的视觉效果提供了更多可能性。对于正在使用或考虑使用Galacean引擎的开发者来说,这个版本值得关注和升级。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00