JetLinks物联网平台：时序数据存储架构设计与性能优化实践

2026-04-20 12:06:26作者：戚魁泉Nursing

JetLinks 基于Java,Spring Boot ,WebFlux,Netty,Vert.x,Reactor等开发, 是一个全响应式的企业级物联网平台。支持统一物模型管理,多种设备,多种厂家,统一管理。统一设备连接管理,多协议适配(TCP,MQTT,UDP,CoAP,HTTP等),屏蔽网络编程复杂性,灵活接入不同厂家不同协议等设备。实时数据处理,设备告警,消息通知,数据转发。地理位置,数据可视化等。能帮助你快速建立物联网相关业务系统。

项目地址：https://gitcode.com/gh_mirrors/je/jetlinks-community

在物联网（IoT）系统中，时序数据处理是平台核心能力之一。随着设备规模的指数级增长，每台设备每秒产生的传感器读数、状态信息和事件记录形成了海量的时序数据洪流。JetLinks作为全响应式企业级物联网平台，通过整合ElasticSearch与TDengine两大存储引擎，构建了一套高效、灵活且经济的时序数据管理解决方案。本文将从技术痛点分析入手，深入探讨JetLinks时序数据存储架构的设计原理与落地实践，帮助技术团队构建高性能物联网数据处理系统。

时序数据存储的技术挑战与解决方案

物联网时序数据的核心特性与存储痛点

时序数据（Time Series Data）是指按时间顺序记录的一系列数据点，在物联网场景中具有以下显著特征：时间戳标记、高频写入（每秒 thousands 级）、顺序写入为主、极少更新、查询多按时间范围进行。这些特性给传统数据库带来了严峻挑战：

写入性能瓶颈：传统关系型数据库难以承受物联网设备的高频写入压力
存储成本问题：原始时序数据体积庞大，长期存储成本高昂
查询效率低下：时间范围查询和聚合分析在普通数据库中性能表现不佳
数据生命周期管理：不同时期数据的访问频率差异大，需要分级存储策略

JetLinks混合存储架构设计理念

JetLinks采用"数据特性驱动存储选型"的设计理念，针对不同类型时序数据的特性和访问模式，选择最适合的存储引擎：

如架构图所示，JetLinks将时序数据划分为三大类进行差异化存储：

实时监控数据：采用TDengine存储最近7-30天的高频采集数据
业务查询数据：使用ElasticSearch存储30-90天的设备事件和告警记录
历史归档数据：通过对象存储保存90天以上的冷数据

这种混合架构充分发挥了各类存储引擎的优势，在性能、成本和功能之间取得最佳平衡。

ElasticSearch在JetLinks中的应用与优化

ElasticSearch存储方案的核心价值

ElasticSearch作为分布式搜索引擎，在JetLinks平台中主要承担以下角色：

设备运行日志和事件记录的存储与检索
复杂条件的设备状态查询与统计分析
全文检索支持，满足业务系统的灵活查询需求

其核心优势在于：分布式架构支持横向扩展、强大的聚合分析能力、灵活的动态映射机制，以及丰富的查询DSL。

适用场景与实施策略

在JetLinks中，ElasticSearch最适合存储以下类型数据：

设备告警记录与处理流程追踪
用户操作日志与系统审计信息
需要全文检索的设备属性数据
非结构化的事件描述信息

实施步骤：

索引模板设计：为不同类型时序数据创建专用索引模板
生命周期管理：配置索引自动轮转与过期删除策略
字段映射优化：根据查询需求合理设置字段类型与分析器
查询性能调优：优化查询语句，合理使用缓存与聚合管道

核心配置示例（ElasticSearch索引模板）：

// 文件路径：jetlinks-components/elasticsearch-component/src/main/java/org/jetlinks/community/elastic/ElasticSearchConfiguration.java
@Bean
public IndexTemplateInitializer deviceLogIndexTemplate() {
    return new IndexTemplateInitializer()
        .setTemplateName("device-log-template")
        .setPatterns(Arrays.asList("device-log-*"))
        .setSettings(Settings.builder()
            .put("number_of_shards", 3)          // 根据数据量调整分片数
            .put("number_of_replicas", 1)        // 生产环境建议设置1-2个副本
            .put("index.lifecycle.name", "log-policy") // 关联生命周期策略
            .put("index.lifecycle.rollover_alias", "device-log")) // 滚动别名
        .setMappings("{\n" +
            "  \"properties\": {\n" +
            "    \"deviceId\": {\"type\": \"keyword\"},\n" // 设备ID设为keyword类型，支持精确匹配
            "    \"timestamp\": {\"type\": \"date\"},\n"  // 时间戳字段
            "    \"content\": {\"type\": \"text\"},\n"   // 日志内容支持全文检索
            "    \"level\": {\"type\": \"keyword\"}\n"    // 日志级别设为keyword，支持聚合分析
            "  }\n" +
            "}");
}

性能优化关键技巧

索引生命周期管理
- 设置热-温-冷数据阶段转换策略
- 配置基于时间或大小的自动滚动策略
- 实施数据TTL自动清理过期数据
存储优化
- 启用_source字段压缩：index.codec: best_compression
- 对大字段使用字段长度归一化：norms: false
- 禁用不需要分析的字段的索引：index: false
查询优化
- 避免使用通配符前缀查询（如*log）
- 合理设置查询超时时间
- 使用filter上下文减少评分计算开销

TDengine时序数据存储最佳实践

TDengine的技术优势与适用场景

TDengine是专为时序数据设计的高性能列式存储数据库，其核心优势包括：

针对时序数据优化的存储引擎，写入性能比传统数据库高10倍以上
内置时间窗口聚合函数，大幅提升查询效率
创新的标签索引机制，支持多维度数据筛选
原生支持数据分区与生命周期管理

在JetLinks平台中，TDengine主要用于存储：

设备传感器高频采集数据（如温度、湿度、压力等）
设备运行状态指标（CPU、内存、网络等）
需要按时间窗口聚合分析的计量数据

超级表设计与数据模型

TDengine的超级表（Super Table）概念是实现高效时序数据管理的核心。超级表定义了时序数据的通用结构，而子表则对应具体的设备或数据源。

创建超级表示例：

-- 设备遥测数据超级表
CREATE STABLE IF NOT EXISTS device_telemetry (
  ts TIMESTAMP,               -- 时间戳
  value FLOAT,                -- 测量值
  quality INT                 -- 数据质量标识
) TAGS (
  device_id NCHAR(64),        -- 设备唯一标识
  product_id NCHAR(32),       -- 产品型号标识
  metric_id NCHAR(32),        -- 指标ID
  unit NCHAR(16)              -- 单位
);

这种设计的优势在于：

通过标签实现多维度数据分类
每个设备数据独立存储，避免热点问题
支持按标签进行聚合查询，简化分析操作

性能优化配置指南

数据分区策略
- 时间分区：建议按天或小时分区，PARTITION BY RANGE(ts) INTERVAL 1 DAY
- 子表分区：根据设备数量合理设置子表数量，避免单表过大

存储参数调优

// 文件路径：jetlinks-components/tdengine-component/src/main/java/org/jetlinks/community/tdengine/TDengineProperties.java
@ConfigurationProperties(prefix = "jetlinks.tdengine")
public class TDengineProperties {
    private int batchSize = 1000;          // 批量写入大小，建议500-2000
    private int maxRetries = 3;            // 写入重试次数
    private int retryInterval = 1000;      // 重试间隔(毫秒)
    private String jdbcUrl = "jdbc:TAOS://localhost:6030/iot?charset=UTF-8&locale=en_US.UTF-8";
    private String username = "root";
    private String password = "taosdata";
    // 其他配置...
}

数据保留策略
- 设置表级TTL：ALTER TABLE device_telemetry SET TTL 30d
- 配置自动降采样：CREATE TABLE agg_1h AS SELECT AVG(value) FROM device_telemetry INTERVAL(1h)

混合存储策略与数据流转实践

多引擎存储方案对比分析

特性	ElasticSearch	TDengine
数据模型	文档模型	时序模型(超级表+子表)
写入性能	高	极高(10倍于传统数据库)
查询能力	全文检索、复杂聚合	时间窗口聚合、标签过滤
存储成本	中高	低(压缩率高达10:1)
适用场景	日志、事件、告警	传感器数据、监控指标
数据生命周期	索引生命周期管理	表级TTL、降采样

数据流转与分级存储实现

JetLinks采用以下策略实现时序数据的全生命周期管理：

数据写入流程
- 设备数据实时写入TDengine（热数据）
- 重要事件和告警同步写入ElasticSearch
- 系统定期将TDengine数据归档至对象存储
数据访问策略
- 实时查询（<7天）：直接查询TDengine
- 近期查询（<30天）：查询ElasticSearch
- 历史查询（>30天）：查询归档存储
数据处理代码示例

// 文件路径：jetlinks-components/timeseries-component/src/main/java/org/jetlinks/community/timeseries/TimeSeriesService.java
public interface TimeSeriesService {
    /**
     * 保存时序数据，根据数据特性自动路由到合适的存储引擎
     */
    Mono<Void> save(TimeSeriesData data);
    
    /**
     * 查询时序数据，自动选择最优存储引擎
     */
    Flux<TimeSeriesData> query(TimeSeriesQuery query);
    
    /**
     * 数据归档处理，将过期数据迁移到低成本存储
     */
    Mono<Void> archive(ArchivePolicy policy);
}

典型应用场景案例

智能工厂设备监控系统：某汽车制造企业部署JetLinks平台监控1000+台生产设备，每台设备每10秒产生20个监控指标。采用混合存储策略后：

TDengine存储最近7天的原始数据（约1.6TB）
ElasticSearch存储30天内的告警和事件数据（约500GB）
对象存储归档历史数据（每年约6TB）

系统性能指标：

写入吞吐量：峰值20,000点/秒
95%查询响应时间：<200ms
存储成本降低：相比全ElasticSearch方案降低65%

部署配置与性能调优指南

环境准备与部署步骤

获取源码

git clone https://gitcode.com/gh_mirrors/je/jetlinks-community
cd jetlinks-community

配置存储引擎连接
- ElasticSearch配置：修改application.yml中的spring.elasticsearch部分
- TDengine配置：配置jetlinks.tdengine相关参数
构建与启动

./mvnw clean package -DskipTests
cd jetlinks-standalone
java -jar target/jetlinks-standalone.jar

核心配置详解

ElasticSearch连接配置：

spring:
  elasticsearch:
    rest:
      uris: http://es-node1:9200,http://es-node2:9200
      connection-timeout: 10000
      read-timeout: 30000
    properties:
      max-conn-total: 100
      max-conn-per-route: 20

TDengine连接配置：

jetlinks:
  tdengine:
    jdbc-url: jdbc:TAOS://tdengine-server:6030/iot
    username: root
    password: taosdata
    batch-size: 1000
    max-retry: 3
    pool:
      max-idle: 10
      min-idle: 5
      max-active: 50

性能监控与问题排查

关键监控指标
- 写入吞吐量：TDengine的insert_rows指标
- 查询延迟：ElasticSearch的query latency指标
- 存储占用：各引擎的磁盘使用增长率
常见问题排查
- 写入性能瓶颈：检查批处理大小、网络带宽、服务器IO
- 查询缓慢：优化索引、检查查询语句、增加缓存
- 数据不一致：检查数据同步机制、网络稳定性
性能调优 checklist
- [ ] 合理设置TDengine的批处理大小（500-2000条/批）
- [ ] 为ElasticSearch配置合适的分片数量（每分片20-40GB）
- [ ] 启用TDengine的缓存机制（cacheSize参数）
- [ ] 配置ElasticSearch的字段映射，避免动态映射过度膨胀