探索数据模型的未来:jSchema

在浏览器中处理和理解复杂的数据集从未如此简单。jSchema 是一个基于JavaScript的数据建模框架,它使你能将多组不同的数据转化为统一的模式,定义数据间的关联性,并进行数据聚合、连接和筛选,以提高数据应用的效率。

jSchema 创建了一个名为 jSchema 的对象,该对象包含了所有数据集的元信息,包括表名、列名和键。数据本身存储在一个闭包内,通过获取器函数进行访问。数据的连接、聚合和过滤都会在你的WORK命名空间创建一个新的数据集,这些变化会一直保留到你删除表格或执行清理方法为止。默认情况下,jSchema是区分大小写的,但你可以选择关闭这一功能:
var s = new jSchema({
"caseSensitive": false
});
演示体验
在仓库中的demo目录可以找到一个完整的操作示例。此外,你还可以在在线演示中实时体验jSchema的强大功能。
如何使用
NPM
如果你使用npm,只需运行 npm install jschema 即可。
RequireJS
jSchema支持RequireJS,你可以在你的项目lib目录下移动requirejs并将其引入HTML文件:
<script data-main="main" src="lib/require.js"></script></body>
然后在如main.js这样的入口文件中添加jSchema:
requirejs(['lib/jschema'], function(jSchema){
var s = new jSchema;
s.add([{a:1, b:2}])
s.add([{b:2, c:3}], {name:"named_table", primaryKey:"b"})
});
或者从外部源加载数据:
fetch("education.json")
.then(response => response.json())
.then(json => s.add(json, {name:"education", primaryKey:"Age_Group"}))
.then(fetch("gender.json")
.then(response => response.json())
.then(json => s.add(json, {name:"gender", primaryKey:"Age_Group"}))
);
功能特性
JOIN
通过指定主键和外键,可以轻松地对两个有关系的数据集进行连接:
s.join("EDUCATION", "GENDER", {name: "joinTable"})
DROP
不再需要的表格可以通过drop方法删除:
s.drop("GENDER")
SORT
如果你想根据某属性对数据集进行排序,可以使用orderBy方法:
s.orderBy("GENDER", {
clause: "Count",
order: "asc",
name: "sortBy"
})
GROUP BY
通过提供数据集名称、分组维度以及要聚合的度量,可以实现数据的分组:
s.groupBy("GENDER", {
dim: "Gender",
metric: "Count",
name: "groupBy",
method: "sum", // 支持的计算方法包括sum, count, average, min, max
percision: 2, // 默认为2
dimName: "GenderPK" // 如果需要重命名维度
})
更多功能
除此之外,还有FILTER用于过滤数据、UPDATE用于更新现有数据集、INSERT用于插入新行、REMOVE COLS用于移除列、ADD COLS用于添加新的列,以及cleanUp用于清除临时工作区的数据等。
测试与联系方式
对于任何问题、建议或功能请求,欢迎随时联系我。我在Twitter上的ID是@ignoreintuition。要运行Mocha测试脚本,只需在终端输入:
npm install
npm run test
jSchema以其简洁而强大的API,让JavaScript数据建模变得简单易懂。无论你是数据分析新手还是经验丰富的开发者,都能快速上手并从中受益。立即加入我们,探索数据的无限可能吧!
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0148- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
auto-devAutoDev 是一个 AI 驱动的辅助编程插件。AutoDev 支持一键生成测试、代码、提交信息等,还能够与您的需求管理系统(例如Jira、Trello、Github Issue 等)直接对接。 在IDE 中,您只需简单点击,AutoDev 会根据您的需求自动为您生成代码。Kotlin03
Intern-S2-PreviewIntern-S2-Preview,这是一款高效的350亿参数科学多模态基础模型。除了常规的参数与数据规模扩展外,Intern-S2-Preview探索了任务扩展:通过提升科学任务的难度、多样性与覆盖范围,进一步释放模型能力。Python00
skillhubopenJiuwen 生态的 Skill 托管与分发开源方案,支持自建与可选 ClawHub 兼容。Python0111