GoStats 项目技术文档
2024-12-24 23:55:08作者:牧宁李
1. 安装指南
环境准备
在开始安装之前,请确保已经正确配置了 Go 语言的开发环境。可以参考 How to Write Go Code 和 screencast 来设置 Go 环境。
安装步骤
-
进入项目目录:
$ cd goProjects/src/GoStats/stats -
运行测试以确保包的正确性:
$ go test -v --bench='.' -
安装
stats包:$ go install -
运行描述性统计演示:
$ cd ../descriptive_statistics_demo/ $ go build $ ./descriptive_statistics_demo -
运行回归演示:
$ cd ../regression_demo/ $ go build $ ./regression_demo
2. 项目使用说明
描述性统计
GoStats 包提供了两种计算描述性统计的方式:批量模式和增量模式。
批量模式
批量模式是传统的计算方式,适用于已有一个数组的情况。函数名以 Stats 开头。
a := []float64{1.0, 2.0, 3.0, 4.0, 5.0}
populationVariance := StatsPopulationVariance(a) // = 2.0
sampleVariance := StatsSampleVariance(a) // = 2.5
增量模式
增量模式适用于数据逐个或少量生成的情况,节省内存。首先声明一个 Stats 结构体,然后逐个更新。
var d stats.Stats
d.Update(x)
count := d.Count()
min := d.Min()
max := d.Max()
sum := d.Sum()
mean := d.Mean()
standardDeviation := d.SampleStandardDeviation()
variance := d.SampleVariance()
skew := d.SampleSkew()
kurtosis := d.SampleKurtosis()
线性回归
线性回归同样支持增量和批量模式。
增量模式
声明一个 Regression 结构体,逐个更新数据。
var r stats.Regression
r.Update(x, y)
slope := r.Slope()
intercept := r.Intercept()
r_squared := r.RSquared()
count := r.Count()
slopeStdErr := r.SlopeStandardError()
interceptStdErr := r.InterceptStandardError()
批量模式
直接传入 x 和 y 数组进行计算。
var slope, intercept, rsquared, count, slopeStdErr, intcptStdErr = LinearRegression(xData, yData)
3. 项目API使用文档
描述性统计API
StatsPopulationVariance(a []float64) float64:计算总体方差。StatsSampleVariance(a []float64) float64:计算样本方差。Stats.Update(x float64):增量更新单个值。Stats.UpdateArray(a []float64):增量更新数组。Stats.Count() int:返回数据点数量。Stats.Min() float64:返回最小值。Stats.Max() float64:返回最大值。Stats.Sum() float64:返回总和。Stats.Mean() float64:返回均值。Stats.SampleStandardDeviation() float64:返回样本标准差。Stats.SampleVariance() float64:返回样本方差。Stats.SampleSkew() float64:返回样本偏度。Stats.SampleKurtosis() float64:返回样本峰度。
线性回归API
Regression.Update(x, y float64):增量更新单个数据点。Regression.UpdateArray(xData, yData []float64):增量更新数组。Regression.Slope() float64:返回斜率。Regression.Intercept() float64:返回截距。Regression.RSquared() float64:返回R平方值。Regression.Count() int:返回数据点数量。Regression.SlopeStandardError() float64:返回斜率标准误差。Regression.InterceptStandardError() float64:返回截距标准误差。
4. 项目安装方式
安装 stats 包
$ cd goProjects/src/GoStats/stats
$ go test -v --bench='.'
$ go install
运行演示
-
描述性统计演示:
$ cd ../descriptive_statistics_demo/ $ go build $ ./descriptive_statistics_demo -
回归演示:
$ cd ../regression_demo/ $ go build $ ./regression_demo
登录后查看全文
热门项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0137- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
MiniCPM-V-4.6这是 MiniCPM-V 系列有史以来效率与性能平衡最佳的模型。它以仅 1.3B 的参数规模,实现了性能与效率的双重突破,在全球同尺寸模型中登顶,全面超越了阿里 Qwen3.5-0.8B 与谷歌 Gemma4-E2B-it。Jinja00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00
MusicFreeDesktop插件化、定制化、无广告的免费音乐播放器TypeScript00
热门内容推荐
最新内容推荐
项目优选
收起
暂无描述
Dockerfile
725
4.66 K
Ascend Extension for PyTorch
Python
597
749
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
425
376
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
992
984
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed.
Get Started
Rust
926
134
昇腾LLM分布式训练框架
Python
160
189
暂无简介
Dart
968
246
deepin linux kernel
C
29
16
Oohos_react_native
React Native鸿蒙化仓库
C++
345
393
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.65 K
971