当前位置:首页 > 文章列表 > 文章 > 前端 > JavaScript数组统计方法详解

JavaScript数组统计方法详解

2025-09-06 17:36:45 0浏览 收藏

本文详细介绍了如何使用JavaScript构建一个功能强大的统计分析类,用于处理数值数组。该类通过构造函数接收数组参数,并将其作为实例属性存储,避免了重复传参,提升效率。文章重点讲解了实现**计数、求和、均值、中位数、众数、方差和标准差**等核心统计方法,并提供了完整的代码示例。此外,还探讨了数据类型验证、浮点数精度、数组排序等注意事项,以及私有方法和错误处理的最佳实践。通过学习本文,开发者可以掌握JavaScript统计类的设计与实现,构建模块化、可维护的数据分析解决方案,为数据分析类应用打下坚实基础。

JavaScript中构建统计分析类:处理可变参数数组与实现常用统计方法

本文详细介绍了如何在JavaScript中设计一个健壮的统计分析类,以有效处理可变长度的数值数组。通过将输入数据作为实例属性存储,并实现一系列核心统计方法(如计数、求和、均值、中位数、众数、方差和标准差等),本教程旨在提供一个清晰、模块化的数据分析解决方案,提升代码的可维护性和复用性。

1. 核心概念:构造函数处理可变参数数组

在JavaScript中,当我们需要创建一个类来处理一组数量不定的输入数据时,关键在于如何将这些数据有效地传递给类的实例并存储起来。一个常见的误解是尝试在构造函数中使用解构赋值来直接分配多个独立的实例属性,例如 constructor(...inputs) { [this.input1, this.input2, ...rest] = inputs; }。然而,对于处理一个整体的数据集(如用于统计分析的数值数组),更推荐的做法是将整个数组作为一个单一的属性存储在实例上。

正确的方法是让构造函数接收一个数组作为参数,并将其赋值给一个实例属性。这样,类中的所有方法都可以通过 this.propertyName 访问到完整的数据集,而无需将数据作为参数重复传递。

class Statistics {
    /**
     * 构造函数接收一个数值数组作为输入。
     * @param {number[]} inputs - 用于统计分析的数值数组。
     */
    constructor(inputs) {
        if (!Array.isArray(inputs) || inputs.some(isNaN)) {
            throw new Error("Constructor expects an array of numbers.");
        }
        this.inputs = inputs;
    }
    // ... 后续的统计方法将操作 this.inputs
}

通过这种方式,Statistics 类的任何实例都将拥有一个名为 inputs 的属性,其中包含所有待分析的原始数据。

2. 实现基础统计方法

一旦数据被存储在 this.inputs 中,我们就可以开始实现各种统计计算方法。这些方法将直接操作 this.inputs。

2.1 数据量与总和

最基础的统计是获取数据的数量和总和。

class Statistics {
    // ... constructor ...

    /**
     * 获取数据集中元素的数量。
     * @returns {number} 元素的数量。
     */
    count() {
        return this.inputs.length;
    }

    /**
     * 计算数据集中所有元素的总和。
     * @returns {number} 元素的总和。
     */
    sum() {
        return this.inputs.reduce((accumulator, currentValue) => accumulator + currentValue, 0);
    }

    /**
     * 计算数据集中所有元素的平方和。
     * 这是一个内部辅助方法,用于方差和标准差的计算。
     * @returns {number} 元素的平方和。
     * @private
     */
    _sumSquares() {
        return this.inputs.reduce((accumulator, currentValue) => accumulator + currentValue * currentValue, 0);
    }
}

2.2 最小值、最大值与极差

最小值、最大值和极差(最大值与最小值之差)是衡量数据范围的重要指标。

class Statistics {
    // ... count, sum, _sumSquares ...

    /**
     * 获取数据集中的最小值。
     * @returns {number} 最小值。
     */
    min() {
        return Math.min(...this.inputs);
    }

    /**
     * 获取数据集中的最大值。
     * @returns {number} 最大值。
     */
    max() {
        return Math.max(...this.inputs);
    }

    /**
     * 计算数据集的极差(最大值减最小值)。
     * @returns {number} 极差。
     */
    range() {
        return this.max() - this.min();
    }
}

3. 实现进阶统计方法

现在,我们来构建更复杂的统计量,如均值、中位数、众数、方差和标准差。

3.1 均值 (Mean)

均值是所有数据点的总和除以数据点的数量。

class Statistics {
    // ... min, max, range ...

    /**
     * 计算数据集的算术平均值。
     * @returns {number} 均值。
     */
    mean() {
        const count = this.count();
        if (count === 0) return 0; // 避免除以零
        return this.sum() / count;
    }
}

3.2 中位数 (Median)

中位数是排序后数据集中间位置的数值。如果数据点数量为偶数,则取中间两个数的平均值。

class Statistics {
    // ... mean ...

    /**
     * 计算数据集的中位数。
     * @returns {number} 中位数。
     */
    median() {
        const sorted = this.inputs.toSorted((a, b) => a - b); // 使用 toSorted() 避免修改原数组
        const len = this.count();

        if (len === 0) return 0;

        // 位运算 >> 1 等同于 Math.floor(len / 2)
        const mid = len >> 1;

        if (len % 2 === 1) { // 奇数长度
            return sorted[mid];
        } else { // 偶数长度
            return (sorted[mid - 1] + sorted[mid]) / 2;
        }
    }
}

3.3 众数 (Mode)

众数是数据集中出现频率最高的数值。可能存在多个众数。

class Statistics {
    // ... median ...

    /**
     * 内部辅助方法:计算数据集中每个数值的频率。
     * @returns {Array<{value: number, count: number}>} 包含数值及其频率的数组,按频率降序排列。
     * @private
     */
    _frequencies() {
        const frequencyMap = new Map();
        for (const value of this.inputs) {
            frequencyMap.set(value, (frequencyMap.get(value) || 0) + 1);
        }

        // 将 Map 转换为数组,并按频率降序、数值降序排序
        return [...frequencyMap.entries()]
            .map(([value, count]) => ({ value, count }))
            .toSorted((a, b) => b.count - a.count || b.value - a.value);
    }

    /**
     * 获取数据集的众数及其出现次数。
     * 注意:此方法只返回出现频率最高的一个众数。
     * @returns {{mode: number, count: number} | null} 众数及其出现次数,如果数据集为空则返回 null。
     */
    mode() {
        const frequencies = this._frequencies();
        if (frequencies.length === 0) {
            return null;
        }
        // 返回频率最高的那个
        return frequencies[0];
    }
}

3.4 方差 (Variance) 与标准差 (Standard Deviation)

方差衡量数据点与均值的离散程度,标准差是方差的平方根。

class Statistics {
    // ... mode ...

    /**
     * 计算数据集的样本方差。
     * 这里使用总体方差公式 (N),而不是样本方差 (N-1)。
     * @returns {number} 方差。
     */
    var() {
        const len = this.count();
        if (len === 0) return 0;
        // 方差 = (平方和 / N) - 均值的平方
        return this._sumSquares() / len - this.mean() ** 2;
    }

    /**
     * 计算数据集的标准差。
     * @returns {number} 标准差。
     */
    std() {
        return this.var() ** 0.5; // 方差的平方根
    }
}

3.5 频率分布 (Frequency Distribution)

频率分布显示每个数值出现的百分比。

class Statistics {
    // ... std ...

    /**
     * 计算数据集中每个数值的百分比频率分布。
     * @returns {Array<[number, number]>} 包含百分比频率和数值的数组,按频率降序排列。
     */
    freqDist() {
        const totalCount = this.count();
        if (totalCount === 0) return [];

        const frequencies = this._frequencies();
        return frequencies.map(({ value, count }) =>
            [parseFloat(((count / totalCount) * 100).toFixed(1)), value] // 保留一位小数
        );
    }
}

4. 综合描述方法

为了方便查看所有统计结果,可以添加一个 describe 方法来打印所有计算出的统计量。

class Statistics {
    // ... 所有上述方法 ...

    /**
     * 打印所有主要的统计量到控制台。
     */
    describe() {
        console.log('Count:', this.count());
        console.log('Sum: ', this.sum());
        console.log('Min: ', this.min());
        console.log('Max: ', this.max());
        console.log('Range: ', this.range());
        console.log('Mean: ', this.mean());
        console.log('Median: ', this.median());
        const modeResult = this.mode();
        console.log('Mode: ', modeResult ? `(${modeResult.value}, ${modeResult.count})` : 'N/A');
        console.log('Variance: ', parseFloat(this.var().toFixed(2))); // 示例:保留两位小数
        console.log('Standard Deviation: ', parseFloat(this.std().toFixed(2))); // 示例:保留两位小数
        console.log('Frequency Distribution: ', this.freqDist());
    }
}

5. 完整示例与使用

以下是如何使用 Statistics 类的完整示例:

// 完整的 Statistics 类定义
class Statistics {
    constructor(inputs) {
        if (!Array.isArray(inputs) || inputs.some(isNaN)) {
            throw new Error("Constructor expects an array of numbers.");
        }
        this.inputs = inputs;
    }

    count() {
        return this.inputs.length;
    }

    sum() {
        return this.inputs.reduce((a, b) => a + b, 0);
    }

    _sumSquares() {
        return this.inputs.reduce((a, b) => a + b * b, 0);
    }

    mean() {
        const count = this.count();
        if (count === 0) return 0;
        return this.sum() / count;
    }

    min() {
        return Math.min(...this.inputs);
    }

    max() {
        return Math.max(...this.inputs);
    }

    range() {
        return this.max() - this.min();
    }

    median() {
        const sorted = this.inputs.toSorted((a, b) => a - b);
        const len = this.count();

        if (len === 0) return 0;
        const mid = len >> 1; // 等同于 Math.floor(len / 2)

        if (len % 2 === 1) { // 奇数长度
            return sorted[mid];
        } else { // 偶数长度
            return (sorted[mid - 1] + sorted[mid]) / 2;
        }
    }

    _frequencies() {
        const frequencyMap = new Map();
        for (const value of this.inputs) {
            frequencyMap.set(value, (frequencyMap.get(value) || 0) + 1);
        }

        return [...frequencyMap.entries()]
            .map(([value, count]) => ({ value, count }))
            .toSorted((a, b) => b.count - a.count || b.value - a.value);
    }

    mode() {
        const frequencies = this._frequencies();
        if (frequencies.length === 0) {
            return null;
        }
        return frequencies[0];
    }

    var() {
        const len = this.count();
        if (len === 0) return 0;
        return this._sumSquares() / len - this.mean() ** 2;
    }

    std() {
        return this.var() ** 0.5;
    }

    freqDist() {
        const totalCount = this.count();
        if (totalCount === 0) return [];

        const frequencies = this._frequencies();
        return frequencies.map(({ value, count }) =>
            [parseFloat(((count / totalCount) * 100).toFixed(1)), value]
        );
    }

    describe() {
        console.log('Count:', this.count());
        console.log('Sum: ', this.sum());
        console.log('Min: ', this.min());
        console.log('Max: ', this.max());
        console.log('Range: ', this.range());
        console.log('Mean: ', this.mean());
        console.log('Median: ', this.median());
        const modeResult = this.mode();
        console.log('Mode: ', modeResult ? `(${modeResult.value}, ${modeResult.count})` : 'N/A');
        console.log('Variance: ', parseFloat(this.var().toFixed(2)));
        console.log('Standard Deviation: ', parseFloat(this.std().toFixed(2)));
        console.log('Frequency Distribution: ', this.freqDist());
    }
}

// 示例数据
const ages = [31, 26, 34, 37, 27, 26, 32, 32, 26, 27, 27, 24, 32, 33, 27, 25, 26, 38, 37, 31, 34, 24, 33, 29, 26];

// 创建 Statistics 实例
const statistics = new Statistics(ages);

// 调用 describe 方法输出所有统计结果
statistics.describe();

6. 注意事项

  • 数据类型验证: 在 constructor 中加入对输入数据是否为数值数组的验证,可以提高类的健壮性。
  • 浮点数精度: 统计计算,尤其是涉及除法和平方根时,可能会产生浮点数精度问题。在输出结果时,可以考虑使用 toFixed() 或 Math.round() 进行适当的舍入,如示例中 describe 方法对方差和标准差的处理。
  • 数组排序: median 方法中使用了 Array.prototype.toSorted(),这是一个ES2023的新特性,它返回一个新数组而不修改原数组。如果你的运行环境不支持,可以使用 [...this.inputs].sort() 来实现相同的非破坏性排序。
  • 私有方法: 示例中使用了下划线前缀 (_sumSquares, _frequencies) 来表示这些方法是内部辅助方法,不建议直接从外部调用。在未来的JavaScript版本中,可以使用真正的私有类字段(#methodName)来强制实现私有性。
  • 众数处理: mode() 方法只返回了频率最高的一个众数。如果数据集中有多个数值具有相同的最高频率,且你需要返回所有这些众数,则需要修改 _frequencies 和 mode 的逻辑。
  • 错误处理: 确保在数据为空或无效时,方法能返回合理的结果(例如,count、sum、mean 等在空数组时返回0)。

7. 总结

通过上述设计,我们成功构建了一个功能完善且易于使用的 JavaScript 统计分析类。这种模块化的方法不仅使得代码结构清晰、易于维护,而且通过将数据作为实例属性存储,避免了在每个方法中重复传递数据,大大提高了代码的效率和可读性。这个类可以作为任何需要进行数值数据分析的JavaScript应用程序的基础组件。

今天关于《JavaScript数组统计方法详解》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

HTML表单实现OpenID登录方法详解HTML表单实现OpenID登录方法详解
上一篇
HTML表单实现OpenID登录方法详解
图片水印添加教程:GD库图像处理详解
下一篇
图片水印添加教程:GD库图像处理详解
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    514次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    499次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 千音漫语:智能声音创作助手,AI配音、音视频翻译一站搞定!
    千音漫语
    千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
    1062次使用
  • MiniWork:智能高效AI工具平台,一站式工作学习效率解决方案
    MiniWork
    MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
    1013次使用
  • NoCode (nocode.cn):零代码构建应用、网站、管理系统,降低开发门槛
    NoCode
    NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
    1046次使用
  • 达医智影:阿里巴巴达摩院医疗AI影像早筛平台,CT一扫多筛癌症急慢病
    达医智影
    达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
    1060次使用
  • 智慧芽Eureka:更懂技术创新的AI Agent平台,助力研发效率飞跃
    智慧芽Eureka
    智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
    1040次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码