您好,欢迎来到欧得旅游网。
搜索
您的当前位置:首页聚类评价指标

聚类评价指标

来源:欧得旅游网

聚类评价指标分为 内部指标外部指标 两大类,用于评估聚类算法的性能。


一、内部评价指标

内部评价指标不依赖真实标签,主要通过聚类结果本身的紧凑性和分离性进行评估。


二、外部评价指标

外部指标依赖真实标签,衡量聚类结果与真实类别的匹配程度。

  1. 准确率(Accuracy, ACC)

    • 衡量聚类结果与真实标签的最大匹配程度。
    • 公式:
    • 值域:[0, 1],值越大表示聚类效果越好。
  2. 归一化互信息(Normalized Mutual Information, NMI)

    • 衡量真实类别与聚类结果的互信息量。
    • 公式:
    • 值域:[0, 1],值越大表示聚类效果越好。
  3. 调整兰德指数(Adjusted Rand Index, ARI)

    • 衡量数据点对间一致性的调整比例。
    • 公式:
    • 值域:[-1, 1],值越大表示聚类效果越好。

三、总结

不同指标适用于不同场景:

  • 内部指标适合无标签数据的聚类评估。
  • 外部指标适合已知真实类别的数据,用于对比不同算法的表现。
    选择合适的指标有助于全面分析聚类算法的优劣。

目前的深度聚类领域的论文大多采用的是ACC、NMI、ARI三种,并且大多以NMI的值为准来衡量一个模型的聚类性能。也有部分论文采用了分类的F1指标来作为一种参考指标(个人认为可以不用)。当然,内部指标也可以用,我刚刚有一篇论文就被专家建议增加内部指标。。。。。。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- ovod.cn 版权所有 湘ICP备2023023988号-4

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务