sklearn.cluster.KMeans(n_clusters=8)

张

张建站

2026/4/10 2:10:21

10分钟阅读

sklearn.cluster.KMeans(n_clusters8)是scikit-learn库中 K-Means 聚类算法的一个实例化调用。这行代码的含义是创建一个 K-Means 聚类模型设置将数据分成8 个簇即n_clusters8其他参数全部使用默认值。详细参数说明fromsklearn.clusterimportKMeans# 完整写法含默认值kmeansKMeans(n_clusters8,# 簇的数量你设置的initk-means,# 初始化质心的方法n_initauto,# 不同初始质心运行的次数max_iter300,# 单次运行的最大迭代次数tol1e-4,# 收敛容忍度verbose0,# 是否输出详细日志random_stateNone,# 随机种子用于结果复现copy_xTrue,# 是否复制数据algorithmlloyd# 算法实现)常用操作示例fromsklearn.clusterimportKMeansimportnumpyasnp# 1. 创建模型kmeansKMeans(n_clusters8,random_state42)# random_state 保证结果可复现# 2. 准备数据假设有 100 个样本每个样本 2 个特征Xnp.random.rand(100,2)# 3. 训练模型kmeans.fit(X)# 4. 获取聚类结果labelskmeans.labels_# 每个样本的簇标签 (0-7)centerskmeans.cluster_centers_# 8 个簇的中心点坐标# 5. 预测新样本new_datanp.array([[0.5,0.5]])pred_labelkmeans.predict(new_data)# 6. 计算每个样本到所属簇中心的距离distanceskmeans.transform(X)# shape: (100, 8)每列是到各簇中心的距离如何选择 n_clustersn_clusters8不一定是“最优”的常用方法确定 K 值fromsklearn.metricsimportsilhouette_scoreimportmatplotlib.pyplotasplt# 肘部法则inertias[]silhouette_scores[]K_rangerange(2,15)forkinK_range:kmeansKMeans(n_clustersk,random_state42,n_init10)kmeans.fit(X)inertias.append(kmeans.inertia_)# 簇内平方和silhouette_scores.append(silhouette_score(X,kmeans.labels_))# 绘图fig,(ax1,ax2)plt.subplots(1,2,figsize(12,4))ax1.plot(K_range,inertias,bo-)ax1.set_xlabel(k)ax1.set_ylabel(Inertia)ax1.set_title(Elbow Method)ax2.plot(K_range,silhouette_scores,ro-)ax2.set_xlabel(k)ax2.set_ylabel(Silhouette Score)ax2.set_title(Silhouette Analysis)plt.show()注意事项特征缩放K-Means 对特征尺度敏感建议先标准化fromsklearn.preprocessingimportStandardScaler X_scaledStandardScaler().fit_transform(X)random_state设置随机种子可使结果可复现n_init默认auto10次增加可提高稳定性但会慢内存数据量大时考虑使用MiniBatchKMeans

OpenClaw自动化测试：Qwen2.5-VL-7B多模态任务稳定性验证

OpenClaw自动化测试：Qwen2.5-VL-7B多模态任务稳定性验证 1. 测试背景与目标去年在开发一个自动化内容处理系统时，我遇到了多模态任务处理的瓶颈——传统脚本无法理解图像内容，而手动处理又极其耗时。当我发现OpenClaw可以对接Qwen2.5-VL-7…...

2026/4/10 2:10:21 阅读更多 →

Agent 进阶到精通：深度拆解 Hermes 架构，这篇干货看懂就够用了！

最近开源 Agent 圈里，Hermes Agent 这个名字被频繁提起。如果用一句话先把它讲清楚，Hermes（也有人戏称“爱马仕 Agent”）本质上不是又一个简单的 AI CLI，而是一套强调长期使用、持续沉淀和自我改进的 Agent runtime。…...

2026/4/10 2:10:17 阅读更多 →

PHP异步I/O配置被低估的底层真相：为什么你启用了Swoole协程，却仍在同步等待MySQL？答案藏在PDO::ATTR_TIMEOUT和libmysqlclient.so版本里

第一章：PHP异步I/O配置被低估的底层真相PHP长期被误认为“天生同步”，但其异步I/O能力并非缺失，而是深埋于扩展生态与运行时配置的耦合细节中。核心真相在于：PHP 8.1 原生支持协程式异步I/O的前提，是正确启用并协同配置…...

2026/4/10 2:10:03 阅读更多 →

python StrEnum

# Python中的StrEnum：一种更优雅的字符串枚举方案在Python开发中，经常会遇到需要定义一组固定字符串常量的场景。比如表示订单状态、用户角色、错误代码等。传统的做法可能是直接定义一堆字符串变量，或者使用Python内置的Enum类。但直到Pyth…...

2026/4/9 0:49:16 阅读更多 →

SmoothTouch：XPT2046触摸库的多级滤波与USB HID鼠标集成

1. SmoothTouch 库概述SmoothTouch 是一个专为 XPT2046 触摸控制器设计的轻量级嵌入式软件库，核心目标是提供高鲁棒性的触摸坐标采集能力，并原生集成多级数字滤波与去噪机制。其最终输出形态为标准化的 USB HID 鼠标报告（HID Mouse Report&am…...

2026/4/9 14:54:37 阅读更多 →

STM8 Bootloader开发与固件远程升级实践

1. Bootloader的核心价值与应用场景在嵌入式产品开发中，Bootloader的重要性经常被低估。直到去年参与某工业控制器项目时，我才真正体会到它的价值——当时现场有200台设备需要紧急修复通信协议漏洞，但设备外壳采用防水密封设计，拆…...

2026/4/9 20:12:27 阅读更多 →

APDS9999传感器驱动开发：寄存器配置、中断与FreeRTOS集成

1. Arduino_APDS9999 库深度解析：面向嵌入式工程师的环境光、色彩与接近度传感器驱动开发指南APDS9999 是 Broadcom（原 Avago）推出的高集成度光学传感器芯片，集环境光感知（ALS）、RGB 色彩识别（C…...

2026/4/7 13:53:30 阅读更多 →

更多精彩文章