代码编织梦想

可以用到 scilit-learn 里的 make_blobs() 方法。这个方法用于生成聚类数据集,也用于测试和调试聚类算法。

import torch 
import matplotlib.pyplot as plt 
from sklearn.datasets import make_blobs 
from sklearn.model_selection import train_test_split 

NUM_CLASSES = 4
NUM_FEATURES = 2 
RANDOM_SEED = 42 

# 1. Create multi--class data 
# 返回的结果,第一个元素是一个数组,包含生成的样本点的特征向量。第二个元素是一个数组,包含了每个样本点所属的类别标签
X_blob, y_blob = make_blobs(n_samples = 1000,
                            n_features = NUM_FEATURES,
                            centers = NUM_CLASSES,
                            cluster_std = 1.5,
                            random_state = RANDOM_SEED) 

# 2. Turn data into tensors 
X_blob = torch.from_numpy(X_blob).type(torch.float)
y_blob = torch.from_numpy(y_blob).type(torch.LongTensor)

# 3. Split into train and test sets 
X_blob_train, X_blob_test, y_blob_train, y_blob_test = train_test_split(X_blob, y_blob, test_size = 0.2, random_state = RANDOM_SEED)

# 4. Plot data 
plt.figure(figsize=(10, 7))
plt.scatter(X_blob[:, 0], X_blob[:, 1], c=y_blob, cmap = plt.cm.RdYlBu)

结果如下:
结果如下

点个赞呗~

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/BSCHN123/article/details/137159893

机器学习模型及其使用方法——《机器学习图解》-爱代码爱编程

本书教你两件事——机器学习模型及其使用方法 机器学习模型有不同的类型,有些返回确定性的答案,例如是或否,而另一些返回概率性的答案。有些以问题的形式呈现;其他则使用假设性表达。这些类型的一个共同点是它们都返回一个答案或一个预测。比如,返回预测的模型的机器学习分支被命名为预测机器学习(predictivemachine learning)。这就是我们在本书中

if= 13.4| 当edna遇上机器学习法-爱代码爱编程

近日,凌恩生物客户重庆医科大学在《Water Research》(IF= 13.4)发表研究论文“Supervised machine learning improves general applicability of eDNA metabarcoding for reservoir health monitoring”。该研究主要介绍了一种基于

机器学习 -爱代码爱编程

紧接上一篇文章机器学习-神经网络分类 继续描述 先得将数据从 numpy arrays 移到 PyTorch tensor 里。 import torch # 将数据从numpy移到PyTorch tensors里

第g1周:生成对抗网络(gan)入门-爱代码爱编程

第G1周:生成对抗网络(GAN)入门 第G1周:生成对抗网络(GAN)入门一、前言二、我的环境三、定义超参数,下载、配置数据四、定义模型1、定义鉴别器2、定义生成器 五、训练模型1、创建实例2、训练模型

【机器学习300问】56、什么是自编码器?-爱代码爱编程

一、什么是自编码器?         自编码器(Autoencoder,AE)本质是一种特殊的神经网络架构。主要用于无监督学习和特征学习任务。它的目标是通过编码然后解码的过程,学会重构其输入数据,试图还原其原始输入的。         当时我学到这里,我是一头雾水!为什么这样子做?AE他想把输出数据原原本本的还原成输入的数据,费那么多功夫干吗,不做这个

2024.3.31 机器学习周报-爱代码爱编程

引言 Abstract 文献阅读 1、题目 Lite-HRNet: A Lightweight High-Resolution Network 2、引言 我们提出了一个高效的高分辨率网络,Lite-HRNet,用于人体姿态估计。首先,我们简单地将Shuf Chronenet中的高效shuffle块应用于HRNet(高分辨率网络),从而获得比流行

7.一起学习机器学习 -爱代码爱编程

Prerequisites Basic familiarity with NumpyBasic familiarity with PyplotBasic familiarity with Pandas Outline

【氮化镓】gan器件中关态应力诱导的损伤定位-爱代码爱编程

概括总结: 这项研究通过低频1/f噪声测量方法,探究了在关态(OFF-state)应力作用下,AlGaN/GaN高电子迁移率晶体管(HEMTs)中由应力引起的损伤的定位。研究中结合了电致发光(EL)分析,以更准确地确定损伤的位置和性质。研究发现,除了栅极边缘击穿之外,随着时间的推移,还会在栅极下方以及可能扩展到栅极-漏极区域的高电场区域逐渐产生捕获态。1

[机器学习]练习knn算法-爱代码爱编程

曼哈顿距离(Manhattan distance) 曼哈顿距离是指在几何空间中两点之间的距离,其计算方法是通过将两点在各个坐标轴上的差值的绝对值相加得到。在二维空间中,曼哈顿距离可以表示为两点在横纵坐标上的差值的绝对值之和;在三维空间中,则是在三个坐标轴上的差值的绝对值之和。想象你在城市道路里,要从一个十字路口开车到另外一个十字路口,驾驶距离是两点间的直

机器学习:scikit-爱代码爱编程

scikit-learn(sklearn)是一个用于机器学习的Python库,它提供了广泛的算法和工具,用于数据预处理、模型构建、模型评估、模型选择等。scikit-learn的设计遵循一致的API原则,使得使用不同的模型和算法变得简单且直观。以下是scikit-learn的主要组件及其功能: 1. 数据预处理(sklearn.preprocessing

机器学习概念、步骤、分类和实践-爱代码爱编程

在当今数字化时代,机器学习已经渗透到我们生活的方方面面,从智能手机应用、搜索引擎优化,到自动驾驶汽车、医疗诊断等,其应用无处不在。本文将带您走进机器学习的世界,了解它的基本概念、步骤、分类以及实践应用。 一、机器学习基本概

python环境下基于机器学习的空压机故障识别(出口阀泄漏等)-爱代码爱编程

Python环境下基于机器学习(多层感知机,决策树,随机森林,高斯过程,AdaBoost,朴素贝叶斯)的压缩机故障识别(出口阀泄漏,止逆阀泄露,轴承损伤,惯性轮损伤,活塞损伤,皮带损伤等)。 空压机是一种经典的动力设备,也被誉为企业产品生产的"生命气源",,广泛应用于制药工业、爆破采煤、矿上通风、风动实验等众多领域。空压机的工作机理是通过利用旋转电机的机