25、二分类、多分类与多标签问题的区别

Wesley13
• 阅读 827

二分类、多分类与多标签的基本概念

二分类:表示分类任务中有两个类别,比如我们想识别一幅图片是不是猫。也就是说,训练一个分类器,输入一幅图片,用特征向量x表示,输出是不是猫,用y=0或1表示。二类分类是假设每个样本都被设置了一个且仅有一个标签 0 或者 1。

多类分类(Multiclass classification): 表示分类任务中有多个类别, 比如对一堆水果图片分类, 它们可能是橘子、苹果、梨等. 多类分类是假设每个样本都被设置了一个且仅有一个标签: 一个水果可以是苹果或者梨, 但是同时不可能是两者。

多标签分类(Multilabel classification): 给每个样本一系列的目标标签. 可以想象成一个数据点的各属性不是相互排斥的(一个水果既是苹果又是梨就是相互排斥的), 比如一个文档相关的话题. 一个文本可能被同时认为是宗教、政治、金融或者教育相关话题。

多分类问题与二分类问题关系

25、二分类、多分类与多标签问题的区别

 两类问题是分类问题中最简单的一种。而很多多类问题可以被分解为多个两类问题进行求解。

多标签问题与二分类问题关系

25、二分类、多分类与多标签问题的区别

这幅图中有一栋房子、树、云、草,具有多个标签。多标签问题主要体现含有什么标签,而多分类问题主要体现区分出。

整个网络是fully connected全连接网络。 

* 网络结构是输入层=你的特征的维度。 

* 隐藏层是500*100,激励函数都是relu。隐藏层的节点数量和深度请根据自己的数量来自行调整,这里只是举例。 

* 输出层是你的label的维度。使用sigmoid作为激励,使输出值介于0-1之间。 

* 训练数据的label请用0和1的向量来表示。0代表这条数据没有这个位的label,1代表这条数据有这个位的label。假设3个label的向量[天空,人,大海]的向量值是[1,1,0]的编码的意思是这张图片有天空,有人,但是没有大海。 

* 使用binary_crossentropy来进行损失函数的评价,从而在训练过程中不断降低交叉熵。实际变相的使1的label的节点的输出值更靠近1,0的label的节点的输出值更靠近0。

总结

分类问题名称

输出层使用激活函数

对应的损失函数

二分类

sigmoid函数

二分类交叉熵损失函数

多分类

softmax函数

多类别交叉熵损失函数

多标签分类

sigmoid函数

二分类交叉熵损失函数

参考文献

[1] https://juejin.im/post/5b38971be51d4558b10aad26

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
待兔 待兔
4个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Wesley13 Wesley13
3年前
IOS 面试题(四)
1.ObjectC有多继承吗?没有的话用什么代替?
1OC是单继承,没有多继承2有时可以用分类和协议来代替多继承2.ObjectC有私有方法吗?私有变量呢?
1OC没有类似@private(http://my.
Stella981 Stella981
3年前
Spark2.0机器学习系列之8:多类分类问题(方法归总和分类结果评估)
一对多(OnevsRestclassifier)将只能用于二分问题的分类(如Logistic回归、SVM)方法扩展到多类。参考:http://www.cnblogs.com/CheeseZH/p/5265959.html(https://www.oschina.net/action/G
Stella981 Stella981
3年前
CSS 分类 (Classification)
★★CSS分类属性(Classification)★★⑴CSS分类属性允许你控制如何显示元素,设置图像显示于另一元素中的何处,相对于其正常位置来定位元素,使用绝对值来定位元素,以及元素的可见度。⑵下面是常用的属性以及描述:!(https://oscimg.oschina.net/oscnet/00cb565
Wesley13 Wesley13
3年前
CIFAR
1、CIFAR10,是一个用于做图像分类研究的数据集。由60000个图片组成6万个图片中,5万张用于训练,1万张用于测试每个图片是32x32像素所有图片可以分成10类每个图片都有一个标签,标记属于哪一个类测试集中一个类对应1000张图训练集中将5万张图分为5份类之间的图片是互
Wesley13 Wesley13
3年前
KNN分类算法原理分析及代码实现
1、分类与聚类的概念与区别分类:是从一组已知的训练样本中发现分类模型,并且使用这个分类模型来预测待分类样本。目前常用的分类算法主要有:朴素贝叶斯分类算法(NaïveBayes)、支持向量机分类算法(SupportVectorMachines)、KNN最近邻算法(kNearestNeighbors)、神经网络算法(NNet)以及决策树(De
Wesley13 Wesley13
3年前
2、创建分类器笔记
创建分类器\\简介:\\分类是指利用数据的特性将其分类成若干类型的过程。分类与回归不同,回归的输出是实数。监督学习分类器就是用带标记的训练数据建立一个模型,然后对未知的数据进行分类。分类器可以实现分类功能的任意算法,最简单的分类器就是简单的数学函数。其中有二元(binary)分类器,将数据分成两类,也可多元(m
Stella981 Stella981
3年前
Spark OneHotEncoder
1、概念独热编码(OneHotEncoding) 将表示为标签索引的分类特征映射到二进制向量,该向量最多具有一个单一的单值,该单值表示所有特征值集合中特定特征值的存在。此编码允许期望连续特征(例如逻辑回归)的算法使用分类特征。对于字符串类型的输入数据,通常首先使用StringIndexer
大数据——决策树(decision tree)
大数据————决策树(decisiontree)决策树(decisiontree):是一种基本的分类与回归方法,主要讨论分类的决策树。在分类问题中,表示基于特征对实例进行分类的过程,可以认为是ifthen的集合,也可以认为是定义在特征空间