05 模型训练和测试EBET易博真人平台

  新闻资讯     |      2023-09-19 04:02

  建模可以使用不同的 “图纸” :Logistic、SVM、Bayes ,根据三个不同的图纸,选择最像任务目标的模型。这是一种的过程。

  根据Logistic回归,设置不同的参数,比如Logistic回归有个参数alpha,分别设置为0.8、1、5 会生成出三个不同的模型。 根据不同的模型结果,我们可以判断哪个参数值最佳。这也是一种的过程。

  交叉验证:Cross Validation 将数据分为训练集和测试集,训练集构建模型,测试集评估模型,提供修改意见。训练集和测试集随机从总体样本中随机抽取,需要包含所有的特征值。

  模型选择:个人建议先尽可能多的选择算法进行执行,比较执行结果。然后在最优的模型基础上进行参数调整。

  1、原始数据:已知结果的样本数据,将原始数据根据一定比例分为训练集和开发集,训练集用来构建模型,开发集用来对模型调优。

  2、新数据:未知结果的样本,当模型构建完成以后,从市场上获取的新数据,这些数据没有目标值,通过输入我们构建的模型输出结果。最后对这些结果进行调研,判断预测的准确性。

  上述的流程是实际工作中的步骤,比如在天池比赛的时候能够获取到的只有原始数据,最后检测模型的时候才会用到新数据,用来对你的模型进行最后的评分。但在学习过程中没有新数据的来源,所以只考虑原始数据中的训练集和开发集,在后文中直接称为训练集和测试集。

  分类预测:在二分类问题中,如果预测目标是姓别(男=1,女=0), 预测结果1表示正例,0表示负例

  分类模型的测试一般会从以下几个方面进行比较:准确率、召回率、精准率、F值。

  1、准确率:Accuracy = 提取出的正确样本数 / 总样本数。提取出的正确样本数 = 预测正确的正例+负例。

  2、召回率 :Recall = 正确的正例样本数 / 样本中的正例样本数 (覆盖率)

  3、精准率:Precision = 正确的正例样本数 / 预测为正例的样本数

  不同的项目对于指标的选取不同。比如在金融反欺诈的模型中,1表示具有欺诈风险,0表示无风险,我们期望将真正有欺诈嫌疑的目标都预测出来,所以更多关注的是召回率。

  事实上一个模型很难保证精准率和召回率同时都很高,比如:模型1(召回=85%,精准=89%);模型2(召回=87%,精准=83%);这种情况下各位会选择什么模型?此时可以计算F值来作为最后的衡量标准。如果最后F值都相同,个人建议使用准确率高的模型。(Sklearn中,默认的模型评价指标就是准确率。)

  PS:那么对于多分类的问题,如何使用召回率、精准率进衡量?后续的文章会进一步说明,可以先自己思考一下。

  比如,预测一个二分类的概率问题。假设A出现的概率是p,A不出现的概率是1-p,根据调整p的值对样本进行预测。

  p值的改变就是调参的过程,最后将所有的点连成一条曲线连成的图形面积标记称为:AUC(Area Under Curvve)。

  AUC的定义:ROC曲线下的面积,显然这个面积的数值不会大于1。ROC曲线一般都会处于 y=x 这条直线的上方,如果ROC位于 y=x 的直线下方,意味着模型的预测还不如随机预测的准确率高,那么将曲线的计算结果反向预测,就能得到一条以 y=x 为对称轴的对称曲线,显然若之前的预测成功率低于50%,那么对称的曲线%。于是我们可以保证,AUC的取值范围在0.5和1之间。

  AUC = 1:完美分类器,用这个模型的时候,不管设置什么阈值(p的值不论怎么改变) 都能做出完美预测,即最初我们提到的造物主公式。一般情况下不可能获得这种分类器。

  0.5 AUC 1:比随机猜测优秀,妥善设置阈值能够有预测的价值。

  AUC 0.5:比随机猜测还差,但只要进行反向预测,即可高于随机猜测。

  回归预测:对离散数据的预测,我们希望模型结果对预测范围的误差尽可能的小,比如一些连续型的数据(身高、体重)几乎不可能百分百得预测准确,因此误差越尽可能的小就是一个优秀的模型。

  今天我们就来说下:宝妈兼职一年能挣多少钱?适合宝妈上班族在家做的副业兼职,不交押金。 大家好!我是花桃平台最大团队...

  今天我们就来说下:彩妆什么牌子的质量最好?5大品牌选购指南 大家好!我是花桃平台最大团队&联合创始人大同导师。相较...

  在信息时代,兼职工作的机会丰富多样,而书旗小说打字录入员正是一个备受瞩目的兼职机会。本文将深入探讨书旗小说打字录入...

  返利App成为现代人省钱购物的利器,而高省作为一款知名返利App,备受用户青睐。本文将为您推荐几款值得使用的返利A...

  全网最低,质量最好,一手货源的原版,广州奢包汇是你的的选择。团队直接和工厂对接,原厂正品定制板开通,支持图纸咨询!...

  中国电信星卡29元套餐靠谱吗?关注微•信•公•众•号卡泡泡就知道啦! ☞大流量卡套餐「→点这免费申请办理」[h...

  随着互联网的飞速发展,返利小助手等类似平台在市场上如雨后春笋般涌现。这些平台声称通过购物给用户返利,吸引了越来越多...

  抖音返利官网?抖音的官方返利平台 抖音商品返佣方法攻略?抖音怎么购物返利? 抖音在一些人眼里即使消费平台,也是赚钱...

  淘宝转链接软件是一种可以将淘宝商品链接转换成自己的推广链接,EBET易博app让用户通过这些链接购买商品,从而获得佣金的工具。 领购...

  京东双十一优惠力度与高省返利的实用推荐 京东双11作为一年一度的购物狂欢节,为消费者们提供了丰富多彩的优惠活动。消...

  【转】机器学习模型评价1(Evaluating Machine Learning Models)

  第五章 模型评价方法 5.1 模型的评价方法介绍 5.1.1~5 accuracy,precision,recal...

  作者:hooly微信公众号:一口袋星光 目录: 1.说明;2.概念;3.bias-variance trade-o...

  文章转载自Google,最近更新:2018-08-3 Google上线了一个“机器学习速成课程”,英文简称MLCC...

  文/芳菲晚 片段【5】我做了一个奇妙的梦,梦里出现的地方,我好像在那呆了很久,又好像我从未去过。那里花香四溢,溪水...