05 模型训练和测试EBET易博真人平台_EBET易博·(中国)真人官网

05 模型训练和测试EBET易博真人平台

新闻资讯 | 2023-09-19 04:02

　　建模可以使用不同的 “图纸” ：Logistic、SVM、Bayes ，根据三个不同的图纸，选择最像任务目标的模型。这是一种的过程。

　　根据Logistic回归，设置不同的参数，比如Logistic回归有个参数alpha，分别设置为0.8、1、5 会生成出三个不同的模型。根据不同的模型结果，我们可以判断哪个参数值最佳。这也是一种的过程。

　　交叉验证：Cross Validation 将数据分为训练集和测试集，训练集构建模型，测试集评估模型，提供修改意见。训练集和测试集随机从总体样本中随机抽取，需要包含所有的特征值。

　　模型选择：个人建议先尽可能多的选择算法进行执行，比较执行结果。然后在最优的模型基础上进行参数调整。

　　1、原始数据：已知结果的样本数据，将原始数据根据一定比例分为训练集和开发集，训练集用来构建模型，开发集用来对模型调优。

　　2、新数据：未知结果的样本，当模型构建完成以后，从市场上获取的新数据，这些数据没有目标值，通过输入我们构建的模型输出结果。最后对这些结果进行调研，判断预测的准确性。

　　上述的流程是实际工作中的步骤，比如在天池比赛的时候能够获取到的只有原始数据，最后检测模型的时候才会用到新数据，用来对你的模型进行最后的评分。但在学习过程中没有新数据的来源，所以只考虑原始数据中的训练集和开发集，在后文中直接称为训练集和测试集。

　　分类预测：在二分类问题中，如果预测目标是姓别(男=1,女=0)，预测结果1表示正例，0表示负例

　　分类模型的测试一般会从以下几个方面进行比较：准确率、召回率、精准率、F值。

　　1、准确率：Accuracy = 提取出的正确样本数 / 总样本数。提取出的正确样本数 = 预测正确的正例+负例。

　　2、召回率：Recall = 正确的正例样本数 / 样本中的正例样本数 (覆盖率)

　　3、精准率：Precision = 正确的正例样本数 / 预测为正例的样本数

　　不同的项目对于指标的选取不同。比如在金融反欺诈的模型中，1表示具有欺诈风险，0表示无风险，我们期望将真正有欺诈嫌疑的目标都预测出来，所以更多关注的是召回率。

　　事实上一个模型很难保证精准率和召回率同时都很高，比如：模型1(召回=85%，精准=89%)；模型2(召回=87%，精准=83%)；这种情况下各位会选择什么模型？此时可以计算F值来作为最后的衡量标准。如果最后F值都相同，个人建议使用准确率高的模型。(Sklearn中，默认的模型评价指标就是准确率。)

　　PS：那么对于多分类的问题，如何使用召回率、精准率进衡量？后续的文章会进一步说明，可以先自己思考一下。

　　比如，预测一个二分类的概率问题。假设A出现的概率是p，A不出现的概率是1-p，根据调整p的值对样本进行预测。

　　p值的改变就是调参的过程，最后将所有的点连成一条曲线连成的图形面积标记称为：AUC(Area Under Curvve)。

　　AUC的定义：ROC曲线下的面积，显然这个面积的数值不会大于1。ROC曲线一般都会处于 y=x 这条直线的上方，如果ROC位于 y=x 的直线下方，意味着模型的预测还不如随机预测的准确率高，那么将曲线的计算结果反向预测，就能得到一条以 y=x 为对称轴的对称曲线，显然若之前的预测成功率低于50%，那么对称的曲线%。于是我们可以保证，AUC的取值范围在0.5和1之间。

　　AUC = 1：完美分类器，用这个模型的时候，不管设置什么阈值(p的值不论怎么改变) 都能做出完美预测，即最初我们提到的造物主公式。一般情况下不可能获得这种分类器。

　　0.5 AUC 1：比随机猜测优秀，妥善设置阈值能够有预测的价值。

　　AUC 0.5：比随机猜测还差，但只要进行反向预测，即可高于随机猜测。

　　回归预测：对离散数据的预测，我们希望模型结果对预测范围的误差尽可能的小，比如一些连续型的数据（身高、体重）几乎不可能百分百得预测准确，因此误差越尽可能的小就是一个优秀的模型。

　　今天我们就来说下：宝妈兼职一年能挣多少钱？适合宝妈上班族在家做的副业兼职,不交押金。大家好！我是花桃平台最大团队...

　　今天我们就来说下：彩妆什么牌子的质量最好?5大品牌选购指南大家好！我是花桃平台最大团队&联合创始人大同导师。相较...

　　在信息时代，兼职工作的机会丰富多样，而书旗小说打字录入员正是一个备受瞩目的兼职机会。本文将深入探讨书旗小说打字录入...

　　返利App成为现代人省钱购物的利器，而高省作为一款知名返利App，备受用户青睐。本文将为您推荐几款值得使用的返利A...

　　全网最低，质量最好，一手货源的原版，广州奢包汇是你的的选择。团队直接和工厂对接，原厂正品定制板开通，支持图纸咨询！...

　　中国电信星卡29元套餐靠谱吗？关注微•信•公•众•号卡泡泡就知道啦！ ☞大流量卡套餐「→点这免费申请办理」[h...

　　随着互联网的飞速发展，返利小助手等类似平台在市场上如雨后春笋般涌现。这些平台声称通过购物给用户返利，吸引了越来越多...

　　抖音返利官网？抖音的官方返利平台抖音商品返佣方法攻略？抖音怎么购物返利？抖音在一些人眼里即使消费平台，也是赚钱...

　　淘宝转链接软件是一种可以将淘宝商品链接转换成自己的推广链接，EBET易博app让用户通过这些链接购买商品，从而获得佣金的工具。领购...

　　京东双十一优惠力度与高省返利的实用推荐京东双11作为一年一度的购物狂欢节，为消费者们提供了丰富多彩的优惠活动。消...

　　【转】机器学习模型评价1(Evaluating Machine Learning Models)

　　第五章模型评价方法 5.1 模型的评价方法介绍 5.1.1~5 accuracy，precision，recal...

　　作者：hooly微信公众号：一口袋星光目录： 1.说明；2.概念；3.bias-variance trade-o...

　　文章转载自Google,最近更新：2018-08-3 Google上线了一个“机器学习速成课程”，英文简称MLCC...

　　文/芳菲晚片段【5】我做了一个奇妙的梦，梦里出现的地方，我好像在那呆了很久，又好像我从未去过。那里花香四溢，溪水...