- 博客(20)
- 收藏
- 关注
原创 数据挖掘——matplotlib
数据挖掘matplotlib部分,包括柱状图,折线图,直方图,饼图,散点图的绘画,并提供了具体的案例和对应代码,已经运行后的结果展示。
2024-07-09 20:12:07
1285
原创 机器学习——逻辑回归
逻辑回归是一个二分类算法,本文主要介绍了逻辑回归流程以及逻辑回归的损失评估,报考精确率和召回率,F1-score,ROC曲线和AUC指标,最后以癌症预测为案例并查看各种评估指标。
2024-07-06 14:48:42
1458
原创 机器学习——朴素贝叶斯算法
介绍了朴素贝叶斯与普通贝叶斯分类,并列举了如何计算贝叶斯概率以及分类流程,最后以垃圾短信分类为例,可发现朴素贝叶斯在文本处理能力出色。
2024-07-03 15:06:52
1045
原创 机器学习案例--使用KNN邻近算法预测Facebook用户签到位置
此时正确率较低,是因为筛选了经纬度固定的用户数据,但是我们在处理数据时还新增了一些数据,且过滤掉了次数少于3次的地点,最后,KNN是一个基于距离的算法,对线性关系处理较好。数据通常包括用户ID、签到时间、签到地点的经纬度、位置ID等。其中,row_id表示数据对应的id,在预测时无作用,x,y表示对应的经纬度,而accuracy表示测量进度,time表示时间戳(1970年1月1日起始),place_id为签到位置对应的id。:给定用户的签到记录,预测用户未来可能签到的地点(place_id)
2024-06-15 02:41:00
672
原创 特征抽取--文本特征抽取和字典特征抽取
在做训练前,对于给定的数据,可能会出现字符串、bool值等类型数据,这一步的工作就是就是将此类特征转化成机器学习时所需要的数据特征。
2024-05-31 22:17:00
633
癌症预测数据集,可用逻辑回归完成模型的构建
2024-07-06
波士顿房价数据集,包含四个特征
2024-07-05
朴素贝叶斯分类-短信数据集
2024-07-03
Facebook用户签到位置预测数据集
2024-06-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人