1. 回顾与引入
上节课我们谈到了机器学习的一些实战技巧,比如如何处理数据、选择模型以及调整参数。今天,我们将更深入地探讨机器学习的两大类:监督学习和非监督学习。
2. 监督学习
监督学习就像是有老师的教学过程。在这个过程中,我们给算法提供带有标签的数据,让算法学习如何根据输入数据预测输出结果。想象一下,如果你是一名学生,老师给了你很多例题和答案,然后让你自己解题,这就是监督学习。
2025年05月23日
上节课我们谈到了机器学习的一些实战技巧,比如如何处理数据、选择模型以及调整参数。今天,我们将更深入地探讨机器学习的两大类:监督学习和非监督学习。
监督学习就像是有老师的教学过程。在这个过程中,我们给算法提供带有标签的数据,让算法学习如何根据输入数据预测输出结果。想象一下,如果你是一名学生,老师给了你很多例题和答案,然后让你自己解题,这就是监督学习。
2025年05月23日
在上一节我们介绍了分类模型的评估,本节我们介绍一下回归模型的评估,对于回归模型的评估指标,常用的指标有:
第一个是均方误差,英文是Mean Squared Error,简写是MSE,它是对每个预测值减去实际值的平均数然后取平方的和再除以总数。
第二个是决定系数,英文是Coefficient of Determination,简写是R^2,它衡量的是回归模型的拟合优度
2025年05月23日
准确预测Fitbit的睡眠得分
在本文的前两部分中,我获取了Fitbit的睡眠数据并对其进行预处理,将这些数据分为训练集、验证集和测试集,除此之外,我还训练了三种不同的机器学习模型并比较了它们的性能。
在第2部分中,我们看到使用随机森林和xgboost默认超参数,并在验证集上评估模型性能会导致多元线性回归表现最佳,而随机森林和xgboost回归的表现稍差一些。
2025年05月23日
tochvision主要处理图像数据,包含一些常用的数据集、模型、转换函数等。torchvision独立于PyTorch,需要专门安装。
2025年05月23日
乳腺癌严重威胁女性健康,AI 在乳腺癌筛查中利弊共存。(基于澳大利亚女性偏好研究)《The Patient - Patient-Centered Outcomes Research》:Preferences for the Use of Artificial Intelligence for Breast Cancer Screening in Australia: A Discrete Choice Experiment
2025年05月23日
论文提出伪监督目标定位方法(PSOL)来解决目前弱监督目标定位方法的问题,该方法将定位与分类分开成两个独立的网络,然后在训练集上使用Deep descriptor transformation(DDT)生成伪GT进行训练,整体效果达到SOTA,论文化繁为简,值得学习
来源:晓飞的算法工程笔记 公众号
论文: Rethinking the Route Towards Weakly Supervised Object Localization
2025年05月23日
迁移学习的出现进一步加速了计算机视觉——图像分类用例的快速发展。 在大型图像数据集上训练计算机视觉神经网络模型需要大量的计算资源和时间。
幸运的是,通过使用预训练模型可以缩短时间和资源。 利用预训练模型的特征表示的技术称为迁移学习。 预训练通常使用高端计算资源和海量数据集进行训练。