一、从多臂赌博机到MDP
多臂赌博机问题只需要在单一情境下选择动作,而现实中的决策往往更复杂:一个动作不仅影响当下的奖励,还会改变未来的情境(状态)。例如,下棋时走一步棋会改变棋盘状态,进而影响后续所有可能的走法和最终胜负。
有限马尔可夫决策过程(finite MDP)正是为这种
2025年08月29日
多臂赌博机问题只需要在单一情境下选择动作,而现实中的决策往往更复杂:一个动作不仅影响当下的奖励,还会改变未来的情境(状态)。例如,下棋时走一步棋会改变棋盘状态,进而影响后续所有可能的走法和最终胜负。
有限马尔可夫决策过程(finite MDP)正是为这种
2025年08月29日
现代人拖延理由千奇百怪,有的害怕失败;有的因为完美主义倾向而拖延;有的不想走出“舒适区”。作者在本篇文章中从“时间折扣策略”上来战胜拖延,想要改变拖延的朋友们一起来看看吧~
现代人拖延产生的原因有很多,比如因为害怕失败而拖延,因为完美主义倾向而拖延,不想走出“舒适区”而拖延等等, 今天我们要针对一个常见的原因“一直觉得没有准备好,想等最佳时机再开始”而产生的拖延来看,如何从“时间折扣策略”的思路中找到些启发。
2025年08月29日
一、交叉验证基础
1. 核心概念
定义:通过多次划分数据集评估模型性能,减少评估偏差。
目的:优化超参数选择,提升模型泛化能力。
2. K折交叉验证(KFold CV)
流程:
1. 数据均匀分为K个子集。
2. 轮流以1个子集为验证集,其余为训练集,重复K次。
优势:充分利用有限数据,评估更稳定。
3. 适用场景
数据量较小(如<10k样本)。
需严格评估模型稳定性时。
2025年08月29日
PyOD是一个全面且易于使用的Python库,专门用于检测多变量数据中的异常点或离群点。异常点是指那些与大多数数据点显著不同的数据,它们可能表示错误、噪声或潜在的有趣现象。无论是处理小规模项目还是大型数据集,PyOD提供了50多种算法以满足用户的需求。PyOD的特点包括:
2025年08月29日
欢迎关注“
计算机视觉研究院
”
计算机视觉研究院专栏
作者:Edison_G
关于 PyTorch 炼丹,本文作者表示:「如果你有 8 个 GPU,整个训练过程只需要 2 分钟,实现 11.5 倍的性能加速。
2025年08月29日