前言:拆解YOLO的"超级大脑"
还记得我们上篇文章用5行代码实现的物品检测吗?今天我要带你走进YOLOv12的"大脑",看看这个闪电侠是如何思考的!
2025年06月04日
还记得我们上篇文章用5行代码实现的物品检测吗?今天我要带你走进YOLOv12的"大脑",看看这个闪电侠是如何思考的!
2025年06月04日
本文转自新智元 编辑:肖琴、大明
一张贴纸让你在AI面前”隐身“。
来自比利时鲁汶大学 (KU Leuven) 几位研究人员最近的研究发现,借助一张简单打印出来的图案,就可以完美避开 AI 视频监控系统。
研究人员表示,他们设计的图像可以将整个人隐藏起来,不会让计算机视觉系统发现。这项研究在YOLO (v2) 的开源对象识别系统上进行了演示。
如上图所示,AI 系统成功检测到左边的人,而右边的人被忽略了。右边的人身上挂着一块彩色纸板,在论文中被称为 “对抗性补丁”(adversarial patch),正是这块补丁 “欺骗” 了 AI 系统,让系统无法发现画面中还有一个人。
2025年06月04日
自从Deepseek横空出世以来,人们会情不自禁地拿Deepseek和ChatGPT作比较。看两者到底有何不同。
那么在模型架构和工资机制比较上,有一个术语,非常不容易理解,就是ChatGPT的Transformer模型架构中的
2025年06月04日
有人质疑、嘲讽和挖苦我先前一篇短文说的神经网络大量计算就是矩阵乘法、大模型就是统计模型,但又不提供具体的反例证据,那我就借用别人总结的大模型核心算法-自注意力机制图(类似的图网上有很多)简单解释回应一下:
图中的方块都表示为矩阵,Q、K、V都是X矩阵和相应的权重矩阵相乘而来,再经过Q、K矩阵相乘,归一化处理得到P矩阵,最后P、V矩阵相乘,得到注意力得分矩阵。是否多数时间在进行矩阵乘法运算?
2025年06月04日
《Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting》,收录于国际人工智能会议(AAAI-2019),作者是北京交通大学的郭晟楠,宋超,冯宁,以及林友芳、万怀宇老师。
论文下载地址:
https://aaai.org/ojs/index.php/AAAI/article/download/3881/3759
2025年06月04日
近日,清华大学团队打造了首个用于推理加速的微缩版 FP4 注意力机制——SageAttention3,在英伟达 RTX5090 上实现了 1038TOPS 的计算性能。
2025年06月03日
单例模式是 Java 中最简单的设计模式之一,它是指一个类在运行期间始终只有一个实例,我们就把它称之为单例模式。它不但被应用在实际的工作中,而且还是面试中最常考的题目之一。通过单例模式我们可以知道此人的编程风格,以及对于基础知识的掌握是否牢固。
我们本课时讲的是,单例的实现方式有几种?它们有什么优缺点?
单例的实现分为饿汉模式和懒汉模式。