醋醋百科网

Good Luck To You!

用Transformer进行图像语义分割,性能超最先进的卷积方法

丰色 发自 凹非寺
量子位 报道 | 公众号 QbitAI

正如大家所知,在进行图像语义分割时,图像被编码成一系列补丁后往往很模糊,需要借助

Transformer原理

在《机器学习综述》中大致罗列人工智能常见算法,近些年深度学习发展快速,其中Transformer为甚,其英文的意思是变形金刚,对的就是我们看电影变形金刚的意思。Transformer是大语言模型的基础,比如现在常见的GPT、Bert、PaLM等大模型。Transformer概念是由谷歌在2017年《Attention is All You Need》首次提出。它提出了sequence to sequence with self-attention机制,利用attention解决RNN等长文本无法并行计算。

Pytorch一行代码便可以搭建整个transformer模型

transformer模型是在NLP领域发表的论文attention is all you need中提出的一种语言处理模型,其transformer模型由于加速了模型推理时间与训练精度,越来越受到了广大机器学习爱好者的追求。特别是transformer模型应用到CV计算机视觉领域后,transformer模型更是得到了广大的应用。

最近大火的AI绘图stable diffusion也是应用到了transformer模型。虽然transformer模型是Google发布的论文,且最初的实现代码是基于TensorFlow实现的,但是pytorch的流行,让很多机器学习爱好者使用pytorch来实现transformer模型。

使用Transformer来做物体检测

作者:Jacob Briones

YOLO v3、FaceNet和SVM的人脸检测识别系统源码(python)分享

先转发,然后关注@大数据java架构师 私信“人脸”获取下载链接

项目简介

fine-tune YOLO v3 + FaceNet进行人脸识别,辨别。

YOLOv7与MediaPipe在人体姿态估计上的对比

前期文章的分享,我们介绍了YOLOv7人体姿态估计的文章以及MediaPipe人体姿态估计方面的文章。由于YOLOv7与MediaPipe都可以进行人体姿态估计,我们本期就对比一下2个算法的不同点。

基于深度学习的植物病害图像识别算法综述

立减50元!全新 RISC-V智算开发板 MaixCAM 线上首发

文章转自Sipeed矽速科技

2024 甲辰龙年,RISC-V 龙腾之年,Sipeed 的 Maix 智算视觉生态终于迎来重大更新。MaixCAM,一款拥有Python/C++ SDK、自研IDE、智能视听、炫酷大模型的全能型板卡上线啦~

张淑娟等:基于改进YOLOv8n的不同栽培模式下玉露香梨轻量化检测

阅读文章全文:http://www.tcsae.org/article/doi/10.11975/j.issn.1002-6819.202410103

欺骗自动监控摄像头:利用对抗性图像块攻击人体检测


在过去的几年中,对机器学习模型的对抗攻击越来越引起人们的兴趣。通过仅对卷积神经网络的输入进行细微更改,可以输出完全不同的结果。最初的攻击是通过稍微改变输入图像的像素值来欺骗分类器以输出错误类来实现的。

在本文中提出了一种生成对抗图像块的方法,该图像块针对具有许多类内变异的目标,即人。目标是生成一个能够成功地将人隐藏在人体分类器中的图像块。攻击可能被恶意使用,以阻碍现有的监视系统,入侵者可以通过在对准监控摄像机的身体上放一块小纸板来偷偷摸摸。

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言