醋醋百科网

Good Luck To You!

趋动云带你看|WACV 2024 获奖论文都在研究什么

IEEE/CVF 计算机视觉应用冬季会议(WACV)是国际上最重要的计算机视觉盛会,包括主会场和多个同期举行的研讨会和教程。会议质量高、费用低,为学生、学者和行业研究人员提供了极高的价值。

近日,WACV 2024 会议在 Naupaka 宴会厅拉开帷幕。今年,会议收到了总计 2042 篇有效提交论文,分为两轮提交:第一轮提交 817 篇,第二轮提交 1226 篇。在这些提交论文中,Algorithms 方向占比为 77%,Applications 方向占比为 23%。综合录取率达到了 41%,其中口头报告的录取率为 3%。

第一轮接收率

第二轮接收率

趋动云的用户主要是从事人工智能(AI)和计算机视觉(CV)领域的学习者。他们对于 WACV(Winter Conference on Applications of Computer Vision)会议的获奖论文格外关注。本文将带领大家一同回顾今年的获奖论文,希望能为大家在研究方面提供一些启发!

最佳论文奖(Algorithms)

Conditional Velocity Score Estimation for Image Restoration

  • 论文链接:https://openaccess.thecvf.com/content/WACV2024/papers/Shi_Conditional_Velocity_Score_Estimation_for_Image_Restoration_WACV_2024_paper.pdf
  • 作者单位:Fujitsu R&D Center

本篇论文提出conditional velocity score approximation (CVSA),将当前时刻观测到的信号速度得分转移到初始时刻得分的计算中,从而能够估算难以解决的 CVS。在多个数据库和多个任务(包括去模糊、修复、超分辨率、相位检索和盲去模糊)上进行的实验证明,CVSA 是有效的,并取得了最先进(SOTA)的结果。

最佳论文奖(Applications)

WildlifeDatasets: An Open-Source Toolkit for Animal Re-Identification

  • 论文链接:https://openaccess.thecvf.com/content/WACV2024/papers/Cermak_WildlifeDatasets_An_Open-Source_Toolkit_for_Animal_Re-Identification_WACV_2024_paper.pdf
  • 项目链接:https://github.com/WildlifeDatasets/wildlife-datasets
  • HuggingFace hub:https://huggingface.co/BVRA
  • 作者单位:捷克理工大学;皮尔森西波西米亚大学;INRIA;伦敦玛丽女王大学

本篇论文介绍了 WildlifeDatasets 工具包,一个开源、用户友好的库,可提供:(i) 方便访问和操作所有公开可用的野生动物数据集,用于个体重识别;(ii) 访问各种最先进的动物重识别模型;(iii) 简单的应用程序接口,允许对新数据集进行推理和匹配。

另外,创建了首个广泛适用于多个物种的个体重识别的基础模型 - MegaDescriptor。该模型在动物重识别数据集上表现出色,明显优于其他预训练模型,如CLIP和DINOv2。

为了让该模型能够为广大公众所用,并能轻松集成到任何现有的野生动物监测应用中,作者通过HuggingFace hub提供了多个MegaDescriptor版本(包括Small、Medium和Large)。

最佳学生论文

Wino Vidi Vici: Conquering Numerical Instability of 8-Bit Winograd Convolution for Accurate Inference Acceleration on Edge

  • 论文链接:https://openaccess.thecvf.com/content/WACV2024/papers/Mori_Wino_Vidi_Vici_Conquering_Numerical_Instability_of_8-Bit_Winograd_Convolution_WACV_2024_paper.pdf
  • 作者单位:都灵理工大学;BMW Group;慕尼黑工业大学

本次工作解决的问题是影响边缘设备上 8 位量化 Winograd 算法执行的数值不稳定性。

首先,在 CNN 训练期间使用复数引入了基于 Winograd 的卷积,使得基于F(4, 3) Winograd 的 ResNet-20-CIFAR-10 在 MAC 操作上实现了 2.78 倍的降低,同时没有出现准确度的下降。

在 Winograd 域中引入了一个可训练的剪切因子,用于量化变换后的参数,从而使得在 ResNet-18-ImageNet 上实现了 ACs 的减少,降低了 2.45 倍,而准确度仅下降了大约1个百分点。

将上述两者结合,在 ResNet-18-ImageNet 上实现了 2.11 倍的操作减少,在 CityScapes 数据集上的 DeepLabV3+ 上实现了 2.14 倍的操作减少,而预测质量没有降低。

image

最佳论文荣誉提名

ParticleNeRF: A Particle-Based Encoding for Online Neural Radiance Fields

  • 论文链接:https://openaccess.thecvf.com/content/WACV2024/papers/Abou-Chakra_ParticleNeRF_A_Particle-Based_Encoding_for_Online_Neural_Radiance_Fields_WACV_2024_paper.pdf
  • 项目链接:https://github.com/jc211/ParticleNeRF
  • 作者单位:昆士兰科技大学;阿德莱德大学

现有的用于动态场景的神经辐射场(NeRF)多是离线方法,注重视觉保真度,而本次工作则针对在线用例,重点是实时适应性。

所提出的新方法 ParticleNeRF,可以在不使用时间条件变形网络的情况下每 200 毫秒适应动态场景的变化;是基于粒子的新编码方法,将特征与运动粒子关联起来,允许光度损失的梯度传播到粒子的位置并改变其位置;将物理系统融入NeRF公式中,以更新粒子的运动同时防止碰撞。

ParticleNeRF 是第一个在线动态的神经辐射场(NeRF),在具有在线约束的动态场景中实现了快速的适应性,并且在视觉保真度上优于 Brute-force 在线 InstantNGP 和其他基线方法。

WACV 2024 为 AI/CV 领域的顶尖会议论文、创新技术拉开了新的篇章,衷心地感谢在勇攀技术巅峰的征途上不懈努力的每一位先行者!

趋动云也将在新的一年中继续提供便捷且强大的算力,打造更具活力和发展潜力的算力平台,为创新之路注入源源不断的动力!



控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言