Apple 将于下周前往纳什维尔,在那里它将展示新的计算机视觉研究,并在今年的 IEEE/CVF 计算机视觉和模式识别会议上进行现场技术演示。
三篇论文,一个演示
今年的CVPR将于 6 月 11 日至 15 日在田纳西州纳什维尔举行,Apple 将在现场展示其最近发布的三篇白皮书:二之哪我们最近在 We 上报道了:
- FastVLM:视觉语言模型的高效视觉编码,该模型通过使用更少的视觉标记来显著加快实时高分辨率图像理解
- Matrix3D:大型摄影测量模型一体化,这是一个统一的模型,即使在训练数据不完整时也能简化 3D 内容创建。
- 具有显式 3D 建模的世界一致性视频扩散,该模型可提高 3D 一致性,并在相机位置未知时实现更准确的 3D 结构预测。
IEEE/CVF CVPR 自 1983 年以来一直举办,是该领域最具竞争力和影响力的活动之一。只有不到 5% 的提交被选中进行口头报告。
Apple 将在以下日期和时间演示 FastVLM:
- 6 月 13 日星期五:上午 10:00 – 中午 12:30,下午 2:30 – 下午 4:30
- 6 月 14 日星期六:上午 10:00 – 中午 12:30,下午 2:30 – 下午 4:30
- 6 月 15 日星期日:上午 10:00 – 中午 12:30
此外,20 多名 Apple 附属研究人员被列为会议的评审员,这表明该公司希望与 AI 生态系统的学术方面进行深度整合。