麦克豌豆 MacPea.com
No Result
View All Result
  • Login
  • 首页
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐
    Cyberpunk 2077: Ultimate Edition for macOS(Apple Silicon)赛博朋克 2077 Mac版下载

    Cyberpunk 2077: Ultimate Edition for macOS(Apple Silicon)赛博朋克 2077 Mac版下载

    Mac玩家狂喜!《Hades II》上线啦⚡比前作还上头!

    Mac玩家狂喜!《Hades II》上线啦⚡比前作还上头!

    破门而入2:北方特遣队 Door Kickers 2 for Mac – 战术策略新体验

    破门而入2:北方特遣队 Door Kickers 2 for Mac – 战术策略新体验

    Mac也可以大表哥了!《荒野大镖客:救赎》Mac版下载及安装指南

    Mac也可以大表哥了!《荒野大镖客:救赎》Mac版下载及安装指南

    NBA 2K25 Arcade Edition for Mac 经典Mac篮球游戏再升级

    NBA 2K25 Arcade Edition for Mac 经典Mac篮球游戏再升级

    Easy Red 2 for Mac 二战题材Mac射击游戏

    Easy Red 2 for Mac 二战题材Mac射击游戏

    热门标签

    • Mac游戏
    • 死亡搁浅mac
    • 全面战争 mac
    • 足球经理
    • 美国卡车模拟Mac
    • NBA 2K24
  • macOS下载
  • Mac产品库
  • Mac软件下载
PRICING
SUBSCRIBE
  • 首页
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐
    Cyberpunk 2077: Ultimate Edition for macOS(Apple Silicon)赛博朋克 2077 Mac版下载

    Cyberpunk 2077: Ultimate Edition for macOS(Apple Silicon)赛博朋克 2077 Mac版下载

    Mac玩家狂喜!《Hades II》上线啦⚡比前作还上头!

    Mac玩家狂喜!《Hades II》上线啦⚡比前作还上头!

    破门而入2:北方特遣队 Door Kickers 2 for Mac – 战术策略新体验

    破门而入2:北方特遣队 Door Kickers 2 for Mac – 战术策略新体验

    Mac也可以大表哥了!《荒野大镖客:救赎》Mac版下载及安装指南

    Mac也可以大表哥了!《荒野大镖客:救赎》Mac版下载及安装指南

    NBA 2K25 Arcade Edition for Mac 经典Mac篮球游戏再升级

    NBA 2K25 Arcade Edition for Mac 经典Mac篮球游戏再升级

    Easy Red 2 for Mac 二战题材Mac射击游戏

    Easy Red 2 for Mac 二战题材Mac射击游戏

    热门标签

    • Mac游戏
    • 死亡搁浅mac
    • 全面战争 mac
    • 足球经理
    • 美国卡车模拟Mac
    • NBA 2K24
  • macOS下载
  • Mac产品库
  • Mac软件下载
No Result
View All Result
麦克豌豆 MacPea.com
No Result
View All Result
Home 苹果新闻

苹果训练大型语言模型高效理解长视频内容

pony的头像 by pony
2025年8月23日
Reading Time: 1 mins read
A A
0

苹果研究人员开发了SlowFast-LLaVA模型的改进版本,在长视频分析与理解任务上超越更大规模模型。以下是具体解读。

相关文章

苹果拟为企业设备扩展AI支持,不限于ChatGPT

苹果起诉前Apple Watch工程师涉嫌向OPPO泄露商业机密

HomeKit周报:这款Aqara套装是我多年前就想要的HomeKit入门神器

技术原理

当大型语言模型被训练理解视频时,其基本流程包括:将视频分割为帧序列,运用计算机视觉提取视觉特征,分析这些特征的时序变化,并将所有信息与语言对齐,从而以文本形式描述或推理视频内容。

低效的处理方式是对每帧画面进行分析,这会产生海量冗余信息——因为相邻帧之间往往只有微小变化。当信息量超过模型的上下文窗口(即单次处理信息的极限容量)时,模型会逐步丢弃早期信息以容纳新内容。

当然存在更高效的视频语言模型训练方案(英伟达近期就相关主题发表了论文),但上述基础原理有助于理解苹果的研究。

苹果的研究突破

正如研究人员在论文《SlowFast-LLaVA-1.5:面向长视频理解的高效令牌视频大语言模型家族》中所述:

“视频大语言模型(Video LLMs)将视频感知能力整合至预训练LLM中,用以处理视频并响应指令。尽管取得显著进展,现有视频LLM仍存在明显局限性。”

主要局限体现在三方面:

  • 现有模型过度依赖长上下文窗口与大量帧采样,效率低下且难以迁移至小模型;
  • 多数方案需复杂多阶段训练流程(常使用私有数据集),难以复现;
  • 许多模型仅针对视频任务优化,限制了其作为通用多模态模型的图像理解能力。

为解决这些问题,苹果基于开源模型SlowFast-LLaVA进行改进。该模型通过双流架构结合时空信息:慢流通道以高细节解析关键帧捕捉场景内容,快流通道以低细节采样更多帧追踪运动变化。

研究团队首先对模型进行图像微调以构建通用视觉推理能力,随后使用公开数据集联合训练图像与视频任务,使其在掌握时序结构的同时保持图像理解能力。

最终成果SlowFast-LLaVA-1.5(SF-LLaVA-1.5)包含10亿、30亿和70亿参数版本,在多项视频任务中超越更大规模模型,研究人员称其优势有时“非常显著”。

在LongVideoBench和MLVU等长视频基准测试中,该模型所有尺寸版本均刷新最高纪录,包括最小的10亿参数模型。

更重要的是,该模型同时克服了前述三大局限之一,在图像任务(包括知识问答、数学推理、OCR和文本密集场景)中同样表现优异。

研究团队测试了多种视频压缩策略,最终方案在速度、精度与令牌数量间实现了最佳平衡。

现存局限性

SF-LLaVA-1.5设定了128帧的最大输入长度——无论处理几分钟还是几小时视频,始终从快流通道选取96帧均匀采样,慢流通道选取32帧均匀采样。

研究人员指出:

“这种方式可能遗漏长视频中的关键帧,并对视频播放速度产生误判。(…) 通过调优视觉编码器等全部参数可进一步提升性能,但长视频LLM的GPU内存消耗使得全参数调优极具挑战。未来研究可探索随机反向传播等内存优化技术。”

尽管存在局限,该模型仍凭借完全基于公开数据集训练的优势成为当前最优方案。SF-LLaVA-1.5已开源发布于GitHub和Hugging Face平台,完整论文可查阅arXiv。

以下为模型实际应用示例:




ShareTweet
pony的头像

pony

Related Posts

苹果新闻

苹果拟为企业设备扩展AI支持,不限于ChatGPT

2025年8月23日
0
苹果新闻

苹果起诉前Apple Watch工程师涉嫌向OPPO泄露商业机密

2025年8月23日
0
苹果新闻

HomeKit周报:这款Aqara套装是我多年前就想要的HomeKit入门神器

2025年8月23日
0
苹果新闻

Proxyman 5.23.1 for Mac:现代HTTP调试工具的全面解析

2025年8月23日
0
苹果新闻

eBookBinder 1.12.8 for Mac:高效电子书制作工具全面解析

2025年8月23日
0
苹果新闻

明年秋季iPhone产品线全面转向高端化,基础款将缺席

2025年8月23日
0
Next Post

苹果拟为企业设备扩展AI支持,不限于ChatGPT

Please login to join discussion

推荐文章

iOS 26:你可能忽略的四个Safari新功能

2025年8月17日
0

德州洪灾启用无线紧急警报系统但暴露多重问题

2025年7月10日
0

tvOS 26 测试版3现已向Apple TV 4K用户开放

2025年7月9日
2

点击排行

  • 苹果发布iOS 18.6.2:安全更新与稳定性优化

    0 shares
    Share 0 Tweet 0
  • F1电影何时登陆Apple TV?流媒体上映日期公布

    0 shares
    Share 0 Tweet 0
  • macOS Sequoia 15.6正式发布 包含重要错误修复

    0 shares
    Share 0 Tweet 0
  • Mac也可以大表哥了!《荒野大镖客:救赎》Mac版下载及安装指南

    0 shares
    Share 0 Tweet 0
  • 魔法门之英雄无敌 3 for Mac (Heroes of Might & Magic III HD+) 经典回合制战略游戏

    0 shares
    Share 0 Tweet 0
麦克豌豆 MacPea.com

麦克豌豆是一个专门分享Mac软件、Mac游戏、Mac系统下载、Mac教程、Mac电脑介绍以及苹果新闻的网站。

近期文章

  • 苹果拟为企业设备扩展AI支持,不限于ChatGPT
  • 苹果训练大型语言模型高效理解长视频内容
  • 苹果起诉前Apple Watch工程师涉嫌向OPPO泄露商业机密

分类

  • macOS下载
  • Mac产品库
  • Mac教程
  • Mac游戏推荐
  • Mac软件推荐
  • 苹果新闻

订阅网站内容

订阅网站内容以便第一时间阅读你感兴趣的内容

订阅即表示同意我们的服务条款和隐私政策。

© 2024 MacPea.com 麦克豌豆 友情链接 | 湘ICP备18009176号-7

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • Subscription
  • Category
    • Mac游戏推荐
    • macOS下载
    • 苹果新闻
    • Mac产品库
    • Mac教程
  • Landing Page
  • Buy JNews
  • Support Forum
  • Pre-sale Question
  • Contact Us

© 2024 MacPea.com 麦克豌豆 友情链接 | 湘ICP备18009176号-7