麦克豌豆 MacPea.com
没有结果
查看所有结果
  • 登录
  • 首页
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐

    经典射击游戏反恐精英CS 1.6正式登陆Mac平台

    通过这款 Apple Arcade 新游戏,在 Vision Pro 上走进《Jeopardy!》的世界

    苹果Arcade九月阵容:NFL橄榄球、危险边缘与热门游戏更新齐登场

    苹果Arcade新增四款游戏 包括《培乐多彩泥世界》

    苹果新闻+推出全新「表情猜词游戏」 支持iOS 18.4及以上系统

    评测:明基GP520投影仪为Apple TV 4K打造Vision Pro级影院体验,游戏娱乐更出众

    热门标签

    • Mac游戏
    • NBA 2K25 for Mac
    • Easy Red 2 for Mac
  • Mac教程
  • macOS下载
  • Mac产品库
会员计划
现在订阅
  • 首页
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐

    经典射击游戏反恐精英CS 1.6正式登陆Mac平台

    通过这款 Apple Arcade 新游戏,在 Vision Pro 上走进《Jeopardy!》的世界

    苹果Arcade九月阵容:NFL橄榄球、危险边缘与热门游戏更新齐登场

    苹果Arcade新增四款游戏 包括《培乐多彩泥世界》

    苹果新闻+推出全新「表情猜词游戏」 支持iOS 18.4及以上系统

    评测:明基GP520投影仪为Apple TV 4K打造Vision Pro级影院体验,游戏娱乐更出众

    热门标签

    • Mac游戏
    • NBA 2K25 for Mac
    • Easy Red 2 for Mac
  • Mac教程
  • macOS下载
  • Mac产品库
没有结果
查看所有结果
麦克豌豆 MacPea.com
没有结果
查看所有结果
Home 苹果新闻

苹果展示M5芯片运行本地大模型相比M4速度提升显著

pony的头像 由 pony
2025年11月21日
在 苹果新闻
阅读时间:1 分钟阅读
A A
0

苹果机器学习研究博客上的一篇新文章展示了,在运行本地大语言模型时,M5苹果芯片相比M4有了多大提升。详情如下。

你可能喜欢

watchOS 26 新增一项让我爱不释手的 Apple Watch 技巧

传闻回顾:Mac Pro 未来走向、iPhone Fold 电池容量及其他消息

Liberty Media CEO透露:苹果与F1正探讨深化合作可能性

背景信息

几年前,苹果发布了MLX,该公司将其描述为“一个用于在苹果芯片上进行高效灵活机器学习的数组框架”。

实际上,MLX是一个开源框架,借助AI领域熟悉的API和接口,帮助开发者在他们的苹果芯片Mac上原生构建和运行机器学习模型。

以下是苹果对MLX的进一步说明:

MLX是一个开源数组框架,高效、灵活,并针对苹果芯片进行了深度优化。您可以将MLX用于从数值模拟、科学计算到机器学习的各种应用。MLX内置了对神经网络训练和推理的支持,包括文本和图像生成。MLX使得在苹果芯片设备上使用大语言模型生成文本或进行微调变得容易。

MLX利用了苹果芯片的统一内存架构。MLX中的操作可以在CPU或GPU上运行,而无需移动内存。其API紧密遵循NumPy,既熟悉又灵活。MLX还提供了更高级别的神经网络和优化器包,以及用于自动微分和图优化的函数变换。

目前可用的MLX包之一是MLX LM,旨在用于在苹果芯片Mac上生成文本和微调语言模型。

通过MLX LM,开发者和用户可以下载Hugging Face上的大多数模型,并在本地运行它们。

该框架甚至支持量化,这是一种压缩方法,可以使大模型在占用更少内存的情况下运行。这带来了更快的推理速度,推理基本上是指模型对输入或提示生成答案的步骤。

M5 对比 M4

在其博客文章中,苹果展示了新款M5芯片在推理性能上的提升,这得益于芯片全新的GPU神经引擎,苹果称其“提供了专用的矩阵乘法运算,这对许多机器学习工作负载至关重要。”

为了说明性能提升,苹果比较了在搭载M4和M5的MacBook Pro上,使用MLX LM,多个开源模型在接收到提示后生成第一个词元所需的时间。

或者,正如苹果所述:

我们评估了原生BF16精度的Qwen 1.7B和8B模型,以及4位量化的Qwen 8B和Qwen 14B模型。此外,我们还对两个专家混合模型进行了基准测试:Qwen 30B和GPT OSS 20B。评估使用mlx_lm.generate进行,并报告首次词元生成时间和生成速度。在所有基准测试中,提示大小为4096。生成速度是在生成128个额外词元时测量的。

结果如下:

这里一个重要的细节是,LLM推理生成第一个词元所采用的方法与生成后续词元的方法不同。简而言之,第一个词元的推理受计算能力限制,而后续词元的生成则受内存带宽限制。

这就是为什么苹果也评估了生成128个额外词元的速度。总体而言,M5相比M4显示出19-27%的性能提升。

苹果对这些结果的评论如下:

在本文测试的架构上,得益于其更高的内存带宽,M5相比M4提供了19-27%的性能提升。关于内存占用,配备24GB内存的MacBook Pro可以轻松容纳一个BF16精度的8B模型或一个4位量化的30B MoE模型,使得这两种架构下的推理工作负载内存占用均低于18GB。

苹果还比较了图像生成的性能差异,并表示M5完成工作的速度比M4快了3.8倍以上。

您可以在此处阅读苹果的完整博客文章,并在此处了解更多关于MLX的信息。

pony的头像

pony

有钱人终成眷属。

相关文章

苹果新闻

watchOS 26 新增一项让我爱不释手的 Apple Watch 技巧

2025年11月21日
102
苹果新闻

传闻回顾:Mac Pro 未来走向、iPhone Fold 电池容量及其他消息

2025年11月21日
100
苹果新闻

Liberty Media CEO透露:苹果与F1正探讨深化合作可能性

2025年11月21日
100
苹果新闻

ChatGPT群聊功能在四个地区率先推出[更新]

2025年11月21日
101
苹果新闻

iPadOS 26.2 中的 Slide Over 改进、特斯拉支持 CarPlay、蒂姆·库克退休传闻

2025年11月21日
102
苹果新闻

Apple TV 宣布推出奥卡菲娜主持的美食系列《不太可能的厨师:奥卡菲娜》

2025年11月21日
102
下一篇文章

watchOS 26 新增一项让我爱不释手的 Apple Watch 技巧

请登录 加入讨论

推荐文章

苹果Vision Pro首款空间触控笔:能做什么,还不能做什么

2025年10月25日
101

Apple TV 去掉‘+’后缀,但持续增值以赢得用户

2025年11月14日
101

报告称苹果已无限期推迟iPhone Air 2发布

2025年11月11日
101

Proton数据泄露观测站:暗网出现个人数据时立即预警

2025年10月30日
100

热门文章

  • 如何在 iOS 26 中为 iPhone 应用图标设置透明效果

    0 分享
    分享 0 Tweet 0
  • 全新 iPhone Air 与 iPhone 17 Pro 壁纸下载 [更新:iPhone 17]

    0 分享
    分享 0 Tweet 0
  • CorelDRAW 2025 26.1.0.143 for Mac 深度评测:专业设计的新标杆

    0 分享
    分享 0 Tweet 0
  • 如何在 watchOS 26 中使用 Apple Watch 的高血压监测功能

    0 分享
    分享 0 Tweet 0
  • GraphPad Prism 10.5.0 for Mac:科研数据分析与可视化的专业工具演进

    0 分享
    分享 0 Tweet 0

近期文章

  • watchOS 26 新增一项让我爱不释手的 Apple Watch 技巧 2025年11月21日
  • 苹果展示M5芯片运行本地大模型相比M4速度提升显著 2025年11月21日
  • 传闻回顾:Mac Pro 未来走向、iPhone Fold 电池容量及其他消息 2025年11月21日

分类

  • Mac产品库
  • Mac游戏推荐
  • Mac软件推荐
  • 苹果新闻

订阅网站内容

订阅网站内容以便第一时间阅读你感兴趣的内容

订阅即表示同意我们的服务条款和隐私政策。

© 2025 麦克豌豆 MacPea.com - 湘ICP备18009176号 | 友情链接

欢迎回来!

在下面登录您的帐户

忘记密码?

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录
没有结果
查看所有结果
  • 首页
  • 订阅
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐
  • Mac教程
  • macOS下载
  • Mac产品库

© 2025 麦克豌豆 MacPea.com - 湘ICP备18009176号 | 友情链接