麦克豌豆 MacPea.com
No Result
View All Result
  • Login
  • 首页
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐
    Mac玩家狂喜!《Hades II》上线啦⚡比前作还上头!

    Mac玩家狂喜!《Hades II》上线啦⚡比前作还上头!

    破门而入2:北方特遣队 Door Kickers 2 for Mac – 战术策略新体验

    破门而入2:北方特遣队 Door Kickers 2 for Mac – 战术策略新体验

    Mac也可以大表哥了!《荒野大镖客:救赎》Mac版下载及安装指南

    Mac也可以大表哥了!《荒野大镖客:救赎》Mac版下载及安装指南

    NBA 2K25 Arcade Edition for Mac 经典Mac篮球游戏再升级

    NBA 2K25 Arcade Edition for Mac 经典Mac篮球游戏再升级

    Easy Red 2 for Mac 二战题材Mac射击游戏

    Easy Red 2 for Mac 二战题材Mac射击游戏

    全面战争:战锤3 Mac破解版(Total War: Warhammer III)

    全面战争:战锤3 Mac破解版(Total War: Warhammer III)

    热门标签

    • Mac游戏
    • 死亡搁浅mac
    • 全面战争 mac
    • 足球经理
    • 美国卡车模拟Mac
    • NBA 2K24
  • macOS下载
  • Mac产品库
  • Mac软件下载
PRICING
SUBSCRIBE
  • 首页
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐
    Mac玩家狂喜!《Hades II》上线啦⚡比前作还上头!

    Mac玩家狂喜!《Hades II》上线啦⚡比前作还上头!

    破门而入2:北方特遣队 Door Kickers 2 for Mac – 战术策略新体验

    破门而入2:北方特遣队 Door Kickers 2 for Mac – 战术策略新体验

    Mac也可以大表哥了!《荒野大镖客:救赎》Mac版下载及安装指南

    Mac也可以大表哥了!《荒野大镖客:救赎》Mac版下载及安装指南

    NBA 2K25 Arcade Edition for Mac 经典Mac篮球游戏再升级

    NBA 2K25 Arcade Edition for Mac 经典Mac篮球游戏再升级

    Easy Red 2 for Mac 二战题材Mac射击游戏

    Easy Red 2 for Mac 二战题材Mac射击游戏

    全面战争:战锤3 Mac破解版(Total War: Warhammer III)

    全面战争:战锤3 Mac破解版(Total War: Warhammer III)

    热门标签

    • Mac游戏
    • 死亡搁浅mac
    • 全面战争 mac
    • 足球经理
    • 美国卡车模拟Mac
    • NBA 2K24
  • macOS下载
  • Mac产品库
  • Mac软件下载
No Result
View All Result
麦克豌豆 MacPea.com
No Result
View All Result
Home 苹果新闻

苹果just发现一种被遗忘的人工智能技术,并将其用于生成图像

pony by pony
2025年6月24日
Reading Time: 1 mins read
A A
0

今天,大多数生成图像模型基本上可以分为两大类:扩散模型(如Stable Diffusion)或自回归模型(如OpenAI的GPT-4o)。但苹果刚刚发布了两篇论文,展示了如何有一种第三种、被遗忘的技术可能实现:归一化流(Normalizing Flows)。而且,在上面加上Transformer,它们的能力可能会超过之前所想。

相关文章

苹果Watch Ultra 3:今秋即将亮相的三大新功能

爆料人透露:灵动岛即将迎来「重大进化」

苹果AirPort产品全线「过时」,仅存一个例外

第一部分:什么是归一化流?

归一化流(NFs)是一种AI模型,它通过学习如何将现实世界的数据(例如图像)数学上转化为结构化的噪声,并且反过来将这种过程逆转,生成新的样本。

最大的优点是它们可以计算出每个生成图像的精确概率,而扩散模型无法做到这一点。这对于那些需要理解结果概率的任务来说非常吸引人。

但是,这就是为什么最近很少有人听说它们的原因:早期基于流的方法生成的图像看起来模糊或缺乏与基于扩散和基于变换的系统相比在细节和多样性上的优势。

研究1:TarFlow

在论文“Normalizing Flows are Capable Generative Models”中,苹果引入了一个新的模型,称为TarFlow(简写为Transformer AutoRegressive Flow)。

TarFlow的核心在于它取代了之前用于流模型的手工构建层,而是使用了基于Transformer的块。基本上,它将图像分成小块,并按顺序生成每一小块,每一块都是基于之前所有块的信息。这就是自回归的概念,这也是目前OpenAI用于图像生成的方法。

关键的区别在于,虽然OpenAI生成离散的令牌,将图像视为像文本符号一样的一串字符,而苹果的TarFlow直接生成像素值,没有对图像进行分词处理。这是一个小但重要的区别,因为它允许苹果避免将图像压缩成固定词汇表中的符号所带来的质量和刚性问题。

尽管如此,在生成大规模、高分辨率的图像时仍然存在限制。这就是研究2的内容。

研究2:STARFlow

在论文“STARFlow: Scaling Latent Normalizing Flows for High-resolution Image Synthesis”中,苹果基于TarFlow开发了STARFlow(Scalable Transformer AutoRegressive Flow),并对其进行了关键升级。

最大的变化是:STARFlow不再直接在像素空间生成图像。相反,它基本上工作在图像的压缩版本上,并将这些内容传递给一个解码器,在最终步骤将其放大回全分辨率。

这种转向称为潜在空间意味着STARFlow不需要直接预测数百万个像素。它可以在更广泛地处理图像结构后,将细节纹理留给解码器。

此外,苹果还重新设计了模型处理文本提示的方式。与之前构建专门的文本编码器不同,STARFlow可以嵌入现有的语言模型(例如Google的小型语言模型Gemma,理论上可以在设备上运行)来处理文本理解,当用户指示模型生成图像时。这使得模型在生成视觉细节方面专注于图像生成。

STARFlow与OpenAI的4o图像生成器的比较

虽然苹果正在重新思考流,但OpenAI最近也突破了扩散方法,推出了GPT-4o模型。但是他们的方法从根本上是不同的。

GPT-4o将图像视为离散的令牌序列,类似于句子中的单词。当你要求ChatGPT生成一张图片时,模型会一次一个地预测图像的令牌,一步一步地构建图片。这给了OpenAI极大的灵活性:同一个模型可以在同一通令牌流中生成文本、图片和音频。

但是代价是按令牌生成的逐个生成可能很慢,特别是对于大型或高分辨率的图片。而且计算成本非常高。但由于GPT-4o完全在云端运行,OpenAI在这方面受到的限制较少。

简而言之:苹果和OpenAI都在超越扩散方法,但而OpenAI正在为数据中心构建模型,而苹果显然正在为我们的口袋构建模型。

ShareTweet
pony

pony

Related Posts

苹果新闻

苹果Watch Ultra 3:今秋即将亮相的三大新功能

2025年7月12日
1
苹果新闻

爆料人透露:灵动岛即将迎来「重大进化」

2025年7月12日
0
苹果新闻

苹果AirPort产品全线「过时」,仅存一个例外

2025年7月12日
0
苹果新闻

功能建议:希望HomeKit增加的三大进阶功能

2025年7月12日
0
苹果新闻

苹果新品「HomePad」发布计划更新 或推迟至2026年春季上市

2025年7月12日
0
苹果新闻

图集:蒂姆·库克与艾迪·库伊现身”亿万富翁夏令营”太阳谷峰会

2025年7月12日
0
Next Post

苹果发布iOS 26 beta 2版

Apple发布 watchesOS 26 beta 2

Please login to join discussion

推荐文章

评论:ELO Vagabond是一款适用于iPhone或iPad mini的全尺寸游戏控制器

2025年6月8日
0

Copilot Money 是您一直在寻找的预算应用

2025年6月27日
0

iPhone 17 Pro Max vs Pro: Apple如何计划区分这两款机型

2025年7月1日
3

点击排行

  • Mac也可以大表哥了!《荒野大镖客:救赎》Mac版下载及安装指南

    Mac也可以大表哥了!《荒野大镖客:救赎》Mac版下载及安装指南

    0 shares
    Share 0 Tweet 0
  • 魔兽争霸3:冰封王座 Mac版下载(Warcraft III for Mac)macOS里的艾泽拉斯大陆

    0 shares
    Share 0 Tweet 0
  • CorelDRAW 2025 for Mac:最强大的Mac矢量图形设计软件

    0 shares
    Share 0 Tweet 0
  • Alcove 将 Mac 屏幕刘海变成灵动岛的创意神器

    0 shares
    Share 0 Tweet 0
  • iOS 26 测试版发布日期:何时可以安装新的 iPhone 更新

    0 shares
    Share 0 Tweet 0
麦克豌豆 MacPea.com

麦克豌豆是一个专门分享Mac软件、Mac游戏、Mac系统下载、Mac教程、Mac电脑介绍以及苹果新闻的网站。

近期文章

  • 苹果Watch Ultra 3:今秋即将亮相的三大新功能
  • 爆料人透露:灵动岛即将迎来「重大进化」
  • 苹果AirPort产品全线「过时」,仅存一个例外

分类

  • macOS下载
  • Mac产品库
  • Mac教程
  • Mac游戏推荐
  • Mac软件推荐
  • 苹果新闻

订阅网站内容

订阅网站内容以便第一时间阅读你感兴趣的内容

订阅即表示同意我们的服务条款和隐私政策。

© 2024 MacPea.com 麦克豌豆 友情链接 | 湘ICP备18009176号-7

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • Subscription
  • Category
    • Mac游戏推荐
    • macOS下载
    • 苹果新闻
    • Mac产品库
    • Mac教程
  • Landing Page
  • Buy JNews
  • Support Forum
  • Pre-sale Question
  • Contact Us

© 2024 MacPea.com 麦克豌豆 友情链接 | 湘ICP备18009176号-7