Stability AI 宣布推出 Stable Diffusion XL 1.0,这是一个文本到图像的模型,该公司称其为迄今为止"最先进"的版本。Stable Diffusion XL 1.0 在 GitHub 上以开源形式发布,此外还有 Stability 的 API 和消费者应用 ClipDrop 和 DreamStudio,Stability 声称,与前代产品相比,Stable Diffusion XL 1.0 的色彩"更鲜艳"、"更准确",对比度、阴影和光照效果也更好。
Stability AI 的应用机器学习主管 Joe Penna 在接受采访时指出,Stable Diffusion XL 1.0 包含 35 亿个参数,可以在"几秒钟内"生成多种长宽比的 100 万像素分辨率的完整图像。"参数"是模型从训练数据中学到的部分,基本上定义了模型处理问题的技能,这里指的是生成图像。
上一代稳定扩散模型 Stable Diffusion XL 0.9 也能生成更高分辨率的图像,但需要更多的计算能力。
【资料图】
Penna 说:"Stable Diffusion XL 1.0 是可定制的,可以根据概念和风格进行微调。它也更易于使用,只需基本的自然语言处理提示,就能完成复杂的设计。"
Stable Diffusion XL 1.0 还在文本生成方面进行了改进。Penna 说,许多最好的文本到图像模型都很难生成带有可读徽标的图像,更不用说书法或字体了,而 Stable Diffusion XL 1.0 却能"高级"地生成文本,而且清晰可读。
此外,据 SiliconAngle 和 VentureBeat 报道,Stable Diffusion XL 1.0 支持内绘(重建图像的缺失部分)、外绘(扩展现有图像)和"图像到图像"提示--这意味着用户可以输入一张图像并添加一些文字提示,以创建该图像的更多细节变化。此外,该模型还能理解用简短提示给出的复杂、多部分指令,而以前的 Stable Diffusion 模型则需要较长的文本提示。
Stable Diffusion XL 1.0 生成的图片。图片来源:Stability AI
他补充说:"我们希望,通过发布这个功能更强大的开源模型,图像的分辨率不会是唯一翻两番的地方,而且还能让所有用户大大受益。"
但与之前版本的 Stable Diffusion 一样,该模型也引发了棘手的道德问题。从理论上讲,开源版本的 Stable Diffusion XL 1.0 可以被不怀好意者用来生成有毒或有害的内容,比如未经同意的深度伪造。这在一定程度上反映了用来训练它的数据:来自网络的数百万张图片。
无数教程展示了如何使用稳定人工智能自己的工具(包括稳定扩散的开源前端 DreamStudio)来创建深度伪造内容。还有无数教程展示了如何微调基础稳定扩散模型来生成色情内容。
Penna并不否认滥用的可能性--他也承认该模型存在一定的偏差。但他补充说,Stability AI 已经采取了"额外措施",通过过滤模型训练数据中的"不安全"图像、发布与问题提示相关的新警告以及尽可能多地屏蔽工具中的个别问题术语,来减少有害内容的生成。
Stable Diffusion XL 1.0 的训练集还包括一些艺术家的作品,这些艺术家曾抗议包括 Stability AI 在内的公司将他们的作品用作生成式人工智能模型的训练数据。Stability AI 声称,至少在美国,合理使用原则免除了它的法律责任。但这并没有阻止几位艺术家和图片公司 Getty Images 提起诉讼,要求停止这种做法。
稳定人工智能公司(Stability AI)与初创公司 Spawning 合作,尊重这些艺术家的"退出"请求,该公司表示,它还没有从训练数据集中删除所有标记的艺术作品,但它"将继续采纳艺术家的请求"。
"我们正在不断改进稳定扩散的安全功能,并认真地继续迭代这些措施,"Penna说。"此外,我们还承诺尊重艺术家的要求,将其从训练数据集中删除。"
在发布 Stable Diffusion XL 1.0 的同时,Stability AI 还在其 API 的测试版中发布了一项微调功能,允许用户使用少至五张图片来"专业化"生成特定的人物、产品等信息。该公司还将把 Stable Diffusion XL 1.0 移植到亚马逊用于托管生成式人工智能模型的云平台 Bedrock 上,扩大了之前宣布的与 AWS 的合作。
Stability公司在商业化道路上遭遇低谷,面临着来自OpenAI、Midjourney等公司的激烈竞争,因此该公司推动建立合作伙伴关系并开发新功能。今年4月,Semafor报道称,迄今为止已募集到1亿多美元风险资金的Stability AI公司正在烧钱--这促使该公司在6月完成了一笔2500万美元的可转换票据,并猎聘了一名高管来帮助提高销售额。
"最新的SDXL模型代表了Stability AI的创新传统和能力的下一步,即为人工智能社区提供最前沿的开放式访问模型,"Stability AI首席执行官埃马德-莫斯塔克(Emad Mostaque)在一份新闻稿中说。"在亚马逊Bedrock上发布1.0版本表明了我们与AWS合作,为开发者和客户提供最佳解决方案的坚定承诺"。
标签:
-
“这么近,那么美,周末到河北”京津冀青少年交流推介活动启动河北日报讯(记者赵泽众 通讯员林小斐)近日,“这么近,那...
-
成交方式ddp是什么意思 dap是什么成交方式1、1 DAP(deliveredatplace):目的地交货。2、类似于取代了的DAF、DES和DD
-
400万粉丝网红发布擦边视频被封:内容低俗,无限期封禁抖音黑板报发布公告称,平台集中整治低俗色情账号,22个高粉...
-
奥迪被曝将向中国车企买技术,相关谈判正在进行当中燃油车时代的“霸主”之一奥迪,或将在电动车时代向中国车企...
-
FF任命Jonathan Maroko为代理CFO,拟下周召开股东会贾跃亭旗下FaradayFuture(简称FF)宣布,任命JonathanMaroko为公司代
-
今日pd950钯金回收价格查询(2023年07月12日)今日pd950钯金多少钱一克回收价格(2023年07月12日)每日更新
-
崇左一基地获评广西第三批中医药健康旅游示范基地,实力与颜值兼具!近日,广西壮族自治区中医药管理局官方网站公布了广西第三批...
-
这一次,Keep成为Keep互联网时代,最大的价值就是创造。新商业模式的出现,成为刺...
-
11号直播带货日榜:董先生升至抖音榜首,张亮快手销量第一【直播带货日榜】是鞭牛士推出的多个平台达人每日直播带货榜...
-
金苑种业通过河南证监局辅导验收 拟在北交所上市上证报中国证券网讯7月11日,金苑种业公告,收到河南证监局出...
- 智联世界,元生无界!快手虚拟人IP亮相2022人工智能大会
2022-09-07 10:47:54
- 机器人界“奥林匹克”!2022世界机器人大会8月18日举行
2022-08-10 09:58:58
- 2025年全球人口将达到90亿!机器人将在农业领域大显身手
2022-07-14 09:41:10
- 中科院院士蒋华良:AI+分子模拟与药物研发将大有可为
2022-07-14 09:37:00
- “千垛之城荷你有约” 2022兴化市荷文化旅游节正式开幕
2022-07-07 09:28:34