主页 › 阅读 › 热点 › 腾讯混元文生图大模型对外开源：搭载首个中英双语 DiT 架构

腾讯混元文生图大模型对外开源：搭载首个中英双语 DiT 架构

IT之家发布于 2024-05-14 18:00:10

99 0

IT之家 5 月 14 日消息，腾讯宣布旗下的混元文生图大模型升级并对外开源，目前已经在 Hugging Face 及 Github 上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。

▲ 混元文生图效果

▲ 混元长文生图效果

升级后的混元文生图大模型采用了与 Sora 一致的 DiT 架构，腾讯表示，混元 DiT 是首个中英双语 DiT 架构。混元 DiT 是一个基于 Diffusion transformer 的文本到图像生成模型，此模型具有中英文细粒度理解能力，混元 DiT 能够与用户进行多轮对话，根据上下文生成并完善图像。这也是业内首个中文原生的 DiT 架构文生图开源模型，支持中英文双语输入及理解，参数量 15 亿。

运行该模型需要支持 CUDA 的英伟达 GPU，单独运行混元 DiT 所需的最低显存为 11GB，同时运行 DialogGen（腾讯推出的文本转图像多模态交互式对话系统）和混元 DiT 则至少需要 32GB 的显存，腾讯表示他们已经在 Linux 上测试了英伟达的 V100 和 A100 GPU。

▲ 配置要求

据IT之家此前报道，国内首个官方“大模型标准符合性评测”结果公布，腾讯混元大模型、成为首批通过评测的国产大模型，首批通过的大模型还有阿里通义千问、360 智脑和百度文心一言。

友情提示

本站部分转载文章，皆来自互联网，仅供参考及分享，并不用于任何商业用途；版权归原作者所有，如涉及作品内容、版权和其他问题，请与本网联系，我们将在第一时间删除内容！

联系邮箱：1042463605@qq.com

腾讯混元文生图大模型对外开源：搭载首个中英双语 DiT 架构

友情提示

探索自由与舒心露营的最佳伙伴-上汽大通MAXUS旅行家V100水庐版

国产信创数据库：达梦数据、Oracle、MySQL性能对比

兰博基尼全新跑车曝光！下月首发亮相/配三块大屏

蒙犽免费史诗获取方式公布！最快15天可拿到，花钱竟要4000点券？

“寒武纪”大爆发，靠什么持续神话

华为AI芯片性能太差，导致deepseek-R2被难产，从5月推迟至今

最新现场画面！金正恩时隔6年再访华，迎接人群高喊“热烈欢迎”

现场！普京、金正恩离开人民大会堂：互相谦让上车同车前往会谈

丈夫患癌要卖房，妻子双眼含泪。医生笑里藏招怼丈夫哑口无言

重温祖国庄严的阅兵仪式，国旗招展，军威浩荡！

竹筏漂流，感受山间清凉！

加拿大前国防部长爆料外星机密，至少有4种外星人到访过地球

韩国公布对华团体游免签政策细则

钱再多有什么用？71岁朱时茂如今的现状，给所有人提了个醒

黄健翔谈北马里亚纳群岛足球水平

WTT阿拉木图站国乒男女单打均丢冠

9月5日特讯！中方正式宣布加入，全球舆论一片哗然

特大喜讯！特大喜讯！2026年2月1日起，中小学生午休课桌椅“国标”出台，届时还在上中学和小学的孩子可有福了。看到新桌椅的设计，不禁让人眼前一亮，我那会要是有这