多模太大模型清单收集
创始人
2024-05-14 20:33:56
0
  1. AI大一统:阿里达摩院发布多任务、多模态统一模型OFA

功能:包括3类跨模态、单模态和zero-shot。具有文本到图像生成、图像描述生成(标题生成)、视觉问答、图像查找、图像分类等

源码地址:https://github.com/OFA-Sys/OFA

论文地址:https://arxiv.org/pdf/2202.03052.pdf

开源时间:22.03

阿里大模型网址:https://modelscope.cn/home

文本到图片生成演示:https://decoder.modelscope.cn/pcIndex

  1. dall-e2 文本到图片生成

说明:商品化

厂家: OpenAI

  1. 谷歌的 Imagen 和 Midjourney产品

说明:商品化,使用的diffuser 模型

  1. Stable diffusion 模型:Hugging Face发布diffuser模型AI绘画库

功能:文本生成图像

开源地址:

Hugging Face 网址:https://huggingface.co/yulet1de/stablediffusion2

开源时间:22.08

说明:上面是普通的模型,里面还有很多其他类型 diffusion 模型

5.oneflow 中文版和中英文版“太乙Stable diffusion” 模型

功能:文本生成图像

开源地址:https://github.com/Oneflow-Inc/diffusers/wiki/How-to-Run-OneFlow-Stable-Diffusion#without-docker

Hugging Face 网址-纯中文:https://huggingface.co/IDEA-CCNL/Taiyi-Stable-Diffusion-1B-Chinese-v0.1

Hugging Face 网址-中英文:https://huggingface.co/IDEA-CCNL/Taiyi-Stable-Diffusion-1B-Chinese-EN-v0.1

开源时间:22.11

说明:上面是普通的模型,里面还有很多其他类型 diffusion 模型

5.英伟达Magic3d

功能:文本生成3d

是否开源:未发布代码

开源地址:

论文地址:https://arxiv.org/pdf/2211.10440.pdf

资料网址:https://deepimagination.cc/Magic3D/

开源时间:

发布时间:22.11

说明:3d 模型生成3d一般需要时间较长,资源较多

6.谷歌文本提示生成3D模型的DreamFusion

功能:文本生成3d

是否开源:

开源地址:

论文地址:

模型资料网址:https://dreamfusion3d.github.io/

开源时间:

发布时间:22.11

说明:声称不需要 3D 训练数据,也不需要修改图像扩散模型,证明了预训练图像扩散模型作为先验模型的有效性。

7.文本提示生成图片 disco-diffusion *****

功能:文本提示生成图

是否开源:是

开源地址:https://github.com/alembics/disco-diffusion

论文地址:

模型资料网址:https://dreamfusion3d.github.io/

开源时间:21.10

发布时间:21.10

说明:在github 找到的disco-diffusion,网上说google 要翻墙的免费的文本生成模型,这个不清楚是与google 的disco-diffusion 有没有关系,更新也比较快。

7.百度文本提示生成图片 文心一格 ERNIE-ViLG 2.0 模型 *****

功能:文本提示生成图

是否开源:是

开源地址:https://github.com/PaddlePaddle/PaddleHub/tree/develop/modules/image/text_to_image/ernie_vilg

模型参数量:120亿

Hugging Face 网址: https://huggingface.co/spaces/PaddlePaddle/ERNIE-ViLG

模型参数说明:https://www.datalearner.com/ai-resources/pretrained-models/ernie-vilg2

论文地址:https://arxiv.org/abs/2210.15257

开源时间:22.10

发布时间:22.10

说明:具有文本生成图像和图像生成文本两种功能。效果远超 OpenAI 发布的 DALL-E 等模型。它是百度的方式,不是github 方式上面有模型的地址,目前不大明白???,使用需要请前往 文心旸谷社区 申请使用本模型所需的 API key 和 Secret Key,网址https://wenxin.baidu.com/user/key 这里申请。

相关内容

热门资讯

“卖掉房产移民”就能过上悠闲生... 转自:法治日报  “卖掉上海房产,带着几百万资产和7岁儿子赴英”“变卖青岛唯一住房,举家移民日本”“...
江苏锦鸡实业股份有限公司财报解... 江苏锦鸡实业股份有限公司(以下简称“锦鸡股份”)近日发布2024年年报,各项财务数据变动引发关注。报...
哈尔斯2025年一季度财报解读... 2025年第一季度,浙江哈尔斯真空器皿股份有限公司(以下简称“哈尔斯”)交出了一份喜忧参半的成绩单。...
2024年度湖州市知识产权保护... 转自:湖州日报  【“裁后监管”保障诉前行为保全及时履行案】2023年12月,浙江金某某制衣公司以湖...
低至3699元起!1分钟看懂v... 【ZOL中关村在线原创导购】现在各大厂商的标准版旗舰手机已经不再满足于充当旗舰手机“守门员”的角色,...
书店入驻外卖平台应不止于“快” 转自:河北日报书店入驻外卖平台应不止于“快” 苑广阔 “没想到买书也能像点外卖一样方便...
与企业同进步 和行业共成长 □黄洁 本报记者 丁莹 李青  今年,石油化工工程质量监督总站、中国石化工程质量监测公司(以下统称“...
集中整治外卖平台 规范外卖经营...   本报讯(徐以成)近日,安徽省天长市市场监管局印发《关于开展对平台外卖集中整治的通知》,决定4月至...
精细化网格化整治城市环境 转自:河北日报丛台区精细化网格化整治城市环境 本报讯(谢娜)最近,家住邯郸市丛台区朝阳路11...
2025石家庄摇滚音乐演出季启... 转自:河北日报2025石家庄摇滚音乐演出季启动“引进品牌+本土特色”,精彩演出贯穿全年 本报...
人民日报刊文:美国滥施关税及中... 习近平主席指出:“关税战、贸易战、科技战违背历史潮流和经济规律,不会有赢家。”近日,美国加征所谓“对...
招商匠心优选混合季报解读:份额... 招商匠心优选混合型证券投资基金2025年第一季度报告已披露,报告期内基金份额赎回近两成,而净值增长近...
省十四届人大常委会第五十五次主...   羊城晚报讯 4月21日,省十四届人大常委会第五十五次主任会议在广州召开。省人大常委会主任黄楚平主...
以军称“误杀”加沙救援人员 转自:河北日报以军称“误杀”加沙救援人员巴红新月会批“充满谎言” 4月17日,在加沙地带北部杰...
高校毕业生就业创业涉罪现象与预...   ◎检察机关坚决严厉打击打着公司招聘旗号的犯罪团伙,对于犯罪团伙的组织者或者首要分子依法从重处罚,...
广州番禺新增1264个临停泊位   羊城晚报讯 记者徐振天报道:4月21日,记者从番禺区交通运输局了解到,番禺区自2025年4月22...
大摩消费领航混合季报解读:份额... 2025年第一季度,摩根士丹利消费领航混合型证券投资基金(简称“大摩消费领航混合”)多项关键数据出现...
杨德龙:大盘是否否极泰来? 特朗普施加的关税措施至今尚未完全消退,这暴露出美国内部在这一政策上的巨大分歧与混乱。虽然局势有所缓解...
生态保护红线不容试探 转自:中国旅游报 □ 王志顺 自然保护区不是商业开发的“飞地”,而是需要人类共同守护的生态家园。开发...
北京发布57项地方标准   本报讯(记者 徐建华)近日,北京市发布57项地方标准,其中首次制定的20项,修订37项,涉及建筑...