多模太大模型清单收集
创始人
2024-05-14 20:33:56
0
  1. AI大一统:阿里达摩院发布多任务、多模态统一模型OFA

功能:包括3类跨模态、单模态和zero-shot。具有文本到图像生成、图像描述生成(标题生成)、视觉问答、图像查找、图像分类等

源码地址:https://github.com/OFA-Sys/OFA

论文地址:https://arxiv.org/pdf/2202.03052.pdf

开源时间:22.03

阿里大模型网址:https://modelscope.cn/home

文本到图片生成演示:https://decoder.modelscope.cn/pcIndex

  1. dall-e2 文本到图片生成

说明:商品化

厂家: OpenAI

  1. 谷歌的 Imagen 和 Midjourney产品

说明:商品化,使用的diffuser 模型

  1. Stable diffusion 模型:Hugging Face发布diffuser模型AI绘画库

功能:文本生成图像

开源地址:

Hugging Face 网址:https://huggingface.co/yulet1de/stablediffusion2

开源时间:22.08

说明:上面是普通的模型,里面还有很多其他类型 diffusion 模型

5.oneflow 中文版和中英文版“太乙Stable diffusion” 模型

功能:文本生成图像

开源地址:https://github.com/Oneflow-Inc/diffusers/wiki/How-to-Run-OneFlow-Stable-Diffusion#without-docker

Hugging Face 网址-纯中文:https://huggingface.co/IDEA-CCNL/Taiyi-Stable-Diffusion-1B-Chinese-v0.1

Hugging Face 网址-中英文:https://huggingface.co/IDEA-CCNL/Taiyi-Stable-Diffusion-1B-Chinese-EN-v0.1

开源时间:22.11

说明:上面是普通的模型,里面还有很多其他类型 diffusion 模型

5.英伟达Magic3d

功能:文本生成3d

是否开源:未发布代码

开源地址:

论文地址:https://arxiv.org/pdf/2211.10440.pdf

资料网址:https://deepimagination.cc/Magic3D/

开源时间:

发布时间:22.11

说明:3d 模型生成3d一般需要时间较长,资源较多

6.谷歌文本提示生成3D模型的DreamFusion

功能:文本生成3d

是否开源:

开源地址:

论文地址:

模型资料网址:https://dreamfusion3d.github.io/

开源时间:

发布时间:22.11

说明:声称不需要 3D 训练数据,也不需要修改图像扩散模型,证明了预训练图像扩散模型作为先验模型的有效性。

7.文本提示生成图片 disco-diffusion *****

功能:文本提示生成图

是否开源:是

开源地址:https://github.com/alembics/disco-diffusion

论文地址:

模型资料网址:https://dreamfusion3d.github.io/

开源时间:21.10

发布时间:21.10

说明:在github 找到的disco-diffusion,网上说google 要翻墙的免费的文本生成模型,这个不清楚是与google 的disco-diffusion 有没有关系,更新也比较快。

7.百度文本提示生成图片 文心一格 ERNIE-ViLG 2.0 模型 *****

功能:文本提示生成图

是否开源:是

开源地址:https://github.com/PaddlePaddle/PaddleHub/tree/develop/modules/image/text_to_image/ernie_vilg

模型参数量:120亿

Hugging Face 网址: https://huggingface.co/spaces/PaddlePaddle/ERNIE-ViLG

模型参数说明:https://www.datalearner.com/ai-resources/pretrained-models/ernie-vilg2

论文地址:https://arxiv.org/abs/2210.15257

开源时间:22.10

发布时间:22.10

说明:具有文本生成图像和图像生成文本两种功能。效果远超 OpenAI 发布的 DALL-E 等模型。它是百度的方式,不是github 方式上面有模型的地址,目前不大明白???,使用需要请前往 文心旸谷社区 申请使用本模型所需的 API key 和 Secret Key,网址https://wenxin.baidu.com/user/key 这里申请。

相关内容

热门资讯

广东全力做好台风“丹娜丝”防御... 转自:千龙网新华社广州7月6日电(记者 胡拿云)今年第4号台风“丹娜丝”于6日5时加强为台风级,8时...
读图丨科技赋能督察反馈“回头看... 转自:中国环境网近日,为巩固生态环境保护督察整改工作成效,严防已整改销号问题出现反弹,江西省瑞昌市集...
河南启动重大气象灾害高温四级应... 来源:央视新闻客户端 近日,受持续高温影响,河南省气象局启动重大气象灾害高温四级应急响应。河南商丘、...
突发公告!山东泰山钢铁集团申请... 来源:供应链金融2025年7月4日、7月5日,全国企业破产重整案件信息网公开(2025)鲁0116破...
最新!福建多地中考成绩公布时间... 福建考生注意!中考成绩即将公布多地已明确查分时间一起来看——福州2025年福州市中考成绩查询方式查询...
广西龙舟队摘下全运会广西首金,... 7月6日,正在广东佛山进行的第十五届全国运动会群众比赛龙舟项目决赛进入200米直道赛争夺,广西龙舟队...
全国档案查询利用服务平台移动端... 据新华社北京7月6日电 记者6日从国家档案局获悉,全国档案查询利用服务平台移动端APP当日正式上线。...
弘信电子:拟发行不超5亿元科技... 人民财讯7月6日电,弘信电子(300657)7月6日晚间公告,公司拟向中国银行间市场交易商协会申请注...
中国飞鹤预计上半年收益为91亿... 7月4日,中国飞鹤(06186)发布公告,预计截至2025年6月30日止六个月的收益将介于91亿元至...
印尼沉船搜救行动继续,海军证实... 当地时间7月6日,印尼海军第二舰队特遣部队指挥官恩德拉·哈托诺证实,救援人员在巴厘海峡切基克海滩以南...