本周全球大模型混战升温！DeepSeek“开源周”，OpenAI发布新模型……盘点时下最火的人工智能模型_资讯

本周全球大模型混战升温！DeepSeek“开源周”，OpenAI发布新模型……盘点时下最火的人工智能模型

创始人

2025-02-28 20:16:39

0次

转自：上观新闻

本周，全球AI大模型“群雄逐鹿”走向白热化。腾讯、OpenAI 、Anthropic纷纷发布新品，DeepSeek连续五天开源数据库。AI领域正迎来新一轮技术竞赛，国内外厂商玩家纷纷加快步伐，人工智能的技术变革也在切实影响普通人的生活。新华日报·交汇点记者为您盘点一周全球人工智能领域最值得关注的重磅新闻。

1. OpenAI发布新模型GPT-4.5

北京时间2月28日凌晨，人工智能（AI）巨头OpenAI发布GPT-4.5（研究预览版），也就是内部代号为Orion（猎户座）的模型。OpenAI称其为公司迄今为止规模最大、性能最强的聊天模型，号称“情商最高”“幻觉更少”，将首先开放给软件开发者以及订阅ChatGPT Pro的用户。

据OpenAI方面介绍，GPT-4.5是OpenAI迄今为止知识储备最丰富的模型之一，拥有1万亿激活参数，训练数据量高达120万亿tokens，上下文窗口长度扩展至256K。

此外，GPT-4.5的特点还包括能够在“温暖且自然”的对话中自然地整合想法，对人类意图的理解更加深刻，能够更细腻、更具“情商”地解读微妙的暗示或隐含期望。GPT-4.5还表现出更强的审美直觉和创造力，在写作和设计辅助方面表现出色。

不过，尽管GPT-4.5性能卓越，但其庞大的模型规模和高昂的计算成本也带来了挑战。OpenAI首席执行官Sam Altman表示，由于GPU资源紧张，推广节奏受到一定影响。他透露，下周OpenAI将增加数万块GPU，以支持更广泛的用户访问。

目前，GPT-4.5的API定价较高，输入token的价格是GPT-4o的30倍，输出token的价格则是15倍。OpenAI正在评估是否长期在API中提供该服务。

2. 腾讯混元推出Turbo S

几乎与OpenAI同步，2月27日，腾讯混元团队宣布推出新一代快思考模型Turbo S，以 “秒级响应” 和 “性能对标国际顶尖模型” 的姿态，加入全球AI竞赛。官方数据显示，Turbo S的吐字速度较前代提升一倍，首字时延降低44％，在知识问答、数学推理等Benchmark测试中，性能与 DeepSeek-V3、GPT-4o等国际领先模型持平。

基于 Turbo S，腾讯推出了深度思考模型混元T1，并已在腾讯元宝平台全量上线。开发者和企业用户可通过腾讯云API调用 Turbo S，享受输入0.8 元／百万tokens、输出2元/百万tokens的定价，且首周免费试用。对于C端用户，Turbo S将逐步在腾讯元宝灰度上线，标志着国产大模型在商业化落地层面的重要进展。

3. Claude 3.7 Sonnet重磅登场

北京时间2月25日凌晨，美国人工智能初创公司Anthropic发布混合推理模型Claude 3.7 Sonnet，该模型兼具LLM与推理能力，采用一个模型，两种思考方式：一是近乎实时地反应，二是扩展地、循序渐进地思考。

不仅如此，Anthropic还推出了代理编码工具Claude Code，可以搜索和读取代码、编辑文件、编写和运行测试、提交和推送代码到GitHub以及使用命令行工具。在早期测试中，Claude Code可以一次性完成通常需要45分钟手动操作的工作。

视觉中国供图 4. DeepSeek连续五天开源数据库，都亮出了什么？

从2月24日到2月28日，国内 AI 明星公司DeepSeek连续五天的“开源周”在本周五收官，DeepSeek在社交媒体X上先后开源了FlashMLA、DeepEP、DeepGEMM、优化并行策略（DualPipe和EPLB）以及面向全数据访问的推进器3FS多个项目，旨在与全球开发者社区分享其在通用人工智能（AGI）领域的研究进展，涵盖了从计算、通信到存储的各个方面。

2月24日：首个开源的代码库为Flash MLA，专门针对英伟达的 Hoppers GPU （比如H100、H800 ），进行效率优化，目前已投入生产； 2月25日：宣布将DeepEP向公众开放。DeepEP是用于MoE（混合专家）模型训练和推理的EP（Expert Parallelism，专家并行）通信库，可以实现高效且优化的全对全通信，支持包括FP8在内的低精度运算，适配现代高性能计算需求； 2月26日：宣布开源DeepGEMM。DeepGEMM 是一个专为简洁高效的 FP8 通用矩阵乘法（GEMM）设计的库，创始人梁文锋署名参与创建和开发了这项成果； 2月27日：一次性开源了两个工具和一个数据集，分别是DualPipe、EPLB（专家并行负载均衡器）以及训练和推理框架的性能分析数据。此外，DeepSeek还在Github上详细讲解了DeepSeek-V3和R1模型背后的并行计算优化技术； 2月28日：在官方X账号宣布开源3FS，它是所有DeepSeek数据访问的助推器。据悉，这些代码库将提供给全球开发者二次开发和改进，并有望促进 AI 技术在更广泛领域应用上取得突破。

在2月26日，DeepSeek还在海内外同时宣布了API错峰优惠，自2月26日起，北京时间每日00:30至08:30的夜间空闲时段，API调用价格大幅下调：DeepSeek-V3降至原价50％，DeepSeek-R1更低至25％。DeepSeek鼓励用户充分利用这一时段，享受更经济更流畅的服务体验。

此前DeepSeek在R1论文中提到，R1 的性能将在下一个版本得到改善，因为相关的RL（强化学习）训练数据还很少。随着RL数据的增加，模型解决复杂推理任务的能力持续稳定提升，且会自然涌现出一些复杂行为能力。

业界认为，DeepSeek-R2的发布可能是AI行业的一个关键节点。

盘点时下最火的AI大模型

从谷歌等大型科技公司到OpenAI和Anthropic等初创公司，人工智能模型正在以令人眼花缭乱的速度涌现。根据科技媒体TechCrunch统计，目前有超过100万个AI模型。目前国际上最先进、使用最普遍的AI模型都有哪些？它们最适合做什么样的工作？来一起盘一盘2024年以来引起全球关注的大模型。

DeepSeek-R1

国产大模型DeepSeek以燎原之势席卷全球科技界。DeepSeek-R1于2025年1月20日发布并开源，在数学、编码和自然语言推理任务上表现出色，DeepSeek采用MIT许可证开源，支持模型蒸馏，用户可以免费下载并在本地运行，且API服务价格极低。适用于数学推理、算法编码、自然语言处理，尤其适合开发者、研究人员和需要高性能推理的场景。

OpenAI的GPT 4.5“Orion”

OpenAI称Orion是他们迄今为止最大的模型，并宣称“情商更高、幻觉更少”，现已向每月订阅费用200美元的ChatGPT Pro订阅用户开放。下周，该模型也将向每月20美元的ChatGPT Plus订阅用户开放。OpenAI首席执行官Altman表示，届时该公司将增加数万块GPU，提供算力支撑。

OpenAI的深度研究和Sora

OpenAI的深度研究（Deep Research）目前已经面向所有ChatGPT Plus、Team、Edu和Enterprise付费用户开放（先前只限Pro用户），除了面向专业研究人员，深度研究对于“挑剔购物者”也极具价值：当用户在网上寻觅汽车或家电，想要对比十几个参数、参考数十家网站的用户评价，人工手动搜索无疑耗时巨大，而深度研究能在5～30分钟内自动整合信息，最终生成带有清晰引文、重点标注、可视化图表的研究报告。不过，需要注意AI幻觉问题仍存。

Sora是一个基于文本创建逼真视频的模型。虽然它可以生成整个场景而不仅仅是片段，但OpenAI承认它经常会产生“不切实际的物理现象”。它目前仅在 ChatGPT的付费版本中可用。

Anthropic的Claude Sonnet 3.7

Claude由美国人工智能初创公司Anthropic开发，Anthropic称Claude 3.7 Sonnet是业界首个“混合”推理模型，可快速回答或深入思考，用户可控制思考时间，所有用户可用，但重度用户需付费订阅。

xAI的Grok 3

Grok 3是马斯克创办的初创公司xAI最新发布的模型，于2025年2月17日发布，声称在数学、科学和编码方面优于其他领先模型（如OpenAI的GPT-4o、Google Gemini），目前对所有用户开放试用，但无限次使用需要以30美元/月的价格订阅。

阿里巴巴的Qwen QwQ

2月25日，阿里巴巴Qwen团队宣布发布新推理模型——深度思考（QwQ）。这是在QwQ-Max-Preview支持下，一个基于Qwen2.5-Max的推理模型。类似DeepSeek-R1和Kimi的推理模型，QwQ可同时支持深度思考和联网搜索，并会展示完整的思维链。

Mistral AI的Le Chat

2月6日，法国AI初创公司Mistral AI发布了号称全球最快的聊天机器人Le Chat iOS与Android版App，具备网页搜寻及多模态能力，并推出分级收费Pro及Team方案。该公司称，Le Chat的推理、思考和回应能力高于所有其他聊天助理，1秒最快可输出1000字，该公司称为闪电回答（Flash Answers）。

Google的Gemini 2.0 Pro实验版

2月6日，Google Gemini 2.0 Pro实验版发布，声称在编码和常识理解方面出色，拥有200万tokens的上下文窗口，可帮助需要快速处理大量文本的用户，该服务需要至少每月19.99美元的Google One AI Premium订阅。

Meta的Llama 3.3 70B

Meta的Llama 3.3 70B模型于2024年12月5日发布，Meta宣称此版本是最新、最先进的开源Llama模型，且最便宜、最高效，尤其适合数学、常识和指令遵循，同时免费开源。

新华日报·交汇点记者杨易臻蔡姝雯张宣

部分内容整合自网络

特别声明：本文经上观新闻客户端的“上观号”入驻单位授权发布，仅代表该入驻单位观点，“上观新闻”仅为信息发布平台，如您认为发布内容侵犯您的相关权益，请联系删除!

上一篇：听民营经济发展脉动｜根植沃土锚定需求开辟新赛道

下一篇：藏历大年初一肖友才深入基层调研督导并看望慰问坚守岗位一线工作者

本周全球大模型混战升温！DeepSeek“开源周”，OpenAI发布新模型……盘点时下最火的人工智能模型

相关内容

热门资讯