本周全球大模型混战升温!DeepSeek“开源周”,OpenAI发布新模型……盘点时下最火的人工智能模型
创始人
2025-02-28 20:16:39
0

转自:上观新闻

本周,全球AI大模型“群雄逐鹿”走向白热化。腾讯、OpenAI 、Anthropic纷纷发布新品,DeepSeek连续五天开源数据库。AI领域正迎来新一轮技术竞赛,国内外厂商玩家纷纷加快步伐,人工智能的技术变革也在切实影响普通人的生活。新华日报·交汇点记者为您盘点一周全球人工智能领域最值得关注的重磅新闻。

1. OpenAI发布新模型GPT-4.5

北京时间2月28日凌晨,人工智能(AI)巨头OpenAI发布GPT-4.5(研究预览版),也就是内部代号为Orion(猎户座)的模型。OpenAI称其为公司迄今为止规模最大、性能最强的聊天模型,号称“情商最高”“幻觉更少”,将首先开放给软件开发者以及订阅ChatGPT Pro的用户。

据OpenAI方面介绍,GPT-4.5是OpenAI迄今为止知识储备最丰富的模型之一,拥有1万亿激活参数,训练数据量高达120万亿tokens,上下文窗口长度扩展至256K。

此外,GPT-4.5的特点还包括能够在“温暖且自然”的对话中自然地整合想法,对人类意图的理解更加深刻,能够更细腻、更具“情商”地解读微妙的暗示或隐含期望。GPT-4.5还表现出更强的审美直觉和创造力,在写作和设计辅助方面表现出色。

不过,尽管GPT-4.5性能卓越,但其庞大的模型规模和高昂的计算成本也带来了挑战。OpenAI首席执行官Sam Altman表示,由于GPU资源紧张,推广节奏受到一定影响。他透露,下周OpenAI将增加数万块GPU,以支持更广泛的用户访问。

目前,GPT-4.5的API定价较高,输入token的价格是GPT-4o的30倍,输出token的价格则是15倍。OpenAI正在评估是否长期在API中提供该服务。

2. 腾讯混元推出Turbo S

几乎与OpenAI同步,2月27日,腾讯混元团队宣布推出新一代快思考模型Turbo S,以 “秒级响应” 和 “性能对标国际顶尖模型” 的姿态,加入全球AI竞赛。官方数据显示,Turbo S的吐字速度较前代提升一倍,首字时延降低44%,在知识问答、数学推理等Benchmark测试中,性能与 DeepSeek-V3、GPT-4o等国际领先模型持平。

基于 Turbo S,腾讯推出了深度思考模型混元T1,并已在腾讯元宝平台全量上线。开发者和企业用户可通过腾讯云API调用 Turbo S,享受输入0.8 元/百万tokens、输出2元/百万tokens的定价,且首周免费试用。对于C端用户,Turbo S将逐步在腾讯元宝灰度上线,标志着国产大模型在商业化落地层面的重要进展。

3. Claude 3.7 Sonnet重磅登场

北京时间2月25日凌晨,美国人工智能初创公司Anthropic发布混合推理模型Claude 3.7 Sonnet,该模型兼具LLM与推理能力,采用一个模型,两种思考方式:一是近乎实时地反应,二是扩展地、循序渐进地思考。

不仅如此,Anthropic还推出了代理编码工具Claude Code,可以搜索和读取代码、编辑文件、编写和运行测试、提交和推送代码到GitHub以及使用命令行工具。在早期测试中,Claude Code可以一次性完成通常需要45分钟手动操作的工作。

视觉中国供图 4. DeepSeek连续五天开源数据库,都亮出了什么?

从2月24日到2月28日,国内 AI 明星公司DeepSeek连续五天的“开源周”在本周五收官,DeepSeek在社交媒体X上先后开源了FlashMLA、DeepEP、DeepGEMM、优化并行策略(DualPipe和EPLB)以及面向全数据访问的推进器3FS多个项目,旨在与全球开发者社区分享其在通用人工智能(AGI)领域的研究进展,涵盖了从计算、通信到存储的各个方面。

2月24日:首个开源的代码库为Flash MLA,专门针对英伟达的 Hoppers GPU ( 比如H100、H800 ),进行效率优化,目前已投入生产; 2月25日:宣布将DeepEP向公众开放。DeepEP是用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求; 2月26日:宣布开源DeepGEMM。DeepGEMM 是一个专为简洁高效的 FP8 通用矩阵乘法(GEMM)设计的库,创始人梁文锋署名参与创建和开发了这项成果; 2月27日:一次性开源了两个工具和一个数据集,分别是DualPipe、EPLB(专家并行负载均衡器)以及训练和推理框架的性能分析数据。此外,DeepSeek还在Github上详细讲解了DeepSeek-V3和R1模型背后的并行计算优化技术; 2月28日:在官方X账号宣布开源3FS,它是所有DeepSeek数据访问的助推器。 据悉,这些代码库将提供给全球开发者二次开发和改进,并有望促进 AI 技术在更广泛领域应用上取得突破。

在2月26日,DeepSeek还在海内外同时宣布了API错峰优惠,自2月26日起,北京时间每日00:30至08:30的夜间空闲时段,API调用价格大幅下调:DeepSeek-V3降至原价50%,DeepSeek-R1更低至25%。DeepSeek鼓励用户充分利用这一时段,享受更经济更流畅的服务体验。

此前DeepSeek在R1论文中提到,R1 的性能将在下一个版本得到改善,因为相关的RL(强化学习)训练数据还很少。随着RL数据的增加,模型解决复杂推理任务的能力持续稳定提升,且会自然涌现出一些复杂行为能力。

业界认为,DeepSeek-R2的发布可能是AI行业的一个关键节点。

盘点时下最火的AI大模型

从谷歌等大型科技公司到OpenAI和Anthropic等初创公司,人工智能模型正在以令人眼花缭乱的速度涌现。根据科技媒体TechCrunch统计,目前有超过100万个AI模型。目前国际上最先进、使用最普遍的AI模型都有哪些?它们最适合做什么样的工作?来一起盘一盘2024年以来引起全球关注的大模型。

DeepSeek-R1

国产大模型DeepSeek以燎原之势席卷全球科技界。DeepSeek-R1于2025年1月20日发布并开源,在数学、编码和自然语言推理任务上表现出色,DeepSeek采用MIT许可证开源,支持模型蒸馏,用户可以免费下载并在本地运行,且API服务价格极低。适用于数学推理、算法编码、自然语言处理,尤其适合开发者、研究人员和需要高性能推理的场景。

OpenAI的GPT 4.5“Orion”

OpenAI称Orion是他们迄今为止最大的模型,并宣称“情商更高、幻觉更少”,现已向每月订阅费用200美元的ChatGPT Pro订阅用户开放。下周,该模型也将向每月20美元的ChatGPT Plus订阅用户开放。OpenAI首席执行官Altman表示,届时该公司将增加数万块GPU,提供算力支撑。

OpenAI的深度研究和Sora

OpenAI的深度研究(Deep Research)目前已经面向所有ChatGPT Plus、Team、Edu和Enterprise付费用户开放(先前只限Pro用户),除了面向专业研究人员,深度研究对于“挑剔购物者”也极具价值:当用户在网上寻觅汽车或家电,想要对比十几个参数、参考数十家网站的用户评价,人工手动搜索无疑耗时巨大,而深度研究能在5~30分钟内自动整合信息,最终生成带有清晰引文、重点标注、可视化图表的研究报告。不过,需要注意AI幻觉问题仍存。

Sora是一个基于文本创建逼真视频的模型。虽然它可以生成整个场景而不仅仅是片段,但OpenAI承认它经常会产生“不切实际的物理现象”。它目前仅在 ChatGPT的付费版本中可用。

Anthropic的Claude Sonnet 3.7

Claude由美国人工智能初创公司Anthropic开发,Anthropic称Claude 3.7 Sonnet是业界首个“混合”推理模型,可快速回答或深入思考,用户可控制思考时间,所有用户可用,但重度用户需付费订阅。

xAI的Grok 3

Grok 3是马斯克创办的初创公司xAI最新发布的模型,于2025年2月17日发布,声称在数学、科学和编码方面优于其他领先模型(如OpenAI的GPT-4o、Google Gemini),目前对所有用户开放试用,但无限次使用需要以30美元/月的价格订阅。

阿里巴巴的Qwen QwQ

2月25日,阿里巴巴Qwen团队宣布发布新推理模型——深度思考 (QwQ)。这是在QwQ-Max-Preview支持下,一个基于Qwen2.5-Max的推理模型。类似DeepSeek-R1和Kimi的推理模型,QwQ可同时支持深度思考和联网搜索,并会展示完整的思维链。

Mistral AI的Le Chat

2月6日,法国AI初创公司Mistral AI发布了号称全球最快的聊天机器人Le Chat iOS与Android版App,具备网页搜寻及多模态能力,并推出分级收费Pro及Team方案。该公司称,Le Chat的推理、思考和回应能力高于所有其他聊天助理,1秒最快可输出1000字,该公司称为闪电回答(Flash Answers)。

Google的Gemini 2.0 Pro实验版

2月6日,Google Gemini 2.0 Pro实验版发布,声称在编码和常识理解方面出色,拥有200万tokens的上下文窗口,可帮助需要快速处理大量文本的用户,该服务需要至少每月19.99美元的Google One AI Premium订阅。

Meta的Llama 3.3 70B

Meta的Llama 3.3 70B模型于2024年12月5日发布,Meta宣称此版本是最新、最先进的开源Llama模型,且最便宜、最高效,尤其适合数学、常识和指令遵循,同时免费开源。

新华日报·交汇点记者 杨易臻 蔡姝雯 张宣

部分内容整合自网络

特别声明:本文经上观新闻客户端的“上观号”入驻单位授权发布,仅代表该入驻单位观点,“上观新闻”仅为信息发布平台,如您认为发布内容侵犯您的相关权益,请联系删除!

相关内容

热门资讯

对抗顽疾5年!歌手方大同去世,... 来源:九派新闻 3月1日,歌手方大同独立音乐厂牌@赋音乐FUMUSIC 发布消息称:以积极的态度面对...
邦彦技术:邦彦云PC发布 专注... 中证报中证网讯(王珞)2月27日,邦彦技术在深圳龙岗区邦彦绿谷工厂举办云PC产品发布会。此次发布会上...
“白宫争吵”后,乌高层纷纷表态 据路透社2月28日报道,在乌克兰总统泽连斯基与美国总统特朗普和副总统万斯在28日早些时候发生口角后,...
南水北调中线工程完成2024—... 昨天(28日),南水北调工程安全度过全面通水以来的第11个冰期输水阶段。此次冰期输水期间,东、中线工...
北京银行:董事会同意由副行长戴... 中证报中证网讯(记者张佳琳)2月28日晚,北京银行发布公告称,董事会同意选举霍学文担任该行董事长,同...
美乌首脑“谈崩” 美记者:报...   据央视新闻3月1日消息,当地时间2月28日,白宫椭圆形办公室内,美国总统特朗普与到访的乌克兰总统...
劈波斩浪奋楫前行  稳中求进逐...   2024年是新中国成立75周年,是实现“十四五”规划目标任务的关键一年。这一年,外部环境变乱交织...
全国三八红旗手,嘉定+1 转自:上观新闻编辑:王晨尧(实习)
歌手方大同去世 3月1日,@賦音樂FUMUSIC发文,音乐人方大同于2025年2月21日去世,年仅41岁。据悉,20...
歌手方大同因病去世,年仅41岁 3月1日,@賦音樂FUMUSIC 发文,音乐人方大同于2025年2月21日去世,享年41岁。全文如下...
中华志愿者协会:免去杨尚松等人... 转自:长安街知事近日,有人以“中华志愿者协会”及“中华志愿者”名义,在全国范围召开乡村振兴领军人才培...
“两党制度已崩溃” ,美亿万富... 综合美媒报道,日前,美国著名律师、民主党捐助者约翰·摩根宣布,计划成立一个新政党。图片来源:美国政治...
西部TMT科技每周评议:AI技...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 特别声明特别声明《证...
赋音乐有限公司:方大同于2月2... 3月1日,赋音乐有限公司发布消息:以积极的态度面对顽疾5年, 方大同于2025年2月21日早晨,平静...
归侨二代的海南咖啡梦:让“侨乡... 中新社海口3月1日电 题:归侨二代的海南咖啡梦:让“侨乡味道”香飘世界中新社记者 张茜翼位于侨乡海南...
今天起,开始办理! 转自:上观新闻3月1日起,2024年度个税汇算正式开始。此前办理过预约的纳税人,可在预约日期当日登录...
阿里自研“深度思考”推理模型已...   Hehson科技讯 3月1日上午消息,Hehson科技独家获悉,夸克AI搜索近期上线“深度思考”...
超1500亿元资金!大增53%   数据显示,截至2月28日,按基金成立日为统计标准,2025年以来已经成立162只基金,首募总规模...
梁贵柏:文艺青年如何迷上了药品... 本文选摘自《双药记》一书“后记”,作者梁贵柏在这篇“后记”中回忆了六七十年代上海弄堂中一个酷爱文学的...
专家:预计2025年手机市场延... 转自:中工网中新网北京2月28日电 (记者 刘育英)2024年全球手机市场结束两年下滑。据中国信息通...