转自:上观新闻
本周,全球AI大模型“群雄逐鹿”走向白热化。腾讯、OpenAI 、Anthropic纷纷发布新品,DeepSeek连续五天开源数据库。AI领域正迎来新一轮技术竞赛,国内外厂商玩家纷纷加快步伐,人工智能的技术变革也在切实影响普通人的生活。新华日报·交汇点记者为您盘点一周全球人工智能领域最值得关注的重磅新闻。
1. OpenAI发布新模型GPT-4.5
北京时间2月28日凌晨,人工智能(AI)巨头OpenAI发布GPT-4.5(研究预览版),也就是内部代号为Orion(猎户座)的模型。OpenAI称其为公司迄今为止规模最大、性能最强的聊天模型,号称“情商最高”“幻觉更少”,将首先开放给软件开发者以及订阅ChatGPT Pro的用户。
据OpenAI方面介绍,GPT-4.5是OpenAI迄今为止知识储备最丰富的模型之一,拥有1万亿激活参数,训练数据量高达120万亿tokens,上下文窗口长度扩展至256K。
此外,GPT-4.5的特点还包括能够在“温暖且自然”的对话中自然地整合想法,对人类意图的理解更加深刻,能够更细腻、更具“情商”地解读微妙的暗示或隐含期望。GPT-4.5还表现出更强的审美直觉和创造力,在写作和设计辅助方面表现出色。
不过,尽管GPT-4.5性能卓越,但其庞大的模型规模和高昂的计算成本也带来了挑战。OpenAI首席执行官Sam Altman表示,由于GPU资源紧张,推广节奏受到一定影响。他透露,下周OpenAI将增加数万块GPU,以支持更广泛的用户访问。
目前,GPT-4.5的API定价较高,输入token的价格是GPT-4o的30倍,输出token的价格则是15倍。OpenAI正在评估是否长期在API中提供该服务。
2. 腾讯混元推出Turbo S
几乎与OpenAI同步,2月27日,腾讯混元团队宣布推出新一代快思考模型Turbo S,以 “秒级响应” 和 “性能对标国际顶尖模型” 的姿态,加入全球AI竞赛。官方数据显示,Turbo S的吐字速度较前代提升一倍,首字时延降低44%,在知识问答、数学推理等Benchmark测试中,性能与 DeepSeek-V3、GPT-4o等国际领先模型持平。
基于 Turbo S,腾讯推出了深度思考模型混元T1,并已在腾讯元宝平台全量上线。开发者和企业用户可通过腾讯云API调用 Turbo S,享受输入0.8 元/百万tokens、输出2元/百万tokens的定价,且首周免费试用。对于C端用户,Turbo S将逐步在腾讯元宝灰度上线,标志着国产大模型在商业化落地层面的重要进展。
3. Claude 3.7 Sonnet重磅登场
北京时间2月25日凌晨,美国人工智能初创公司Anthropic发布混合推理模型Claude 3.7 Sonnet,该模型兼具LLM与推理能力,采用一个模型,两种思考方式:一是近乎实时地反应,二是扩展地、循序渐进地思考。
不仅如此,Anthropic还推出了代理编码工具Claude Code,可以搜索和读取代码、编辑文件、编写和运行测试、提交和推送代码到GitHub以及使用命令行工具。在早期测试中,Claude Code可以一次性完成通常需要45分钟手动操作的工作。
视觉中国供图 4. DeepSeek连续五天开源数据库,都亮出了什么?
从2月24日到2月28日,国内 AI 明星公司DeepSeek连续五天的“开源周”在本周五收官,DeepSeek在社交媒体X上先后开源了FlashMLA、DeepEP、DeepGEMM、优化并行策略(DualPipe和EPLB)以及面向全数据访问的推进器3FS多个项目,旨在与全球开发者社区分享其在通用人工智能(AGI)领域的研究进展,涵盖了从计算、通信到存储的各个方面。
2月24日:首个开源的代码库为Flash MLA,专门针对英伟达的 Hoppers GPU ( 比如H100、H800 ),进行效率优化,目前已投入生产; 2月25日:宣布将DeepEP向公众开放。DeepEP是用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求; 2月26日:宣布开源DeepGEMM。DeepGEMM 是一个专为简洁高效的 FP8 通用矩阵乘法(GEMM)设计的库,创始人梁文锋署名参与创建和开发了这项成果; 2月27日:一次性开源了两个工具和一个数据集,分别是DualPipe、EPLB(专家并行负载均衡器)以及训练和推理框架的性能分析数据。此外,DeepSeek还在Github上详细讲解了DeepSeek-V3和R1模型背后的并行计算优化技术; 2月28日:在官方X账号宣布开源3FS,它是所有DeepSeek数据访问的助推器。 据悉,这些代码库将提供给全球开发者二次开发和改进,并有望促进 AI 技术在更广泛领域应用上取得突破。
在2月26日,DeepSeek还在海内外同时宣布了API错峰优惠,自2月26日起,北京时间每日00:30至08:30的夜间空闲时段,API调用价格大幅下调:DeepSeek-V3降至原价50%,DeepSeek-R1更低至25%。DeepSeek鼓励用户充分利用这一时段,享受更经济更流畅的服务体验。
此前DeepSeek在R1论文中提到,R1 的性能将在下一个版本得到改善,因为相关的RL(强化学习)训练数据还很少。随着RL数据的增加,模型解决复杂推理任务的能力持续稳定提升,且会自然涌现出一些复杂行为能力。
业界认为,DeepSeek-R2的发布可能是AI行业的一个关键节点。
盘点时下最火的AI大模型
从谷歌等大型科技公司到OpenAI和Anthropic等初创公司,人工智能模型正在以令人眼花缭乱的速度涌现。根据科技媒体TechCrunch统计,目前有超过100万个AI模型。目前国际上最先进、使用最普遍的AI模型都有哪些?它们最适合做什么样的工作?来一起盘一盘2024年以来引起全球关注的大模型。
DeepSeek-R1
国产大模型DeepSeek以燎原之势席卷全球科技界。DeepSeek-R1于2025年1月20日发布并开源,在数学、编码和自然语言推理任务上表现出色,DeepSeek采用MIT许可证开源,支持模型蒸馏,用户可以免费下载并在本地运行,且API服务价格极低。适用于数学推理、算法编码、自然语言处理,尤其适合开发者、研究人员和需要高性能推理的场景。
OpenAI的GPT 4.5“Orion”
OpenAI称Orion是他们迄今为止最大的模型,并宣称“情商更高、幻觉更少”,现已向每月订阅费用200美元的ChatGPT Pro订阅用户开放。下周,该模型也将向每月20美元的ChatGPT Plus订阅用户开放。OpenAI首席执行官Altman表示,届时该公司将增加数万块GPU,提供算力支撑。
OpenAI的深度研究和Sora
OpenAI的深度研究(Deep Research)目前已经面向所有ChatGPT Plus、Team、Edu和Enterprise付费用户开放(先前只限Pro用户),除了面向专业研究人员,深度研究对于“挑剔购物者”也极具价值:当用户在网上寻觅汽车或家电,想要对比十几个参数、参考数十家网站的用户评价,人工手动搜索无疑耗时巨大,而深度研究能在5~30分钟内自动整合信息,最终生成带有清晰引文、重点标注、可视化图表的研究报告。不过,需要注意AI幻觉问题仍存。
Sora是一个基于文本创建逼真视频的模型。虽然它可以生成整个场景而不仅仅是片段,但OpenAI承认它经常会产生“不切实际的物理现象”。它目前仅在 ChatGPT的付费版本中可用。
Anthropic的Claude Sonnet 3.7
Claude由美国人工智能初创公司Anthropic开发,Anthropic称Claude 3.7 Sonnet是业界首个“混合”推理模型,可快速回答或深入思考,用户可控制思考时间,所有用户可用,但重度用户需付费订阅。
xAI的Grok 3
Grok 3是马斯克创办的初创公司xAI最新发布的模型,于2025年2月17日发布,声称在数学、科学和编码方面优于其他领先模型(如OpenAI的GPT-4o、Google Gemini),目前对所有用户开放试用,但无限次使用需要以30美元/月的价格订阅。
阿里巴巴的Qwen QwQ
2月25日,阿里巴巴Qwen团队宣布发布新推理模型——深度思考 (QwQ)。这是在QwQ-Max-Preview支持下,一个基于Qwen2.5-Max的推理模型。类似DeepSeek-R1和Kimi的推理模型,QwQ可同时支持深度思考和联网搜索,并会展示完整的思维链。
Mistral AI的Le Chat
2月6日,法国AI初创公司Mistral AI发布了号称全球最快的聊天机器人Le Chat iOS与Android版App,具备网页搜寻及多模态能力,并推出分级收费Pro及Team方案。该公司称,Le Chat的推理、思考和回应能力高于所有其他聊天助理,1秒最快可输出1000字,该公司称为闪电回答(Flash Answers)。
Google的Gemini 2.0 Pro实验版
2月6日,Google Gemini 2.0 Pro实验版发布,声称在编码和常识理解方面出色,拥有200万tokens的上下文窗口,可帮助需要快速处理大量文本的用户,该服务需要至少每月19.99美元的Google One AI Premium订阅。
Meta的Llama 3.3 70B
Meta的Llama 3.3 70B模型于2024年12月5日发布,Meta宣称此版本是最新、最先进的开源Llama模型,且最便宜、最高效,尤其适合数学、常识和指令遵循,同时免费开源。
新华日报·交汇点记者 杨易臻 蔡姝雯 张宣
部分内容整合自网络
特别声明:本文经上观新闻客户端的“上观号”入驻单位授权发布,仅代表该入驻单位观点,“上观新闻”仅为信息发布平台,如您认为发布内容侵犯您的相关权益,请联系删除!