加码多模态能力,夸克发布全新“AI相机”
创始人
2025-04-28 17:49:49

4月27日,夸克AI超级框发布全新AI相机,上新“拍照问夸克”功能。

资料显示,基于视觉理解与思考推理的强大模型能力,夸克AI超级框从视觉出发创新下一代搜索体验,进一步理解和回答物理世界中的各类问题。

作为阿里巴巴AI旗舰应用,夸克AI超级框持续快速迭代,提升超级智能体的多模态能力,打造用户生活、工作、学习的AI超级入口。

功能入口 视频截图

据官方介绍,夸克AI相机功能多元。拍下景色照片既可以查找位置,也能让旅游助手制定行程;看见不了解的文物、动物、植物,拍照问夸克,给出答案的同时也会自带中外语音讲解;跨国旅行时,面对外文菜单,拍照问夸克,也能给出良好翻译回应;使用夸克AI相机,还可以对照片进行多余杂物的消除,调整表情、头发和服装,还能让AI代写朋友圈文案。

旅游出行助手功能 夸克官方

同时,使用夸克AI相机也可以充当生活管家。电脑蓝屏、电器显示故障时,拍下相关情况,能获取解决方法和故障原因;家里灯泡、变压器、螺丝等物品损坏,拍照即可知晓该购买哪一款,解决生活中的各种难题。

生活建议功能 夸克官方

夸克AI相机能在健康方面给予指导。看不懂体检报告数值,拍照可获得详细解释,并生成专属健康方案;吃药前拍一拍,能了解服用指南和禁忌症状;尿酸偏高时,还能依据身体状况生成符合口味的一周食谱,关注各类健康问题。

健康顾问功能 夸克官方

夸克AI相机也可以帮助工作学习。手写合同字迹潦草,拍照后AI自动补全信息并生成调整好的合同;拍摄复杂图表,能直接完成计算给出答案;学习代码遇到参考资料不完整,拍照可复现并添加注释,助力工作学习。

工作学习助手功能 夸克官方

今年3月,夸克发布“AI超级框”并不断迭代用户体验。随着“拍照问夸克”上线,“AI超级框”在交互上极大拓展了应用场景。

眼下,多模态能力已经是AI大模型竞争的新一环。

去年,OpenAI推出Sora,实现“一句话生成视频”;谷歌发布Gemini,能够无缝地理解、操作和组合不同类型的信息。而后,国内主要公司也开始陆续跟进,升级旗下AI的多模态能力。

目前,腾讯混元大模型在2024年11月正式上线视频生成能力,不断拓展其多模态能力;月之暗面在2025年1月22日发布了Kimi1.5多模态思考模型,融合文本和视觉数据,支持跨模态推理;字节旗下的豆包在2025年4月发布了豆包1.5・深度思考模型,其多模态理解与应用场景支持边想边搜和视觉推理,国内各大AI大模型纷纷下场,开始了在多模态方面的竞争。

本文系观察者网独家稿件,未经授权,不得转载。

相关内容

热门资讯

高铁时代呼啸而至 乌海乘势驰... (来源:内蒙古日报)转自:内蒙古日报□郝飚  黄建飞  2025年12月23日,注定载入乌海城市发展...
茫崖市多措并举提升党员教育培训... 海西蒙古族藏族自治州茫崖市以高质量党员教育培训为抓手,创新构建内容“有料”、形式“有味”、转化“有力...
西宁市南北山森林防火应急处置演... 本报讯 (记者 宋明慧) 12月25日,省林业和草原局组织召开2025年西宁市南北山森林防火应急处置...
玛多校园变身“云端氧吧” 本报讯 (记者 祁万强 通讯员 马清 雒文清) 海拔4500米的青藏高原腹地,凛冽寒风中涌动着暖流。...
8个路口设置非机动车等候区 本报讯(西海新闻记者 李延绯)据西宁市公安局交通管理局交通事故预防大队发布的消息,2026年1月1日...