转自:中国证券报·中证网
中证报中证网讯(王珞)4月26日,格灵深瞳发布2024年报,报告期内,公司实现营业收入11723.94万元;研发投入18897.13万元,同比增长3%;新增专利储备90个,不断夯实技术护城河。同时开启“多模态大模型技术与应用研发项目”,为未来的新产品的研发及落地做好准备。
格灵深瞳将继续加大人工智能领域的技术研发投入,围绕擅长的垂直领域重点投入,开发自主可控的多模态大模型和全新形态的复杂AIGC系统,为相关产业发展新质生产力提供关键驱动力,全力打造“AI+行业”的核心竞争优势。
在人工智能技术竞争最激烈的多模态大模型领域,格灵深瞳自研的视觉大模型Unicom表现尤为亮眼。该模型采用Vision Transformer的网络架构在10亿量级图像数据上预训练,学术评测超过OpenAI的CLIP和谷歌的SigLIP的模型,实验结果已经公布在全球计算机视觉顶级会议ECCV2024相关论文上;结合公司自研的视觉大模型Unicom和开源大语言模型,深瞳灵感-7B多模态大模型在具身问答(Embodied Question Answering)任务和引用表达分割(Referring Expression Segmentation)任务中,与业界同等规模的VLM模型相比居世界领先地位。目前,格灵深瞳自研视觉大模型已经在智慧金融、城市管理、工业检测等领域落地应用,大幅提升了AI算法交付效率。
公开信息显示,作为一家技术密集型企业,格灵深瞳掌握计算机视觉领域的核心算法技术,已形成了多模态大模型技术、3D立体视觉技术、自动化交通场景感知与事件识别技术、大规模跨镜追踪技术、机器人感知与控制技术、视频动作分析技术六大技术方向。凭借过硬的技术能力和长期的商业化经验,人工智能产品已成功在智慧金融、城市管理、智慧教育、工业检测等领域实现落地应用。