可灵AI2.0发布 技术革新驱动,人人皆可成为导演
创始人
2025-04-16 21:50:46

转自:扬子晚报网

4月15日,快手在北京中关村国际创新中心举行“灵感成真”发布会,正式推出旗下可灵AI的2.0版本,包含可灵2.0视频生成模型和可图2.0图像生成模型。快手相关负责人在发布会上表示,“我们希望可灵不仅仅是一个工具,更是激发个人创造力的伙伴,让灵感真正成为现实。”

可灵2.0在技术层面实现了多项关键突破。据官方介绍,可灵2.0视频生成模型采用了类似Sora的优化DiT(Diffusion Transformer)架构,结合Flow模型作为扩散基座,显著提升了对物理世界规律的模拟能力和计算效率。发布会现场演示显示,可灵2.0能精准生成火焰燃烧轨迹、模拟电影级运镜效果,并稳定生成长达10秒且连贯的复杂动作。

“通过架构创新和多模态技术的融合,可灵2.0在视频生成的物理模拟、语义理解和美学表现上达到了新的高度。”技术团队负责人分享道。在本次2.0模型的迭代中,可灵AI正式提出AI视频生成的全新交互理念Multi-modal Visual Language(MVL),允许用户通过文字、图片甚至视频片段的组合进行输入,实现更灵活、更精准的视频生成控制。

另外,记者发现基于可灵1.6视频生成模型,此次更新上线了全新的多模态视频编辑功能。该功能支持用户在一段视频的基础之上,通过输入图片或文字,对生成的视频内容进行元素的增加、删减、替换,帮助创作者们实现更加灵活的二次编辑和处理。

除了视频生成能力的升级,此次可图2.0文生图能力也迎来全面升级。包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上,可图2.0可支持60多种风格化的效果转绘,模型出图创意和想象力实现大幅跃升。

“我们的目标是让无论是专业人士还是普通用户,都能轻松驾驭镜头,讲述自己的故事。”发布会强调,可灵正致力于成为推动AIGC进入“人人皆可导演”时代的新基础设施。

近年来,AIGC技术在广告、影视等行业初露锋芒,赋能创作者产出更丰富的创意内容。随着技术的持续突破,生成式AI将深耕更多领域,推动多元场景的创新应用开花结果。

校对  潘政

相关内容

热门资讯

南财观察 第148期:豆包手机... 现在我们和手机的交互是“人找服务”:需要自己打开微信看地址,再切到地图叫车。而在豆包手机上,你只需要...
出租车司机遭乘客殴打!警方通报... 转自:法治日报12月14日,内蒙古自治区呼和浩特市赛罕区公安分局发布通报称,12月13日,赛罕区公安...
泽连斯基:要求乌克兰单方面撤军... 转自:北京日报客户端据乌克兰国际文传电讯社14日报道,乌克兰总统泽连斯基当天表示,美国要求乌军单方面...
香港火灾受影响居民,将获中医义... 转自:北京日报客户端香港特区政府医务卫生香港局今日(14日)公布,明日起将为大埔宏福苑火灾受影响居民...
晨丰科技:股东杭州宏沃拟减持不... 证券日报网讯 12月14日晚间,晨丰科技公告称,持股4.3134%的股东杭州宏沃计划自2026年1月...