阿里大模型让照片跳舞 朋友圈掀起斗舞潮

光山新闻网 采集侠 2024-01-05 08:35:02
浏览

小字号

原标题:阿里大模型让照片跳舞,朋友圈掀起斗舞潮

只要一张照片就能生成一段舞蹈视频,又一个大模型应用出圈!

2024年第一个工作日开始,兵马俑、马斯克以及各地网友跳科目三和网红舞的视频就陆续在国内社交媒体和朋友圈刷屏。这些大约10秒左右的视频都不是真人出镜,均由大模型生成,这种低门槛的“跳舞“方式引发了网友的广泛体验,掀起了一波斗舞潮。各路网友金句频出:AI治愈了我的四肢不协调、科目三的风吹到了考古界、再也不用担心跳科目三崴脚……

这是阿里云通义千问APP上线的免费功能,在通义千问APP内输入“通义舞王”“全民舞王”等口令后,即可进入体验页面。用户按照提示要求上传照片后,十几分钟即可生成神形兼备的舞蹈视频,生成的视频能较好地保留原形象的面部表情、身材比例、服装以及背景等特征。目前,通义千问首批为用户提供了科目三、蒙古舞、划桨步、鬼步舞等12种热门舞蹈模板。

据悉,该功能背后的算法为阿里通义实验室自研视频生成模型Animate Anyone。早在11月底,该研究便在推特、Youtube等海外社交媒体平台爆火,相关视频播放量超1亿,项目在Github上的Star短短数日就超过1万,是近期大模型领域最受欢迎的大模型算法之一,国外开发者和网友集体称赞该算法效果,并发出“开放体验入口”的呼声。

除了惊艳的生成效果之外,该算法的技术路线也被广泛关注。视频生成是大模型领域最热门的研究方向之一,谷歌、Meta、Runway等国外科技公司都在积极布局,但一直以来,人物形象的视频生成面临诸多技术挑战,例如人物形象一致、动作流畅可控、时序无瑕疵的人物动作视频。

根据公开论文显示,Animate Anyone集成了多项创新技术,引入了ReferenceNet,用于捕捉和保留原图像信息,可高度还原人物、表情及服装细节;此外,该算法使用了高效的Pose Guider姿态引导器 ,保证了动作的精准可控;另外,通过时序生成模块,有效保证视频帧间的连贯流畅性。在相同数据集的测试下,Animate Anyone的性能表现显著优于国内外同类模型。

今年9月,通义千问成国内首批通过备案的大模型,通义千问APP上线后功能持续升级,目前可提供文本对话、语音对话、翻译、PPT大纲助手、小红书文案、视频生成等几十项功能。


(责编:曹淼、李源)

关注公众号:人民网财经

关注公众号:人民网财经

分享让更多人看到

推荐阅读 国内油价年内首次上调 业界:国际油价短期或将维持震荡走势     人民网北京1月4日电 (记者杜燕飞)国家发改委3日发布通知表示,根据近期国际市场油价变化情况,按照现行成品油价格形成机制,自2024年1月3日24时起,国内汽、柴油价格每吨分别提高200元、190元。折算升价,从全国平均来看,92号汽油每升上调0.16元,95号汽油每升上调0.17元,0号柴油每升上调0.17元。…    
解决发展不平衡不充分问题 大力推动数字经济和实体经济深度融合     人民网北京1月4日电 (记者许维娜)国家发展改革委、国家数据局日前印发《数字经济促进共同富裕实施方案》(以下简称《实施方案》),旨在推动数字技术和实体经济深度融合,不断做强做优做大我国数字经济,通过数字化手段促进解决发展不平衡不充分问题,推进全体人民共享数字时代发展红利,助力在高质量发展中实现共同富裕。 《实施方案》中明确,数字经济有利于加快生产要素高效流动、推动优质资源共享、推进基本公共服务均等化,阐释了数字经济是推进共同富裕的重要力量。…