编者按
元宇宙(Metaverse),科幻小说的概念已经成为现实世界中的流行语。围绕这一新兴概念,产学研实践正在展开。元宇宙能否在数字化转型中发挥重要作用?如何在中国语境下实现这些新概念?为了为行业和公众提供理解元宇宙的敲门砖,南财合规科技研究院数字娱乐课题组策划了《望元宇宙》系列报道。
作为元宇宙的土著人,数字人已成为近年来行业和学术界讨论的焦点。目前,业界普遍认为,数字人的大规模应用依赖于高现实主义效果、良好的生产效率和可控的成本。但与此同时,终端运行叠加计算能力的需求对实时云渲染能力构成了挑战。在第六篇系列报告中,我们讨论了元宇宙的基本技术及其背后的实际工业应用。
近年来,随着人工智能、虚拟现实等新技术的快速发展,虚拟数字人开始进入普通人的生活。除了新颖的外观形象和灵活的互动效果外,该行业还在挖掘数字人的潜力。
未来数字人的发展将呈现静态趋势和2D向3D、卡通走向写实,单向多向互动。蔚领时代创始人兼CEO郭建军在接受《21世纪商业先驱报》独家采访时表示,数字人领域已经度过了萌芽阶段,进入了快速增长阶段,并将在不久的将来迎来爆发阶段。这也意味着该行业已经开始进入商业实现探索的关键阶段,并将逐步建立标准化。
然而,除了丰富的想象空间,一些着陆问题仍然困扰着从业者和用户。未来,数字人能否实现高度实时、高度灵活、高度适应着陆场景,与人类有效互动,还有待验证。
面对质量和成本的双重问题
根据中国人工智能产业发展联盟发布的《虚拟数字人发展白皮书》,虚拟数字人一词最早起源于1989年 美国国立医学图书馆年发起的可视人计划(Visible Human Project, YHP)。2001年, 香山科学会议滴174次以中国数字虚拟人体科技问题为主题的学术研讨会提出了数字虚拟人体的概念。
但当时,这些虚拟数字人主要是指人体结构的可视化,以三维形式显示人体解剖结构的大小、形状、位置和器官之间的空间关系。它与元宇宙中的土著数字人有很大的不同。
近五年来,由于深度学习算法的突破,数字人的制作过程得到了有效的简化,虚拟数字人开始步入正轨。
这也引起了政策层面的关注。
2022年8月,北京市经济和信息化局发布了《北京市促进数字人产业创新发展行动计划(2022-2025新发展行动计划(2022-2025)》(以下简称《计划》)。该计划建议抓住以数字人为代表的互联网3.0创新应用产业机遇,充分发挥国际科技创新中心建设优势,打造数字人产业创新高地。
该计划提出了发展目标。到2025年,北京将培育1-2家收入超过50亿元的龙头数字人企业和10家收入超过10亿元的重点数字人企业,建设10家校企联合建设实验室和企业技术创新中心,建设5个以上共同技术平台,培育20个数字人应用基准项目,建设2个以上特色数字人园区和基地。
然而,该行业的现状似乎与该计划提出的目标还有一定的距离。《21世纪商业先驱报》记者了解到,目前,一些企业在建设数字人的过程中仍会遇到渲染质量低、生产成本高的问题,IP创造周期长等问题。
京东集团副总裁、京东智能产品.COM智能产品与服务部总裁何晓东在接受《21世纪商业先驱报》采访时表示,数字人是数字出身、人机交互等技术落地过程中最有希望的形式之一,但在实际应用过程中,一些数字人的行为非常僵化,只能起到展示的作用,无法提供实际的业务交互。
以银行场景中的数字人为例,何晓东表示,如果数字人办理好整套银行业务,就需要克服几个非常落地的问题。首先要避免噪音,因为银行柜台是比较噪音的地方。其次,银行数字人需要与后台的业务支持系统有效对接,这必须能够解决许多银行的具体业务问题。例如,何晓东说,转账、取钱、更改密码等业务行为意味着数字人在知识推理、语音推理等方面应该达到高标准,因此这些方面的同步也是一个巨大的挑战。
三种商业模式
郭建军在采访中也表达了类似的观点。他说,数字人成熟的背后是技术整合能力,另一方面是技术整合能力IP操作能力。数字人是一个产业链很长的行业,不仅需要底层引擎技术的发展,还需要优化上层工具和生产管道,以满足数字人形象好、生产效率高、成本可控的三重效果。
而IP运营能力体现在构建数字形象的思路和经验上。郭建军表示,目前行业普遍存在技术生产更有信心,缺乏运营思维。在这方面,蔚领时代正在探索的一条道路是选择更专业的生态合作伙伴进行商业化。
近日,蔚领时代与娱乐企业海西传媒集团成立独立运营公司蔚海灿娱,推出龚俊数字人吉峰IP矩阵建设、虚拟空间建设等多重合作。
值得一提的是,使用适合特定场景的场景IP加快表演数字人创新也是计划规划的主要任务之一。它提出促进技术人才和艺术人才的联合创新,加快数字人的创新IP孵化,培育创造者经济。同时,打造优质数字人品牌,支持数字人参与广告营销和品牌代言,加强数字人运营管理,树立传播正能量的数字人形象。
事实上,IP运营、客户服务和流量实现是数字人的三大商业模式。
腾讯云最近发布的《数字人产业发展趋势报告(2023)》指出,内容/IP数字人主要依靠数字人的商业IP实现业务实现,功能服务类型交付给客户实现实现,虚拟分离需要结合虚拟空间的设置和规则来实现流量实现。
随着定制程度的下降,数字人的生产成本和周期都在下降。内容/IP类型的数字人更多的是项目系统,主要是定制;功能服务类型是产品与定制相结合,在一般产品中进行定制开发;虚拟分离更多的是产品系统。用户使用平台工具产品制作数字人形象,并在相应的虚拟场景中进行活动。一般来说,内容/IP成本和周期最高,数字人的虚拟分体型最低。”
大规模应用依赖可控成本
数字人的大规模应用有三个必要条件:高现实效果、高生产效率和可控成本。郭建军认为,虽然与传统的离线渲染相比,电影和电视水平的现实效果仍需要提高,但当前行业应用的实时渲染技术在生产效率、可控成本和数字人互动方面具有优势。
科技部信息通信专家、上海工艺智能制造技术创新研究所所长何仁龙告诉《21世纪商业先驱报》,构建虚拟世界的技术正在逐渐成熟,应用场景越来越丰富,效果非常逼真。但数字人仍然面临着一系列的感知互动问题。
在创造元宇宙的过程中,世界的秩序和逻辑将被构建,但世界是否有重力和重力是技术需要探索的方向。同时,虚拟世界的逻辑需要虚拟世界的逻辑需要规则和算法来生成,如何有效地使数字人除了视觉和听觉之外,还与用户进行触觉感知交互,这也是该行业面临的一个难题。
未来超现实世界将以可视化为主要特征。这需要大量的图形操作。郭建军认为,VR/AR终端将成为元宇宙的入口,但终端的运行依赖于计算能力的高速运行。其中,实时云渲染能力解决了将超现实世界带入终端体验的问题。
只有当云实时渲染达到高标准时,才能真正带来足够现实、互动和沉浸式的图像质量。这就是蔚领时代所认为的GaaS(Graphics as a Service)逻辑到来的逻辑依据。
郭建军认为,未来支撑实时云渲染的底层技术主要是云原生技术,如多GPU协同渲染,以及C S该架构为数十名玩家输出了几十个视频流的技术。这些创新的云本地技术是未来元宇宙的支持,也是未来元宇宙所需要的类似云游戏的串流能力和云虚拟化能力。
郭建军说:一个令人欣慰的现象是,我们看到头部渲染引擎技术发展迅速,现在已经开始应用影视效果。
除云原生技术外,3D重建技术的发展也给数字人的大规模着陆带来了更多的可能性。
上述报告指出,2D数字人和3D数字生成/建模方式不同,2D数字人的本质是生成图像,所以主要的方法是根据视频生成与真人相同的深度学习技术,技术相对成熟。
“3D数字人需要建立3D模型主要采用传统的手工建模、静态扫描建模(相机阵列扫描建模)、动态光场或AI建模(3D重建技术)生成3D模型。目前,手工建模和静态扫描建模技术相对成熟,应用广泛D报告指出,重建技术或动态光场可以大大节省建模时间,提高建模效率。
科大讯飞总裁吴晓如认为,机器要想更自然地与人类互动,就需要通过听觉、视觉、语义和各种传感器的组合获得更多有用的信息,AI感知必须从单模态发展到多模态,并逐步拟人化。
科大讯飞于2021年10月正式发布AI虚拟人交互平台具有多模感知、多维表达、情感贯穿、自主定义四大交互特征。它可以在客户的不同业务场景下进行AI虚拟人赋能,提供一站式AI虚拟人应用服务。
吴晓如在接受《21世纪商业先驱报》等媒体采访时表示:科大讯飞推出的数字人已经开始将视觉、手势、视觉和语音结合起来,实现数字虚拟人交互的多维表达。
生产:南财合规科技研究院数字娱乐课题组
策划:曹金良
统筹:诸未静
研究员:诸未静、蔡淑越、孙煜、吴立洋、张梓桐
本期作者:张梓桐
设计:陈珊
更多内容请下载21财经APP