2023年10月20日

数字人狂飙180天

作者 admin

“相比过去两个月,一些喧嚣和割韭菜类的角色在加速出清,市场热度逐渐回到了年初状态。”

原文

大模型热潮下,数字人赛道变得热闹起来。文旅、电商、金融等多个行业,形形色色的虚拟数字人,正代替真人,扮演着代言人、主播、客服和智能助理的角色。

市场的参与者也肉眼可见变多。互联网大厂、创业公司、老牌AI公司和一些此前做智能客服营销的数字服务商都卷进了这个赛道。IDC中国研究总监卢言霞告诉数智前线,入口属性是大量企业争相布局这一赛道的原因。生成式AI热潮下,数字人被视作未来使用自然语言与机器交互的入口级产品之一,推动了市场热度提升

2022年6月IDC在报告中预计,到2026年中国AI数字人市场规模将达到102.4亿元人民币。随着热度大增,数字人市场规模可能将更快达到这一水平。

值得一提的是,当下仍处在大模型驱动数字人产品应用落地的早期阶段。一方面,业界认为,数字人市场体量的变化要到明年有规模化落地后才能真正在市场端有所体现。现阶段,技术成熟度、成本和效率等仍然是制约因素。另一方面,不同的厂商呈现出差异化竞争趋势,企业正基于优势积累构建自身的壁垒。

几天前,GPT-4V版本更新,TTS(Text To Speech 文本转语音技术)进步,文本驱动语音的表现在停顿、重音和交互自然程度上都有了极大提升。一些资深人士认为,大模型驱动的数字人真正落地有望加速迎来爆发。

狂飙的数字人赛道

数字人赛道今年肉眼可见地火起来了。今年2月以来,“数字人”一词的微信指数达到了去年十月的几倍到几十倍水平。

AI视频直播SaaS创业公司特看科技CEO乐乘告诉数智前线,相比去年,今年整个赛道热度明显提升,前两个月尤其明显,呈现出泛滥乃至内卷的状态

“去年就只有几家在实验,有点飘在半空中,主要是元宇宙、3D数字人方向,整体成本很高,很难商业化落地。今年一下子掉到地上来了。”

市场火爆下,也出现了一些乱象,有微商代理入场掘金。业内人士统计,市面上大概有一千多家代理商在卖各种数字人。

大厂、创业团队、AI公司和一些此前做智能客服营销的数字化服务商都在这一赛道频繁动作。

大厂的布局其实早已有之。腾讯、百度、阿里、京东、火山引擎等平台此前在元宇宙概念下或基于直播带货等多个场景,都推出过数字人产品平台或服务。例如,腾讯云小微在2021年11月发布了数智人产品矩阵,提供3D超写实、2D真人、2D等五种风格数智人产品。百度也在2021年AI开发者大会上发布了百度智能云曦灵平台,具有数字人生产、内容创作、业务配置服务等功能,百度还打造出了“度晓晓”等数字人IP。

大模型到来后,厂商们推出新的数字人平台,相比上一阶段,制作效率和成本管理能力有大幅提升。腾讯云智能数智人产品总经理陈磊介绍,4月腾讯云发布的小样本数智人生产平台,12小时就能够出来Demo,成本也大幅降至千元级别。快手在今年8月发布的AIGC数字人产品快手智播,产品功能主打的也是降低制作门槛,3~5分钟真人视频和音频素材,成本实现大幅降低。

知名的AI公司们紧锣密鼓秀出了肌肉。今年4月,商汤科技在其技术交流日上展示了2D数字人视频生成平台“如影SenseAvatar”,官方介绍,仅需一段5分钟的真人视频素材,就可以生成出声音及动作自然、口型准确、多语种精通的数字人分身。7月世界人工智能大会上,如影升级到2.0版本,重点提升数字人在多语种的语音和口型的流畅度。

一些在数字人赛道投入已久的公司也积极推新。8月中旬,在3D虚拟人赛道投入已有5年的技术服务商魔珐科技一口气出了视频AIGC生成平台、AIGC直播平台和虚拟人服务AIGC平台三款消费级产品,从高质量、低成本和规模化复制三个层面,降低3D虚拟人的应用落地门槛。

热潮还吸引了跨界玩家,典型的有薇娅旗下的直播MCN机构谦寻控股布局。8月8日,谦寻控股旗下子公司谦语智能和羚客分别发布了AI数字人直播解决方案和一站式AI智能直播综合服务平台。

资深人士认为,入口属性是大量企业争相布局这一赛道的原因。“生成式AI,未来的入口之一是数字人。今天用的是简单web版,未来数字人可能体验更丰富。也是这个原因,企业开始纷纷进入这一市场。”卢言霞告诉数智前线。

魔珐科技创始人柴金祥在8月中旬的消费级产品发布会上则把3D虚拟人视作未来的一种基础设施。“像网页和APP一样,作为一种内容载体的升级,未来会重塑所有的行业”,柴金祥说。在这个认知下,魔珐科技除了消费级产品,还研发了3D虚拟人OS,用于管理未来的基础设施。

尝试将数字人形象和智能客服的对话能力结合的智能外呼公司云蝠智能看重的则是数字人的可互动性和未来的潜力。“最近有个表达我特别认同,数字人其实就是大模型的 UI”,云蝠智能CEO魏佳星告诉数智前线,“把时间都拉到5~10年看,数字人可能是在创造硅基生命。今天只是可互动的数字人,没有灵魂,并不代表未来它钻不进去灵魂。”

总体而言,大模型热潮正在点燃数字人赛道。中航证券的一份报告指出,乘风AI大模型的涌现,虚拟数字人将加速释放多元商业价值。数字人制造和运营服务的B端市场不断扩大,将面向更广大的C端用户提供服务,深耕数字人相关业务的企业有望迎来黄金发展期。

差异场景,各显神通

市场火爆之下,企业们盯上的却非同一块蛋糕。

文旅、电商、金融和企业内应用等不同细分市场里,数字人的商业化前景也并不一致,乐乘认为未来数字人更应视作是一种能力,不同细分赛道对数字人专业能力要求也不同。

文旅行业数字人应用不是新鲜事。数字人已经在不少景区和文化机构,扮演了代言人或景区智能大屏里的智能导游角色。典型案例有以“敦煌飞天”为蓝本打造的虚拟数字人“天妤”、中国文物交流中心的“文夭夭”、敦煌研究院的“伽瑶”、国家博物馆的“艾雯雯”等。一家文旅公司提及,有了数字人后,一些历史人物与游客个性化互动交流,展厅效果更丰富。

目前,百度、腾讯等不少厂商都在发力这一市场。几个月前,一名百度的数字化服务商告诉数智前线,他们做了一个河北的项目,打的是文旅市场,千万元级别。不过,也有行业人士提到,景区数字人并非单独报价千万,通常是整一套景区数字化解决方案中的一个能力,项目整体才能到千万级别。总体而言,相比一些企业内服务场景里千元级别的应用,文旅场景称得上头部市场

IDC介绍,金融行业是当下数字人应用相对更成熟的领域。以银行业为例,国内最早“聘用”数字员工的是浦发银行,3D数字人“小浦”在2019年由浦发银行联手百度智能云打造。据介绍,目前“小浦”已经在20多个岗位任职,包括财富规划师、文档审核员、大堂经理、电话客服等。9月初,IDC中国副总裁兼首席分析师武连峰在外滩大会银行业数字化论坛发布《银行数字科技五大趋势》时提到,到2025年,超过80%的银行都将部署数字人,承担90%的客服和理财咨询服务。

一位城商行财富管理版块的IT负责人告诉数智前线,他们也打算采购部署一套数字人,当下正处于紧锣密鼓考察其他银行的数字人方案及不同厂商产品等阶段。“基层员工有非常多指标,腾不出手来做更重要的工作”,该人士介绍,数字人可把他们从繁重的客服接待等工作中解放出来,去做更重要的客户维护等运维类工作。目前火山引擎、商汤科技、腾讯云、百度智能云、京东云等多家厂商都在金融行业里有数字人落地应用案例。

电商直播场景里,不少头部品牌已经开始在尝试数字人直播方案。乐乘介绍,大品牌乐于积极尝试数字人与企业一把手的AI战略有关,高层提了拥抱AI后,中层就会在营销等场景尝试数字人工具。目前他们已经服务了宝洁、欧莱雅等多个KA品牌,数据表现看数字人主播已经达到了真人主播销售额的70%。

数智前线了解到,电商直播场景里数字人服务模式有两种:一种是给KA品牌提供了数字人直播软件和代运营的打包服务,通常这个模式下每月报价在两到三万之间。另外一种是买一套软件自己播,市场报价目前在两千到四千之间。

看中直播市场的厂商不少,也出现了产品方案良莠不齐的现象,其中不乏“割韭菜”行为。一位电商行业资深人士介绍,目前使用数字人后数据好的品牌普遍特征是货品本身有产品力,传统无人直播方法也能卖得不错,用了数字人之后效果再往上提升了几成。

“那些吹嘘数字人卖货多么的数字人厂商,都是割韭菜,吹的越猛,镰刀越锋利。”该人士认为,数字人当下只是可以低成本规模化把真人能卖好的货能自动化完成销售

IDC指出,目前各类玩家的产品和解决方案在应用方向上存在差异,企业都基于自身优势赛道来打造数字人的场景。大厂会有一定的优势,但小厂可以择赛道而行,差异化竞争。

魏佳星告诉数智前线,他们切入数字人赛道,就选了一些又苦又累的场景。比如官网的客服用数字人又垂直又累,客单价还不高。普通的官网客服一般一年费用在2000元,加一个数字人能力,价格可能不超过五千元。这是巨头看不上的市场,一般的创业公司现在开始做,能力又追不上。这种差异化竞争是他们这类创业公司的机会。

规模化落地前夜

虽然声量不小,动作频频,不过业内普遍认识到当下仍然存在的挑战。

卢言霞观察,当下大模型应用尚未规模化落地,要到明年才能在市场端有数据变动。目前阶段,数字人开发周期,开发成本,形象定制,真正的AIGC化,都是挑战

以技术成熟度为例,不少数字人产品在语音、表情、互动表现上目前还比较生硬。一些资深人士甚至认为,不成熟的解决方案甚至会把潜在的客户用户洗出了市场。

不过这波AIGC浪潮下,技术更迭速度也很快。乐乘告诉数智前线,他们看到此前大模型跟数字人结合在文本转语音技术(TTS)有突破的迹象。“之前文本变成数字人的自然度有问题,衔接上一直不太容易。大模型是一条线,数字人是一条线。他们需要TTS技术突破,才能实现很好的融合。”

9月底,OpenAI新发布了版本更新 GPT-4V中,TTS技术由一个全新的TTS模型提供支持。它能够仅从文本和几秒钟的样本语音中生成类似人类的音频,结合Whisper模型的语音转文本,保证用户与ChatGPT进行语音交流的质量和流畅度。

行业人士观察,在一些用户已经灰度测试的新版本里,文本转语音表现颇令人惊艳,AI在停顿、语气和抑扬顿挫感上已经非常接近真人。“我判断TTS技术端到端成熟后,对行业格局的改变会很大。”乐乘说,相当于有了一个胶水,大模型驱动数字人从两条线能够结合到一起,企业后面去优化数字人的表现力就可以了。

数字人产品的价值呈现及规模化复制能力也是业界关注的重点。

魔珐科技创始人柴金祥介绍,早期的虚拟人行业发展的一大痛点就是规模化复制问题。从长内容时代的动画、电影和游戏领域里的虚拟人到短内容时代的虚拟偶像,例如初音未来、柳夜熙等,也包括魔珐早期打造的虚拟偶像翎__Ling都是手工制作,周期长,成本高。

一位观察者提到,此前的顶流虚拟人偶像“柳夜熙”需要配备超百人的创意团队,制作一个作品的投入成本可能超过百万级别。

柴金祥接受数智前线采访时提到,魔珐的AIGC技术已突破内容行业虚拟人此前无法被规模化复制的问题。此外,消费级产品如果想让企业持续使用,一定要解决企业的痛点问题,并且ROI是值得的。“需要以终为始思考,我们的产品有没有能力给企业带来价值,有没有能力ROI为正。”这几年他们的产品思路也沿着规模化复制、细分行业的专业能力以及形象上高质量、能表达可互动等角度发力。

行业内都重视降低产品的使用门槛,不少厂商发布产品时都提到了通过极小样本素材,实现数字人一键生成。在电商场景里,许多企业为了降低品牌客户使用数字人的门槛,还提供了数字人代运营模式。这一模式下,技术和服务一体,企业可以把数字人相关的工作整体交由机构负责,不用自己剪辑视频,也不用自己去操作数字人后台,按月支付软件加服务费用即可。

这种业态模式,数字人服务商的角色实际已经与电商场景里的传统MCN机构和代运营厂商的角色产生了重合。正如薇娅旗下公司提供数字人直播平台和工具一样,数字人厂商们的服务范围也在延伸。观察人士认为,未来随着数字人这类技术的规模化应用和落地,在多个行业里,不同类型服务商角色边界模糊和融合是大趋势。

一些从业者认为未来数字人将在许多企业服务场景里替代原有的白领角色,市场空间无限宽广。不过也有人为,以直播带货为例,社交平台在流量机制上不会让所有的主播都由数字人代替,因此市场规模上会存在上限。

喧嚣近半年后,从业者们也观察到,市场已经在呈现理性回归状态。“相比过去两个月,一些喧嚣和割韭菜类的角色在加速出清,市场热度逐渐回到了年初状态。”乐乘告诉数智前线,长远看留下的会是更专注技术积累的公司。

业界共识是,赛道的周期挺长,当下行业发展仍处于早期。卢言霞此前指出,“行业用户一方面可以从相对成熟的应用场景开始引入AI数字人;另一方面也需对应用场景保持耐心,不设置过高的期望值。”