广告
图片生成中,请稍候...

数亿融资到账!这家AI公司正在用数字人改变直播、客服、医生问诊

文章摘要:硅基智能完成数亿元D轮融资,加速AIGC数字人商业化落地。公司已推出多模态大模型DUIX ONE,广泛应用于电商、金融、传媒等领域,助力企业降本增效,并面向个人用户开放数字人克隆服务。

最近,一家在AIGC(人工智能生成内容)领域炙手可热的公司——南京硅基智能科技集团股份有限公司,完成了新一轮数亿元的D轮融资。投资方是来自嘉兴高新区产业基金,这笔资金将主要用于技术研发和产品市场化推进。

这家公司自2017年成立以来,已经拿到了超过十亿元的融资,累计完成10轮融资,背后站着腾讯、红杉中国、招银国际、中财奇虎、海松资本等一众顶级投资机构。他们的核心业务就是围绕AIGC数字人展开的技术研发与商业应用。

简单来说,他们想用AI打造“硅基劳动力”,也就是我们常说的数字人。目前,公司已经构建了四大产品线:DUIX智能交互平台、虚拟直播平台、视频生产平台和智能客服系统。这些听起来有点技术范儿的名字,其实已经在很多行业悄悄落地开花。

说到数字人,很多人可能还停留在“长得像人”的阶段。但现在的技术早就不是这样了。随着AI大模型、语音合成、计算机视觉等技术的飞速发展,数字人不仅能模拟人类的外貌、声音、表情,还能实现自然的交互能力。它们被广泛应用在直播带货、智能客服、教育辅导、娱乐互动等多个场景中。

根据艾瑞咨询的数据,2023年中国数字人市场规模已经突破100亿元,预计到2025年将达到300亿元,年复合增长率超过50%。这说明数字人市场正处于爆发式增长期。

不过,数字人赛道虽然热闹,竞争也异常激烈。硅基智能创始人司马华鹏在接受采访时就坦言:“现在市面上很多AI Agent只是工具型产品,一旦推理成本下降,这种纯工具类产品的技术门槛就会迅速降低,最终陷入价格战。”

那怎么破局?硅基智能给出的答案是:让数字人具备深度推理能力,进入更复杂的场景。

比如医生看病的过程,本质上就是通过证据链和患者特征,结合专业知识进行逻辑推导。而AI天然擅长这种基于逻辑链的思维过程。未来,很多需要理性分析的工作节点,可能会由AI来完成,而人类则可以专注于创意决策和情感交流。

为了支撑这样的能力,硅基智能在2024年11月推出了新一代多模态大模型——DUIX ONE。这个模型以API形式对外提供服务,集成了语音识别、语音合成、NLP和计算机视觉等多项核心技术。它不仅能让数字人“看得见”“听得懂”“说得出”,还能表达出接近真人的高情商反应。

具体来看,在语音方面,DUIX ONE能在各种嘈杂环境下准确识别不同口音和语速的语音输入,同时输出自然流畅、富有情感的人声效果;在形象建模方面,它可以通过一段短短几秒的视频素材,快速创建高度逼真的数字人形象,并实时驱动其面部表情和肢体动作。

而在交互层面,这套系统能够深入理解用户的语义和情绪,并生成逻辑清晰、内容丰富的回应。这样一来,数字人不再是冷冰冰的机器,而是真正能“聊得来”的存在。

在商业化方面,硅基智能采取了差异化的策略。对企业客户,他们主要服务于运营商、电商平台、传媒机构等行业,通过标准化API接口,帮助企业快速接入AI能力模块,大幅降低使用门槛。

举个例子,在电商直播场景中,商家只需要上传5分钟左右的真人主播视频,就能在平台上训练出一个专属的数字人主播。这个数字人不仅可以还原主播的声音、形象和语言风格,还能在直播间里实时与观众互动,提升用户停留时间和转化率。

截至目前,硅基智能已经为超过5000家品牌提供了数字人直播解决方案,帮助客户节省了大约80%的成本;在金融行业,他们已经与30多家银行和保险公司合作部署了智能客服系统;此外,还与主流电视台合作开发了虚拟主持人。

除了企业端,硅基智能也在向普通消费者开放数字人技术。他们推出了“数字人克隆”服务,用户只需一段1秒钟的视频,就能快速生成自己的数字分身,包括声音和形象。整个流程全自动化,最快一天内交付,价格也降到几千元级别。

数据显示,目前硅基智能平台的注册用户已经超过50万,每天生成的内容超过50万条,累计AIGC直播时长突破千万小时。越来越多的普通人正在从“看客”变成“创作者”。

为了让技术更快普及,硅基智能还将DUIX平台的核心技术开源,推出了支持Android和iOS的DUIX-Mobile版本。开发者只需要调用三行代码,就能把数字人功能集成进自己的App或产品中,大大缩短开发周期。

随着数字人技术在文娱、法律、金融、教育、医疗等行业的深入渗透,AI带来的不仅是效率的提升,更是对“人机关系”的重新定义。甚至在未来,“数字永生”也可能不再只是一个科幻概念。当一个人的记忆、情感、思维方式被完整地数字化保存下来,生命的意义或许也会因此被重新书写。

广告