近日 “元宇宙”概念引人关注,而一切火热的概念背后,都需要有技术的支撑。其中,“人工智能技术”能为元宇宙的大量场景提供技术支撑,未来“人工智能技术”将有怎样的发展趋势,封面新闻记者对话了科大讯飞(行情002230,诊股)副总裁、西南片区总裁娄超先生。

科大讯飞副总裁谈人工智能五大趋势 解决“虚拟人交互”是迫切问题

  科大讯飞副总裁娄超

  封面新闻:在您看来,人工智能未来发展的重点方向是什么?哪些领域可能会迎来爆发?

  娄超:未来十年人工智能发展将出现五大趋势:

  一是实现机器的无监督和半监督学习。我们大量数据到后台不要人做标记,机器自己去学,既保护用户隐私,又让机器自我迭代,也是就是,既要用更少的数据实现更好的效果,也要让机器自主动态自学,可以适应每个人的要求,让他可以听每个人的个性化声音。

  二是深度学习的“黑盒”变“白盒”。深度学习使用数百万个数据点作为输入,并将相关数据作为输出,通常无法使用纯语言解释其内部逻辑,而这种不可解释性,限制了人工智能在现实世界中的应用。需要让机器学习的结果可以越来越可以解释,以更好地建立与人的联系。

  三是人工智能与多学科交叉研究加速,可以在更多的领域引发颠覆式创新。比如说材料科学,原来材料科学是靠拆,即便是我们“十三五”一些重大项目的科学家,也是用经验、用材料做各种实验,就像爱迪生当年做电视、电灯的钨丝一样的,今天人工智能后台算法可以做大量的模拟训练以后使它效率成万倍的提升。

  四是“人机耦合”的持续探索。当前的人工智能应用程序主要在电子设备上运行,但人们最终会看到电子和生物系统之间更加紧密的集成,让机器跟人共同协作。就像刚才讲的给独居老人的活动,机器听不懂,人来兜底,人服务一次,机器马上学,下一次机器就会了。

  五是脑科学研究。重点研究类脑的多模态感知与信息处理智能技术,类脑芯片与系统,类脑计算系统以及脑机接口等技术,为提高多模态智能感知与信息智能处理的性能与效率开展基础性、创新性的研究,以促进通用人工智能的发展。

科大讯飞副总裁谈人工智能五大趋势 解决“虚拟人交互”是迫切问题

  元宇宙六大支撑技术

  封面新闻:有专家认为,元宇宙将成为各国数字经济的竞争高地,您怎么看待数字经济发展和人工智能等技术的关系?

  娄超:对于数字经济的发展,我感触最深的是,从数字产业化到产业数字化,今天的数字经济已经进入到深水区:

  首先,产业数字化是我们国家从高速增长阶段迈向高质量发展阶段的必经之路,产业数字化的成败决定传统企业的生死,而决定产业数字化成败的,就是能否坚持核心源头技术的创新。

  同时,我们认为,驱动产业数字化的核心动力就是人工智能,从去年人工智能企业大幅增长的业绩来看,人工智能正在帮助人们解决生活和生产的刚需问题。

  现在,我们的“因材施教”智慧教育解决方案、我们的智医助理已经开始走进千家万户了,人工智能正在像水和电一样无处不在,和教育、医疗、城市、司法、工业等各行各业深度融合,正在深刻的改变历史进程。

  最后,我想说的是,产业数字化是数字经济和实体经济的“一体两面”,高科技和传统行业相融合,唯有坚持“共建、共享、共生”,才能“共荣”和“共赢”。讯飞从2010年就开始开放A.I.能力给广大的开发者,到现在讯飞开放平台已经开放了442项技术能力了,有271万的开发者开发出了130万个应用,帮助超过400万的生态伙伴实现产品智能化,所以我们一直坚信:唯有一起建设产业数字化生态,我们国家的数字经济发展才可以生生不息。

科大讯飞副总裁谈人工智能五大趋势 解决“虚拟人交互”是迫切问题

  科大讯飞虚拟人交互1.0

  封面新闻:在元宇宙中,人们都有一个“虚拟人”的身份,能不能介绍下目前“虚拟人”技术的发展情况?

  娄超:其实除了语音应用,我们还有多维信息、多模信息的相互融合和识别技术。例如,我们把语音识别、人脸识别和动画设计结合在一起,用户可以挑选自己喜欢的眉眼、鼻子、嘴型和声音特点,在1分钟之内就能定制出属于自己的虚拟主播。

  将来我们还能通过系统定制的虚拟主播来满足我们对于家庭生活的感情需要,比如在家里听女朋友的声音读书读报,或者听子女后代的声音给自己每天讲故事、聊天等等。

科大讯飞副总裁谈人工智能五大趋势 解决“虚拟人交互”是迫切问题

  科大讯飞个性化真人捏脸系统

  不久前的10月20日广电总局发布了《广播电视和网络视听“十四五”科技发展规划》,其中提到需要大力发展虚拟主持人。在未来,无论是数字经济还是元宇宙,虚拟人的交互已经成为迫切要解决的问题。不再是原来单独的语音交互,它需要以情感贯穿的音色、语气、表情、嘴型、眼神、动作、衣品、环境等交互要素,核心是多模感知。从语音到视频、人脸、动作甚至心跳、脉搏、血压等同步感知、多维表达,不再是单一的视频、人脸或者语音信号,而是需要以情感贯穿的一体化、立体化、拟人化真实表达,让每个人都可以自主定义。

  刚刚闭幕的第四届世界声博会暨2021科大讯飞全球1024开发者节上,我们发布了 “虚拟人交互平台1.0”,全行业首次定义“什么是真正未来的虚拟人的交互平台”。在这中间,我们今年有一个寻声计划,在平台发布时已经有将近5000人提供了他们认为最好的声音参与平台的共享和共创。目前,虚拟人家族形象也已增至54位,我们相信它还会进一步丰富,后台的理解和认知也会不断的进步。