您的位置:主页 > 资讯 >

百度大脑AI技术再升级


    在百度大脑的AI技术方面,王海峰首先展示了一个“AI茶博士”,结合了机器人视觉、语音交互、自然语言处理等技术,AI机械臂不仅可以进行茶艺表演,还能给人倒盖碗茶。

 
    王海峰说,百度大脑从2010年的0.0版本一路进化到2018年的3.0版本。
 
    今天,王海峰发布百度大脑5.0版本。它是一个软硬一体的AI大生产平台,背后有AI算法、计算架构、应用场景的融合创新。

 
    与此同时,百度大脑5.0将AI安全模块独立出来,形成了包括基础层、感知层、认知层、平台层和AI安全五大部分的核心架构。
 
    在AI语音识别方面,百度此前推出了首个基于流式多集阶段注意力模型,利用局部注意力的流式识别,使得AI准确率相对提升15-20%。

 
    而且,它能够解决AI语音转文字的“中英文夹杂”问题。
 
    在AI语音合成方面,王海峰说,百度大脑的最新语音合成技术能让音色、风格、情感等多要素进行解耦分离,而且用户录20句话就能合成专属声音。
 
    上文提到的浦发银行“金融数字人”就是结合语音和视觉技术,由机器自动合成的虚拟形象。

 
    同时,基于知识图谱的视频语义理解,能让AI理解视频内容。王海峰现场展示了一段纪录片《大河唱》片段,影片中的角色、人物关系、音乐种类、取景地、影片主题等信息,都能被解析出来。
 
    在语言方面,百度大脑推出知识增强的语义理解框架——ERNIE,刷新了中文自然语言处理任务效果。
分享到:

来更了解它