百度大脑升级至5.0 核心算法再获重大突破,百度CTO王海峰

    作者:课课家教育更新于: 2019-07-09 15:21:34

    人工智能可以对人的意识、思维的信息过程的模拟。 人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。

    百度CTO王海峰博士带来了一段传统与科技碰撞的精彩演示——机械臂倒盖碗茶。这个机械臂既会茶艺绝活儿,还能说会道。虽然演示过程简短,背后却融合了机器人视觉、语音、自然语言处理等多种人工智能技术,也展示了百度AI技术储备的宽度和技术打磨的深度。

    在7月3日召开的百度AI开发者大会上,百度CTO王海峰博士带来了一段传统与科技碰撞的精彩演示——机械臂倒盖碗茶。这个机械臂既会茶艺绝活儿,还能说会道。虽然演示过程简短,背后却融合了机器人视觉、语音、自然语言处理等多种人工智能技术,也展示了百度AI技术储备的宽度和技术打磨的深度。

    百度大脑升级至5.0 核心算法再获重大突破,百度CTO王海峰_AI_人工智能_机器学习_课课家

    中国AI平台再次升级!王海峰刚刚宣布,百度大脑升级至5.0,形成了包括基础层、感知层、认知层、平台层和AI安全五大部分的核心架构。百度大脑5.0成为软硬件一体的AI大生产平台,核心算法再获重大突破,公布端到端AI计算架构,并实现了AI计算、计算架构与应用场景的创新融合。而安全一直都贯穿AI技术研发的始终,已经融合在百度大脑的所有模块中。

    语音-SMLTA中英混输

    百度语音技术部高级总监高亮在开发者大会现场说了一段Rap:Hello Everyone,中英混合说是我们的everyday work,Explore技术的depth和scope是我们的responsibility……这段中英夹杂的话被百度输入法流畅、精准、及时地识别出来!这背后是百度大脑流式多级的截断注意力模型(SMLTA),它能让语音识别速度大幅提升,准确率提15%-20%,是基于流式注意力的语音识别线上服务。

    实时虚拟形象

    浦发银行的数字人是怎么“炼”成的?它实际上是结合语音和视觉技术,机器自动合成的虚拟形象。王海峰介绍,实时合成虚拟形象技术,首先需要对语音信号和视频信号进行实时识别与理解,再通过唇动生成,以及语音、面部和肢体的合成,实时合成一个虚拟形象。这波操作背后,是百度大脑多项AI技术能力的体现。

    视频语义理解

    王海峰展示了关于中国民间艺术的音乐纪录片《大河唱》中的片段,影片中的角色、人物关系、音乐种类、取景地、影片主题等信息,都被精准解析。这背后是基于知识图谱的视频语义理解技术。

    核心算法重磅升级

    百度大脑语音、视觉、语言和知识等核心算法法再度重磅升级,发布6大技术突破。包括先进流式多级的截断注意力模型(SMLTA)和风格迁移的语音合成技术;知识增强的语义理解框架ERNIE和基于知识图谱的视频语义理解技术;业界高准确、低时延的机器同传技术。值得关注的是,在语言方面,百度大脑推出知识增强的语义理解框架——ERNIE,再次全面刷新了中文自然语言处理任务效果,超越谷歌BERT。

    远场语音交互芯片“鸿鹄”发布

    继去年开发者大会发布“昆仑”芯片后,今年,王海峰发布了一款新的芯片——远场语音交互芯片“鸿鹄”。鸿鹄芯片使用了HiFi4自定义指令集,双核DSP核心,平均功耗仅100mW。这款芯片是根据车规级标准打造,将为车载语音交互、智能家具等场景带来巨大的便利。

    百度飞桨与华为麒麟芯片合作

    王海峰与华为消费者BG软件总裁王成录博士联合宣布,百度飞桨与华为麒麟芯片达成深度合作。中国人自己的深度学习平台将运行在中国人自研的先进芯片上,两大国货之光将充分发挥各自在软、硬件方面的优势,走出中国智能之路!

     人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。2017年12月,人工智能入选“2017年度中国媒体十大流行语”。

课课家教育

未登录