不懂人工智能是如何搞开发的?

    作者:关注前沿科技更新于: 2020-10-28 20:07:20

    不懂AI的我,是如何搞开发的?新一代人工智能的发展需要脑科学、神经科学、认知心理学、信息科学等相关学科的实验科学家和理论科学家的共同努力,寻找人工智能的突破点,同时必须要以严谨的态度进行科学研究,让人工智能学科走在正确、健康的发展道路上。

    高达86%,这就是目前市场对「定制开发AI模型」需求的占比。

    不懂人工智能是如何搞开发的_人工智能_机器学习_开发_课课家个过程中,企业用户和开发者往往存在着以下诸多问题:

    • 缺少模型训练经验
    • 数据采集和标注成本较高
    • 模型适配与部署流程非常繁琐
    • 模型优化迭代周期长

    那么,是否存在一种工具,能够「一站式解决」上述问题呢?

    百度EasyDL了解一下。

    简单来说,EasyDL极大降低了深度学习的应用门槛:

    把AI开发这件事情,搞得像使用「家用电器」一样简单。 而且训练产出的AI模型质量,如同高级工程师产出的一样专业。

    但其实,百度早在2017年底便推出了EasyDL,2018年初正式开放,与此同时提出了一个愿景——Everyone can AI。

    那么时隔近三年,这一愿景走到了哪一步呢?

    像用家电一样的AI,能有多靠谱?

    先来整体看下EasyDL所具有的三大特点:

    • 极简的交互和使用流程,最快15分钟即可完成模型训练;
    • 高精度的训练效果,比如图像分类模型的线上平均准确率在99%以上;
    • 部署方式丰富,全面支持云、端、边部署。

    首先是EasyDL的易用性、低门槛。

    使用流程只有简单的四步,分别是「创建模型」、「准备数据」、「训练模型」和「部署应用」。

    并且,在整个过程当中,都是可视化图形操作,这就大大降低了企业、开发人员的使用门槛。

    用百度AI平台研发部技术总监忻舟的话来说就是:

    不用一行代码也可以基于需求和数据,定制自己的AI解决方案。

    在工业制造的生产质检领域,以「爱包花饰」为例,在监测箱包生产过程中的残留异物(针、金属零部件等)时,使用EasyDL训练箱包质检模型,在完全无需了解AI算法细节前提下,也训练出了准确率90%的模型。

    再以「瀚才猎头」为例,几名人力资源专家在不了解AI算法的情况下,使用EasyDL,完成了简历数据的结构化处理和自动分类模型,大大提升了工作人员在简历检索方面的效率。

    但简单,并不意味着会忽略掉专业性。相反,二者是「兼容且并行」。

    依旧是「瀚才猎头」的案例,作为一家高级管理人员代理招募机构,其储备了200万条不同行业的企业和人才信息。

    但一个非常「致命」的问题就是:200万条数据因简历检索的低下,使人才库的利用率不足10%。

    而在使用EasyDL之后训练多个模型推进简历数据的结构化处理,仅在「候选人职能」和「候选人职级」两个模型上的识别率便达到了95%以上。

    而以关键词搜索的任务中,瀚才猎头以往每天只能找到60-70份合适的简历。但现如今,20分钟就可能达到600-1000份,而且精准度达到了95%。

    一言蔽之,百度EasyDL不仅让企业在「定制AI模型」上,使用起来像家用电器一般简单,并且还能像高级AI工程师一样专业。

    除此之外,EasyDL还支持公有云API、私有服务器部署、设备端SDK、软硬一体方案等丰富的模型部署方式。

    例如在软硬一体方案部署上,EasyDL提供了6款软硬一体方案,支持专项适配与加速,覆盖高中低全矩阵,模型识别速度可提升10倍。

    不仅丰富,还非常快——最快仅5分钟即可集成。

    而EasyDL这一切的优异特性,离不开其背后的技术硬实力。

    EasyDL的能力是如何实现的?

    表面上看起来、用起来越是简单的工具、平台,那它背后的设计可能越是复杂。

    百度EasyDL也是如此。

    平台内部采用了诸多复杂的深度学习算法和工程技术,而这一切,都是为了保证其简单、易用、低门槛的使用效果。

    EasyDL之所以能够在模型方面达到高精度,一个重要原因是其基于百度自主研发的深度学习平台飞桨。一站式模型训练和服务体验,则融入了更多百度长期积累的独有技术和工程化能力。

    首先,EasyDL预置了百度超大规模数据训练的预训练模型。

    在视觉任务中,图像分类训练任务内置百度基于海量互联网数据,包括10万+分类、6500万图片等训练的超大规模视觉预训练模型,平均精度可提升3.24%-7.73%。

    在物体检测训练任务方面,内置百度基于800+标签、170万图片,1000万+检测框训练的超大规模物体检测预训练模型,平均精度可提升1.78%-4.53%。

    在自然语言处理方面,EasyDL预置了由百度自研、业界效果最好的预训练模型文心(ERNIE),将机器语义理解水平提升到一个新的高度。

    EasyDL还提供了自动数据增强、自动超参搜索等AutoML/DL自动化建模机制,对零算法基础的用户降低AI使用门槛。

    而且基于飞桨DGC加速机制,通过只传送重要梯度(稀疏更新)的方式来减少通信带宽使用,从而让EasyDL提升了分布式训练效率,相比传统分布式训练方式,有70%以上的训练速度增益。

    其次,在数据处理方面,EasyDL建设了EasyData智能数据服务平台。

    在数据标注和数据清洗,EasyData提供了11种数据标注模板,5种标准、高级的清洗方案。

    EasyData还提供了软硬一体、端云协同的自动数据采集方案,可以在数据采集时,免除繁琐耗时的设备选型、调试和集成开发工作。

    最后,在部署部署方面,EasyDL提供了公有云API、设备端SDK、本地服务器部署、软硬一体部署四种方案。

    其中,公有云API可以支持弹性扩缩容;设备端SDK目前EasyDL提供了端模型适配服务,支持了15+芯片类型,4大常用操作系统

    而这些,正是EasyDL强大能力的背后硬实力。

    Why EasyDL?

    因为有需求,这就是问题的答案。

    人工智能引领的第四次工业革命正不断地渗透到各行各业,大企业往往具备了一定的人才储备、技术积累。

    但相比之下,中小企业在智能转型的过程中,往往处于碰壁的状态,智能化门槛过高,包括高级开发人员成本、技术能力等等。

    而中小企业在整个国民经济的发展过程中,却起着举足轻重的作用。

    因此,解决这样的问题,便成为了一种「刚需」。

    也正是因为这样,EasyDL一经开放,便得到了中小企业的广泛认可和支持。

    而在2年多的时间里,EasyDL也一直在持续升级和打磨,使整体的产品体验和功能更加完善。

    这也是让EasyDL与其它AutoDL平台相比,具有较为突出的优势,能够获得更好的效果。

    不仅如此,EasyDL的更新迭代还在继续。

    例如,今年升级的最大亮点,就是五月份全新发布了EasyData智能数据服务平台。

    专注在AI开发场景在业内开放了提供一站式的数据采集、数据清洗、数据标注、数据回流的完整解决方案。

    内置的超大规模预训练模型也是今年核心的技术亮点升级之一,为提供更高精度的训练效果。

    而就在刚刚过去的9月,我们看到EasyDL又进行了一轮大幅升级。

    在EasyDL经典版NLP方向新增了定制情感倾向分析、文本分类多标签、文本实体抽取;全新推出表格数据预测分析的ML方向,进一步丰富了模型类型。

    数据服务上在已有的智能标注基础上重磅推出多人标注,让数据标注的效率进一步大幅提升。

    全新上线模型市场,支持个人或企业将EasyDL经典版训练好的模型发布至市场进行售卖,并在业内首个创新性支持从市场已购买的模型结合数据进行再训练,实现更佳的模型效果。

    未来,EasyDL还将继续发力:

    • 除了扩展已有的 CV、NLP、ML、语音识别方向算法类型,还将推出OCR、视频追踪等定制化能力。
    • 持续提升模型效果,提高训练速度,加速模型推理。
    • 在数据、模型、服务等各个方面,持续降低使用门槛。

    至此,可以说百度EasyDL离最初的「Everyone can AI」的愿景更加近了一步。

    人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

课课家教育

未登录