再次启程,Google这个19岁的互联网巨人之前有过两次远征(创立搜索引擎、打造Android进军移动设备市场)。3天前,它用一次GoogleCloud大会宣告了自己的新征程目标——人工智能引领者。
Google又开始远征了
1996年拉里·佩奇和谢尔盖·布林用一套全新的关键词搜索网站排布算法PageRank开始了Google的第一次征程,最终打造出了当今世界最重要的搜索引擎。而在那之后,拥有流量入口的Google开始不断拓展自己的产品,从邮箱到浏览器再到后来的Google Drive,让人们能够尽可能在互联网上享受尽可能多的服务是其中的核心思想。
另外一次则是2007年Android的发布。在苹果发布第一代iPhone之后,Google也拿出了自己移动设备操作系统。这也才造就了目前手机、移动设备市场中苹果、Google两大巨头划江分治。
严格来说,这一次远征或许并不能算从上周开始。但当“人工智能大众化”从李飞飞口中说出时,Google已经不再是那个还在继续寻找方向的硅谷巨人。不仅前行目标已经确定,而且已经迈出了好几步。
恰如前两次远征,这次远征背后也将会是一个人类发展的新世纪。
大众化的人工智能,Google未来的核心
去年11月,李飞飞加入谷歌曾引起业内极大关注。这位华裔女性科学家同时还是斯坦福大学计算机系终身教授,全球人工智能领域最具影响力的科学家之一。
此次GoogleCloud大会上,她反复强调的那句“Google正在让人工智能变得触手可及,云将会是我们的实现方式”,揭示了Google下一阶段的发展重点:Google会从人工智能技术最前沿研究者、技术提供者的角色,逐渐转变为人工智能技术、产品的最主要推动者。
而她所提到的实现“人工智能大众化”四大举措同样值得关注:计算力、算法、数据以及人才。更关键的是,这四个举措并不是空谈,Google同时还发布了自己的成果。
1、计算力
在这次大会上,Google发布了全新的云机器学习引擎Cloud ML Engine,开发者依旧能够通过TensorFlow进行开发,但同时还可以对接到Google搭建在云端的硬件资源。同时,它还整合了Google Cloud平台的完整数据分析产品线,包括Cloud Dataflow、Cloud Datalab和Google BigQuery等。
通过Cloud Datalab这款交互式数据科学工作流工具,开发者和数据科学家还能更容易地在BigQuery、Cloud Storage和本地存储中探索、分析和可视化数据。就机器学习的发展而言,他们可以采取全生命周期的方法:在本地存储的较小数据集上建立模型原型,然后使用完整的数据集在云端进行训练。
另外一方面,Google也在积极和一些公司合作,让这套引擎能够解决更多实际问题。比如最近利用该服务为终端客户提供实时分析的SpringML,识别和阻止zero-day攻击的SparkCognition。
2、算法
算法上的更新则更接近具体产品端,两款API:Vison API和Video Intelligence API,分别针对图片和图像应用。
Vision API目前还处于研发状态,但是已经有两个非常重要的特点:它下一步将学习谷歌图片中数以百万计的数据,同时它也会增强自身在文字识别方面的能力。
而Video Intelligence API则是首款能够让开发者轻松搜索和发现视频内容的API,开发者可通过在视频内容中提供有关实体(例如狗、花、人等名词,以及跑、游泳、飞行等动词)的信息完成搜索。
当这些实体出现时,这款API甚至可以提供语境理解。例如,搜索“老虎”将会找出所有存储在Google Cloud视频集中所有包括老虎的精准镜头。这对于Google旗下的Youtube一类的视频网站有着非常重要的意义。
3、数据、人才
收购Kaggle社区则是数据、人才层面的大事件。前者不仅聚集了超过85万数据科学家,并拥有众多开源数据集。因为开源的数据是人工智能开发过程中一个“隐形的障碍”,而只有当数据本身“大众化”,人工智能从业者才能推进自身的人工智能研究。
通过收购,Google就能链接到数量巨大的数据,并且直接与在数据中找寻规律的人才进行交流。当然Google也打算为这个庞大的社区提供他们所需要的机器学习环境,促成他们市场化的机会。
最后是Advanced Solutions Lab,、Google的高级解决方案实验室(Advanced Solution Lab)向客户提供专用设施,让客户能够同Google的机器学习专家直接合作,从而帮助客户通过机器学习完成最紧迫的挑战。
这些举动不仅是组合拳,更是一套完整的打法。因为对于人工智能来说,计算力、算法、数据、人才缺一不可。
通过Cloud ML Engine,用户可以使用更多计算力;通过API,实际应用产品会更加快出现;通过收购Kaggle、高级方案解决计划,同时获得了宝贵的数据和数据人才。如此“富饶”的土壤,怎么可能长不出新成果?
▲华裔女教授李飞飞首次亮相谷歌大会:要让人工智能更“大众”
TensorFlow的开源
TensorFlow的开源是本届大会的另外一个重头戏。
为什么会选择开源?TensorFlow项目负责人Jeff Dean表示:Google希望构建一个共享研究的公共平台,并且机器学习惠及每一个人。
这一目标最好的证明是,TensorFlow已经成为了GitHub上最受欢迎的机器学习项目,项目点赞数超过4.9万。更有多达568位开发者为TensorFlow贡献自己的力量,这实际上也是TensorFlow能高速成长的关键所在。
从2015年底的最初开源到1.0版本的发布,TensorFlow已经进行了数次大大小小的修改与性能添加。同时,TensorFlow也回馈到了Google很多自家产品当中,比如Gmail、YouTube、谷歌翻译、搜索等等。
▲各个开源框架在GitHub上的数据统计
实际上,开源同样体现在Google的方方面面。2016年,Google内部员工在GitHub上commit过的开源项目超过了28万个,贡献的项目超过1.5万个,贡献出的超过10个Events的项目有2500个。
TensorFlow另一负责人Rigat Monga的分享同样值得思考:对任何开源项目而言最重要的就是社区,Google有着强大的开源社区,意味着他们在大数据、人工智能、深度学习等领域所拥有的知识储备正实现进一步增长。
Monga还谈到,除了谷歌自家产品,更多企业和机构也在积极对接TensorFlow,其中包括DeepMind、英特尔、Twitter以及中国的小米和京东等等。
针对谷歌云的开放情况如何,Google Cloud产品开发、计算&开发者服务副总裁Sam Ramji表示,“开放研发是我们如今都在迈向的一种模式,它包括开放API、开放资源、开放云。开放云意味着要接受开源并回馈开源、开放权限(没有进入或退出的障碍)以及开放生态系统。
总结:Google的第三次远征,互联网的新世纪?
回顾Google自身19年的发展史,这次的GoogleCloud应该被视为第3次远征的序幕。与之对应的前2次分别是:
- 1998年:搜索引擎成为今日互联网巨头的起点,在占据流量入口之后,Google陆续发布一系列附带的Web服务产品如Gmail、Reader等。
- 2007年:Google发布Android系统,在落后苹果XX年的情况下开始重新向移动设备市场进军。
2015年Google的整体重组则可以视为第2、3次远征之间的分水岭。全新的母公司Alphabet、光纤、无人驾驶等一批业务地位直接提升,也直接表明了Google的态度:传统业务的确赚钱,但是我们需要寻找到下一个增长点。
而实际上,这样的尝试在Google内部从未停止。2011年Google通过相对简单代码实现图片识别十万种物品的实验。这也是很多业内人士眼中,造就当下人工智能浪潮复苏的关键节点。
经过几年实验性的摸索之后,Google最终在去年确定了自己即将走上的路——人工智能。这一点实际上在2016年的GoogleCloud大会上已经有所提及,只不过当时或许并没有人在意。
但就在2016年,Google却用自己的努力刷新了人类对人工智能的认知,比如引起了巨大轰动的围棋人工智能AlphaGo。Google打造并且开源的TensorFlow也已经成为了人工智能领域最重要的基础平台之一。
究竟Google能凭借着人工智能这驾马车前行多远?答案没人。但可以确认的是,Google已经成为这个领域最领先的人,而它所发起的自身第三次远征,瞄准的并不是单一的市场或者价值,而是一个全新的实际。
巨人很可怕,一个跑得比你快的巨人更可怕。
¥399.00
¥699.00
¥299.00
¥399.00