10月25日,年乌镇世界互联网大会宣布了最新的15项“世界互联网领先科技成果”,其中,旷视科技的Brain++就位列其中。
一家主打人工智能的年轻公司他们在做什么,对于大众而言本身是比较陌生的。我们不妨从旷视这项被认为是世界互联网领先的Brain++技术入手,来了解其背后的业务和运营。
从旷视官方给出的说明来看,Brain++是一项从旷视年成立之初就开始研发的深度学习框架,目前仅限于内部使用,并未对外开放。
据介绍,Brain++能为研发人员提供一站式AI工程解决方案。具体包括:从数据生成、清洗、预处理、标注、存储,到研究人员设计算法架构、设计实验环节、搭建训练环境、训练、加速、调参、模型效果评估和产生模型,再到模型分发和部署应用,最后再到不同端如云端、边缘端、移动端上的部署。
旷视本质上是一家以人工智能算法为核心的技术型产品公司。借助Brain++,旷视的研发人员能够减少重复开发,高效的将人工智能技术应用于更广泛的业务场景。
深度学习框架之一
人工智能算法从研发到部署是一套庞大的系统工程,深度学习框架作为通用性的底层支持平台,可实现算法训练和模型部署的高效流程化和深度神经网络模型设计自动化。在减少人员参与而不牺牲训练质量的条件下,大幅提高算法生产效率。
深度学习框架可以理解为一种AI时代的“操作系统”,能为算法训练、模型改进提供支持,之于人工智能技术及应用研发人员的重要性不言而喻。
和PC拥有多个操作系统流派一样,深度学习框架在全球也有不少“种类”。
比如早先一代曾经使用非常广泛的著名框架Caffe,这是一款加州大学伯克利分校的学生开发出来的深度学习框架。
还有诞生于蒙特利尔大学LISA实验室的Theano,于年开始开发,一度也是非常有影响力的Python深度学习框架,不过遗憾的是Thean已经停止继续开发了。
目前流行的深度学习框架转向以计算图(ComputationGraph)为核心的设计方向。
包括年11月10日Google推出全新的机器学习开源工具TensorFlow。这款产品已经成为目前最流行的深度学习框架。
年11月,被AWS选为云计算官方深度学习平台的MXNet。这款深度学习框架在年进入Apache基金会,成为旗下孵化器项目。
年1月,Facebook人工智能研究院(FAIR)团队在GitHub上开源了深度学习框架PyTorch;
还有,国内百度公司推出的PaddlePaddle(飞桨)深度学习框架,它也是世界互联网领先科技成果之一。
(主流的开源深度学习框架和旷视自有的Brain++)
在没有深度学习框架支持、或者深度学习框架不足够智能的情况下,开发者甚至需要手动敲出C++代码来完成计算过程,训练一个AI模型至少需要一两个月。
有了深度学习框架,程序员不需要从复杂的神经网络开始编代码,直接依据需要,使用已有的模型进行参数训练,可以大幅提高算法生产效率。
深度学习框架广受开发者依赖,各大厂们也超级重视推广自家深度学习框架,以期抢占人工智能时代操作系统高地、打造类似手机时代的安卓式辉煌。
值得注意的是,上述这几款深度学习框架都是开源的。目前国内大多AI技术的产品应用开发人员都采用的是:选择一种大厂推出的开源深度学习框架,在此基础上进行开发这种模式。
当然也有例外的,不用开源框架的,自己写框架的。
Brain++就是旷视始于年就开始开发的深度学习框架,不是开源框架,仅限于旷视内部使用。在旷视,上千名研发人员全部都在使用Brain++进行技术研发。
(图片来自旷视