Google 开源 TensorFlow:深度学习的基础设施战争打响
// TL;DR
- TensorFlow 用数据流图描述计算,一套代码可跑 CPU/GPU、桌面与移动端。
- Apache 2.0 协议,商用友好,明显冲着开发者生态来的。
- 框架之争的本质是人才与生态之争,Theano/Caffe/Torch 的好日子到头了。
发生了什么
Google 这周把 TensorFlow 开源了——这是他们内部 DistBelief 系统的第二代重写,Jeff Dean 团队出品,Apache 2.0 协议,代码直接放上 GitHub。核心抽象是“计算图”:你用 Python 把运算描述成一张数据流图,框架负责自动求导、调度执行,同一套代码可以跑在 CPU、GPU,甚至手机上。
为什么这步棋值得琢磨
把核心系统开源,Google 图什么?我能想到三层:第一层,招聘——全世界研究者都用你的工具,意味着入职零成本上手;第二层,生态——论文、教程、预训练模型都沉淀在你的框架上,护城河越积越深;第三层,云——今天用 TensorFlow 训练,明天自然买 Google Cloud 的算力。开源框架是免费的,跑框架的算力可不便宜。
对我们普通从业者倒是实打实的利好:之前 Theano 编译慢、Caffe 不灵活、Torch 要写 Lua,现在有一个工业级背书、文档齐全的选项。我已经把手头的实验迁了一个过去,体验只能说尚可——API 有点啰嗦,调试像隔靴搔痒。但生态的力量是滚雪球的,这个雪球 Google 推得动。
框架本身不是壁垒,围绕框架长出来的生态才是。