关于`PaddlePaddle Serving`的一点调研

### TensorFlow serving
首先是调研了一下`TensorFlow Serving`。他的`arch view`文档在[这里](https://github.com/tensorflow/serving/blob/master/tensorflow_serving/g3doc/architecture_overview.md#key-concepts) 或者[这里](https://www.tensorflow.org/serving/architecture_overview)。

除了提供基础的`rpc server`的功能外，亮点在于一下几个`feature`:
- 多版本管理：
   - 可以同时`load`多个版本的`model`，并且客户端可以访问指定的版本。
   - 模型热加载：新版本的`model`发布后，自动加载新版本。
       - 版本管理的policy是可以定制的。默认主要实现的有两种：`Availability  Preserving Policy`和`Resource Preserving Policy`。
```
TensorFlow Serving includes two policies that accommodate most known use- cases. 
These are the Availability Preserving Policy (avoid leaving zero versions loaded; 
typically load a new version before unloading an old one), and the Resource Preserving Policy 
(avoid having two versions loaded simultaneously, thus requiring double the resources; 
unload an old version before loading a new one)
```
- 支持从多种存储上加载模型：
   - 可以扩展支持更多种类的存储。
- `client`端访问的批处理功能：
   - 同样，这个功能也是可以自定义policy。
```
Batching of multiple requests into a single request can significantly reduce the cost 
of performing inference, especially in the presence of hardware accelerators such as GPUs. 
```

根据文档描述，其`Loaders` 是可以扩展的，这样具有了支持非`TensorFlow model`的能力。社区已经有人为`TensorFlow Serving`增加`caffe`模型的支持：https://github.com/tensorflow/serving/pull/261
https://github.com/rayglover-ibm/serving-caffe

### 厂内情况
- 某组基于`TensorFlow Serving`做了一些，不过仅支持`TensorFlow`的模型。
   -  http://wiki.baidu.com/pages/viewpage.action?pageId=253167629
- 多数是拿`baidurpc`做一个简单`Infer Server`。

### 讨论：
我们在大会之前做一个可以和`TensorFlow Serving`对标的`Serving`服务作为亮点，时间有点来不及。
- 在`TensorFlow Serving`的基础上做插件支持`PaddlePaddle`的模型？
- 做一个简单的C++版本`Infer Server`（如HttpServer)？

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

关于`PaddlePaddle Serving`的一点调研 #394

TensorFlow serving

厂内情况

讨论：

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

关于PaddlePaddle Serving的一点调研 #394

Description

TensorFlow serving

厂内情况

讨论：

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions

关于`PaddlePaddle Serving`的一点调研 #394