怎么使用TFserving

作者：芬妮199025 | 来源：互联网 | 2023-05-19 04:56

这篇文章主要讲解了“怎么使用TFserving”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“怎么使用TF

这篇文章主要讲解了“怎么使用TFserving”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“怎么使用TFserving”吧！

1.什么是TFserving

当你训好你的模型，需要提供给外部使用的时候，你就需要把模型部署到线上，并提供合适的接口给外部调用。你可能会考虑一些问题：

用什么来部署
怎么提供api接口
多个模型GPU资源如何分配
线上模型如何更新而服务不中断

目前流行的深度学习框架Tensorflow和Pytorch， Pytorch官方并没有提供合适的线上部署方案；Tensorflow则提供了TFserving方案来部署线上模型推理。另外，Model Server for Apache MXNet 为MXNet模型提供推理服务。

本文为TFServing的使用指南。如果你是pytorch或者MXNet模型，也可以通过ONNX转成TFserving的模型，部署在TFServing上。

那什么是TFserving?

TFserving是Google 2017推出的线上推理服务；采用C/S架构，客户端可通过gRPC和RESTfull API与模型服务进行通信。

怎么使用TFserving

TFServing的特点：

支持模型版本控制和回滚：Manager会进行模型的版本的管理
支持并发，实现高吞吐量
开箱即用，并且可定制化
支持多模型服务
支持批处理
支持热更新：Source加载本地模型，通知Manager有新的模型需要加载，Manager检查模型的版本，通知Source创建的Loader进行加载模型
支持分布式模型

2.TFserving安装

强烈建议采用docker方式安装TFserving，安装依赖docker和nvidia-docker（TFserving的gpu需要）

docker 安装

#安装yum-utils工具和device-mapper相关依赖包  yum install -y yum-utils \  device-mapper-persistent-data \  lvm2  #添加docker-ce stable版本的仓库  yum-config-manager \  --add-repo \  https://download.docker.com/linux/centos/docker-ce.repo  #更新yum缓存文件  yum makecache fast  #查看所有可安装的docker-ce版本  yum list docker-ce --showduplicates | sort -r  # 安装docker-ce  yum install docker-ce-17.12.1.ce-1.el7.centos  #允许开机启动docker-ce服务  systemctl enable docker.service  #启动Docker-ce服务  systemctl start docker  #运行测试容器hello-world  docker run --rm hello-world

nvidia-docker 安装

# 安装nvidia-docker2  yum install -y nvidia-docker2-2.0.3-1.docker17.12.1.ce  # 重启docker服务  service docker restart

安装TFserving

docker pull tensorflow/serving:latest-gpu  # 可以选择其他版本如 docker pull tensorflow/serving:1.14.0-rc0-gpu

注意：docker版本和nvidia-docker要匹配

目前最新的nvidia-docker需要Docker为19.03 可参考官方https://github.com/NVIDIA/nvidia-docker
nvidia-docker2 支持Docker版本低于19.03的其他版本（需>=1.12），现有服务器有18.09,1.17,1.13 https://github.com/NVIDIA/nvidia-docker/wiki/Installation-(version-2.0)

3.TFserving使用说明

3.1 模型转换

TFserving的模型需要转换成TFserving的格式，不支持通常的checkpoint和pb格式。

TFserving的模型包含一个.pb文件和variables目录（可以为空）,导出格式如下：.

├── 1  │   ├── saved_model.pb  │   └── variables  ├── 2  │   ├── saved_model.pb  │   └── variables

不同的深度学习框架的转换路径：

(1) pytorch(.pth)--> onnx(.onnx)--> tensorflow(.pb) --> TFserving  (2) keras(.h6)--> tensorflow(.pb) --> TFserving  (3) tensorflow(.pb) --> TFserving

这里详细介绍下pb转换成TFserving模型

import tensorflow as tf  def create_graph(pb_file):      """Creates a graph from saved GraphDef file and returns a saver."""      # Creates graph from saved graph_def.pb.      with tf.gfile.FastGFile(pb_file, &＃39;rb&＃39;) as f:          graph_def = tf.GraphDef()          graph_def.ParseFromString(f.read())          _ = tf.import_graph_def(graph_def, name=&＃39;&＃39;)  def pb_to_tfserving(pb_file, export_path, pb_io_name=[], input_node_name=&＃39;input&＃39;, output_node_name=&＃39;output&＃39;, signature_name=&＃39;default_tfserving&＃39;):      # pb_io_name 为 pb模型输入和输出的节点名称，      # input_node_name为转化后输入名      # output_node_name为转化后输出名      # signature_name 为签名      create_graph(pb_file)      # tensor_name_list = [tensor.name for tensor in tf.get_default_graph().as_graph_def().node]      input_name = &＃39;%s:0&＃39; % pb_io_name[0]      output_name = &＃39;%s:0&＃39; % pb_io_name[1]      with tf.Session() as sess:          in_tensor = sess.graph.get_tensor_by_name(input_name)          out_tensor = sess.graph.get_tensor_by_name(output_name)          builder = tf.saved_model.builder.SavedModelBuilder(export_path)  ## export_path导出路径          inputs = {input_node_name: tf.saved_model.utils.build_tensor_info(in_tensor)}            outputs = {output_node_name: tf.saved_model.utils.build_tensor_info(out_tensor)}          signature = tf.saved_model.signature_def_utils.build_signature_def(              inputs, outputs, method_name=tf.saved_model.signature_constants.PREDICT_METHOD_NAME)          builder.add_meta_graph_and_variables(              sesssess=sess, tags=[tf.saved_model.tag_constants.SERVING],              signature_def_map={signature_name: signature}, clear_devices=True)  ## signature_name为签名，可自定义          builder.save()  pb_model_path = &＃39;test.pb&＃39;  pb_to_tfserving(pb_model_path, &＃39;./1&＃39;, pb_io_name=[&＃39;input_1_1&＃39;,&＃39;output_1&＃39;],signature_name=&＃39;your_model&＃39;)

3.2 TFserving配置和启动

模型导出后，同一个模型可以导出不同的版本（版本后数字），可以TFserving配置中指定模型和指定版本。TFserving的模型是通过模型名称和签名来唯一定位。TFserving 可以配置多个模型，充分利用GPU资源。

模型配置

# models.config  model_config_list {    config {      name: &＃39;your_model&＃39;      base_path: &＃39;/models/your_model/&＃39;      model_platform: &＃39;tensorflow&＃39;  #     model_version_policy {  #       specific {  #         versions: 42  #         versions: 43  #       }  #     }  #     version_labels {  #       key: &＃39;stable&＃39;  #       value: 43  #     }  #     version_labels {  #       key: &＃39;canary&＃39;  #       value: 43  #     }    }    config {      name: "mnist",      base_path: "/models/mnist",      model_platform: "tensorflow",      model_version_policy: {         specific: {          versions: 1,          versions: 2         }    }  }  # 可以通过model_version_policy 进行版本的控制

启动服务

# 建议把模型和配置文件放在docker外的本地路径，如/home/tfserving/models， 通过-v 挂载到docker内部  # --model_config_file： 指定模型配置文件  # -e NVIDIA_VISIBLE_DEVICES=0： 指定GPU  # -p 指定端口映射 8500为gRpc 8501为restful api端口  # -t 为docker镜像  nvidia-docker run  -it --privileged  -d -e NVIDIA_VISIBLE_DEVICES=0  -v /home/tfserving/models:/models  -p 8500:8500 -p 8501:8501 \   -t tensorflow/serving:latest-gpu \  --model_config_file=/models/models.config  # /home/tfserving/models 结构  ├── models.config  └── your_model      ├── 1      │   ├── saved_model.pb      │   └── variables      └── 2          ├── saved_model.pb          └── variables  # test  curl http://192.168.0.3:8501/v1/models/your_model  {      "model_version_status": [          {              "version": "2",              "state": "AVAILABLE",              "status": {              "error_code": "OK",              "error_message": ""              }          }      ]        }  # 其他启动方式  # 如果多个模型在不同的目录，可以通过-mount 单独加载  nvidia-docker run  -it --privileged  -d -e NVIDIA_VISIBLE_DEVICES=0 \  --mount type=bind,source=/home/tfserving/models/your_model,target=/models/your_model \  --mount type=bind,source=/home/tfserving/models/your_model/models.config,target=/models/models.config \  -p 8510:8500 -p 8501:8501 \  -t tensorflow/serving:latest-gpu \  --model_config_file=/models/models.config

3.3 TFserving服务调用

客户端可以通过gRpc和http方式调用TFserving服务模型，支持多种客户端语言，这里提供python的调用方式; 调用都是通过模型名称和签名来唯一对应一个模型

gRpc调用, gRpc的端口是8500

#  # -*-coding:utf-8 -*-  import tensorflow as tf  from tensorflow_serving.apis import predict_pb2  from tensorflow_serving.apis import prediction_service_pb2_grpc  import grpc  import time  import numpy as np  import cv2 class YourModel(object):      def __init__(self, socket):          """         Args:              socket: host and port of the tfserving, like 192.168.0.3:8500          """          self.socket = socket          start = time.time()          self.request, selfself.stub = self.__get_request()          end = time.time()          print(&＃39;initialize cost time: &＃39; + str(end - start) + &＃39; s&＃39;)      def __get_request(self):          channel = grpc.insecure_channel(self.socket, optiOns=[(&＃39;grpc.max_send_message_length&＃39;, 1024 * 1024 * 1024),                                                                (&＃39;grpc.max_receive_message_length&＃39;, 1024 * 1024 * 1024)]) # 可设置大小          stub = prediction_service_pb2_grpc.PredictionServiceStub(channel)          request = predict_pb2.PredictRequest()          request.model_spec.name = "your_model"  # model name          request.model_spec.signature_name = "your_model"  # model signature name          return request, stub      def run(self, image):          """          Args:              image: the input image（rgb format）          Returns: embedding is output of model          """          img = image[..., ::-1]           self.request.inputs[&＃39;input&＃39;].CopyFrom(tf.contrib.util.make_tensor_proto(img))  # images is input of model          result = self.stub.Predict(self.request, 30.0)          return tf.make_ndarray(result.outputs[&＃39;output&＃39;])      def run_file(self, image_file):          """          Args:              image_file: the input image file          Returns:          """          image = cv2.imread(image_file)          image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)          return self.run(image)  if __name__ == &＃39;__main__&＃39;:      model = YourModel(&＃39;192.168.0.3:8500&＃39;)      test_file = &＃39;./test.jpg&＃39;      result = model.run_file(test_file)      print(result)      # [8.014745e-05 9.999199e-01]

restful api调用: restful端口是8501

import cv2  import requests  class SelfEncoder(json.JSONEncoder):      def default(self, obj):          if isinstance(obj, np.ndarray):              return obj.tolist()          elif isinstance(obj, np.floating):              return float(obj)          elif isinstance(obj, bytes):              return str(obj, encoding=&＃39;utf-8&＃39;);          return json.JSONEncoder.default(self, obj)  image_file = &＃39;/home/tfserving/test.jpg&＃39;  image = cv2.imread(image_file)  image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)  img = image[..., ::-1]  input_data = {      "signature_name": "your_model",      "instances": img  }  data = json.dumps(input_data, cls=SelfEncoder, indent=None)  result = requests.post("http://192.168.0.3:8501/v1/models/your_model:predict", datadata=data)  eval(result .content)  # {&＃39;predictions&＃39;: [8.01474525e-05, 0.999919891]}

感谢各位的阅读，以上就是“怎么使用TFserving”的内容了，经过本文的学习后，相信大家对怎么使用TFserving这一问题有了更深刻的体会，具体使用情况还需要大家实践验证。这里是编程笔记，小编将为大家推送更多相关知识点的文章，欢迎关注！

推荐阅读

perl
区块链Hyperledger Composer 环境安装一（整理版）

HyperledgerComposer环境安装1.安装基本软件包**如果使用Linux安装HyperledgerComposer，请注意以下建议：以 ... [详细]

蜡笔小新 2023-10-15 18:47:29
controller
Kubernetes（k8s）基础简介

Kubernetes（k8s）基础简介目录一、Kubernetes概述（一）、Kubernetes是什么（二& ... [详细]

蜡笔小新 2023-10-16 11:29:40
controller
Docker 快速入门指引

本文最早发表于本人博客:Docker快速入门指引Docker是什么？Docker是Docker.Inc公司开源的一个基于LXC技术之上构建的Container容器引擎，基于Go语言 ... [详细]

蜡笔小新 2023-10-12 20:49:33
web
Skywalking系列博客1安装单机版 Skywalking的快速安装方法

本文介绍了如何快速安装单机版的Skywalking，包括下载、环境需求和端口检查等步骤。同时提供了百度盘下载地址和查询端口是否被占用的命令。 ... [详细]

蜡笔小新 2023-12-14 19:05:47
web
如何在服务器主机上实现文件共享的方法和工具

本文介绍了在服务器主机上实现文件共享的方法和工具，包括Linux主机和Windows主机的文件传输方式，Web运维和FTP/SFTP客户端运维两种方式，以及使用WinSCP工具将文件上传至Linux云服务器的操作方法。此外，还介绍了在迁移过程中需要安装迁移Agent并输入目的端服务器所在华为云的AK/SK，以及主机迁移服务会收集的源端服务器信息。 ... [详细]

蜡笔小新 2023-12-13 13:23:48
web
如何在Windows环境下配置php+apache环境

本文介绍了在Windows环境下如何配置php+apache环境，包括下载php7和apache2.4、安装vc2015运行时环境、启动php7和apache2.4等步骤。希望对需要搭建php7环境的读者有一定的参考价值。摘要长度为169字。 ... [详细]

蜡笔小新 2023-12-13 10:39:24
instance
网络请求模块选择——axios框架的基本使用和封装

本文介绍了选择网络请求模块axios的原因，以及axios框架的基本使用和封装方法。包括发送并发请求的演示，全局配置的设置，创建axios实例的方法，拦截器的使用，以及如何封装和请求响应劫持等内容。 ... [详细]

蜡笔小新 2023-12-12 10:16:43
web
ElasticSerach初探第一篇认识ES+环境搭建+简单MySQL数据同步+SpringBoot整合ES

一、认识ElasticSearch是一个基于Lucene的开源搜索引擎，通过简单的RESTfulAPI来隐藏Lucene的复杂性。全文搜索，分析系统&# ... [详细]

蜡笔小新 2023-12-09 10:36:06
instance
微服务应用性能分析实战15 数据磐石：APM 收集端的存储模型

分布式监控的重要设计就是数据存储模型，而SkyWalking的分布式追踪数据模型就是一个经典代表，这也是它会在APM领域脱颖而出的原因。所以今天我就以 ... [详细]

蜡笔小新 2023-10-14 15:45:54
web
restful 笔记01

博客分类：restful笔记如何保持可见性?(a)使用HTTP方法(例如GET,POST,PUT)时,其语义要与HTTP所规定的语义保持一致,并添加适当的标头来描述请 ... [详细]

蜡笔小新 2023-10-13 08:46:47
web
七、使用 Angular 命令行界面的渐进式网络应用

七、使用Angular命令行界面的渐进式网络应用正如我们在第3章中提到的理解A ... [详细]

蜡笔小新 2023-10-12 20:08:35
sum
从dubbo源码分析qosserver端口冲突问题

在这分布式系统架构盛行的时代，很多互联网大佬公司开源出自己的分布式RPC系统框架，例如：阿里的dubbo，谷歌的gRPC，apache的Thrift。而在我们公司一直都在推荐使用d ... [详细]

蜡笔小新 2023-10-12 18:20:25
web
分布式服务框架和原理简章

应用架构演进这里的架构演进应该是从服务化的角度来说，应该说随着业务发展，应用规模扩大，系统的一些公共服务就会抽取出来，独立开发，部署，维护，用来解决并发，扩展，维护的问题。传统垂直 ... [详细]

蜡笔小新 2023-10-11 20:53:44
web
ASP.NET CORE 简介

ASP.NETCore是一个跨平台的高性能开源框架，用于生成启用云且连接Internet的新式应用。使用ASP.NETCore，您可以：生成Web ... [详细]

蜡笔小新 2023-10-11 18:03:05
web
ETCD介绍—etcd概念及原理方面分析

etcd作为一个受到ZooKeeper与doozer启发而催生的项目，除了拥有与之类似的功能外，更专注于以下四点。简单：基于HTTPJS ... [详细]

蜡笔小新 2023-10-11 15:15:53

芬妮199025

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章