aws
diff --git a/‎setup.py
Lines changed: 1 addition & 0 deletions b/‎setup.py
Lines changed: 1 addition & 0 deletions
diff --git a/‎src/sagemaker_pytorch_serving_container/default_inference_handler.py renamed to ‎src/sagemaker_pytorch_serving_container/default_pytorch_inference_handler.py b/‎src/sagemaker_pytorch_serving_container/default_inference_handler.py renamed to ‎src/sagemaker_pytorch_serving_container/default_pytorch_inference_handler.py
diff --git a/‎src/sagemaker_pytorch_serving_container/etc/default-ts.properties
Lines changed: 4 additions & 0 deletions b/‎src/sagemaker_pytorch_serving_container/etc/default-ts.properties
Lines changed: 4 additions & 0 deletions
diff --git a/‎src/sagemaker_pytorch_serving_container/etc/log4j.properties
Lines changed: 50 additions & 0 deletions b/‎src/sagemaker_pytorch_serving_container/etc/log4j.properties
Lines changed: 50 additions & 0 deletions
diff --git a/‎src/sagemaker_pytorch_serving_container/handler_service.py
Lines changed: 1 addition & 2 deletions b/‎src/sagemaker_pytorch_serving_container/handler_service.py
Lines changed: 1 addition & 2 deletions
diff --git a/‎src/sagemaker_pytorch_serving_container/serving.py
Lines changed: 4 additions & 5 deletions b/‎src/sagemaker_pytorch_serving_container/serving.py
Lines changed: 4 additions & 5 deletions
diff --git a/‎src/sagemaker_pytorch_serving_container/torchserve.py
Lines changed: 215 additions & 0 deletions b/‎src/sagemaker_pytorch_serving_container/torchserve.py
Lines changed: 215 additions & 0 deletions
diff --git a/‎test/unit/test_default_inference_handler.py
Lines changed: 3 additions & 33 deletions b/‎test/unit/test_default_inference_handler.py
Lines changed: 3 additions & 33 deletions
@@ -31,6 +31,7 @@ def read(fname):
 
     packages=find_packages(where='src', exclude=('test',)),
     package_dir={'': 'src'},
+    package_data={'': ["etc/*"]},
     py_modules=[splitext(basename(path))[0] for path in glob('src/*.py')],
 
     long_description=read('README.rst'),
 
@@ -0,0 +1,4 @@
+# Based on: https://github.com/awslabs/mxnet-model-server/blob/master/docs/configuration.md
+enable_envvars_config=true
+decode_input_request=false
+load_models=ALL
@@ -0,0 +1,50 @@
+log4j.rootLogger = INFO, console
+
+log4j.appender.console = org.apache.log4j.ConsoleAppender
+log4j.appender.console.Target = System.out
+log4j.appender.console.layout = org.apache.log4j.PatternLayout
+log4j.appender.console.layout.ConversionPattern = %d{ISO8601} [%-5p] %t %c - %m%n
+
+log4j.appender.access_log = org.apache.log4j.RollingFileAppender
+log4j.appender.access_log.File = ${LOG_LOCATION}/access_log.log
+log4j.appender.access_log.MaxFileSize = 10MB
+log4j.appender.access_log.MaxBackupIndex = 5
+log4j.appender.access_log.layout = org.apache.log4j.PatternLayout
+log4j.appender.access_log.layout.ConversionPattern = %d{ISO8601} - %m%n
+
+log4j.appender.ts_log = org.apache.log4j.RollingFileAppender
+log4j.appender.ts_log.File = ${LOG_LOCATION}/ts_log.log
+log4j.appender.ts_log.MaxFileSize = 10MB
+log4j.appender.ts_log.MaxBackupIndex = 5
+log4j.appender.ts_log.layout = org.apache.log4j.PatternLayout
+log4j.appender.ts_log.layout.ConversionPattern = %d{ISO8601} [%-5p] %t %c - %m%n
+
+log4j.appender.ts_metrics = org.apache.log4j.RollingFileAppender
+log4j.appender.ts_metrics.File = ${METRICS_LOCATION}/ts_metrics.log
+log4j.appender.ts_metrics.MaxFileSize = 10MB
+log4j.appender.ts_metrics.MaxBackupIndex = 5
+log4j.appender.ts_metrics.layout = org.apache.log4j.PatternLayout
+log4j.appender.ts_metrics.layout.ConversionPattern = %d{ISO8601} - %m%n
+
+log4j.appender.model_log = org.apache.log4j.RollingFileAppender
+log4j.appender.model_log.File = ${LOG_LOCATION}/model_log.log
+log4j.appender.model_log.MaxFileSize = 10MB
+log4j.appender.model_log.MaxBackupIndex = 5
+log4j.appender.model_log.layout = org.apache.log4j.PatternLayout
+log4j.appender.model_log.layout.ConversionPattern = %d{ISO8601} [%-5p] %c - %m%n
+
+log4j.appender.model_metrics = org.apache.log4j.RollingFileAppender
+log4j.appender.model_metrics.File = ${METRICS_LOCATION}/model_metrics.log
+log4j.appender.model_metrics.MaxFileSize = 10MB
+log4j.appender.model_metrics.MaxBackupIndex = 5
+log4j.appender.model_metrics.layout = org.apache.log4j.PatternLayout
+log4j.appender.model_metrics.layout.ConversionPattern = %d{ISO8601} - %m%n
+
+log4j.logger.com.amazonaws.ml.ts = INFO, ts_log
+log4j.logger.ACCESS_LOG = INFO, access_log
+log4j.logger.TS_METRICS = INFO, ts_metrics
+log4j.logger.MODEL_METRICS = INFO, model_metrics
+log4j.logger.MODEL_LOG = INFO, model_log
+
+log4j.logger.org.apache = OFF
+log4j.logger.io.netty = ERROR
@@ -14,8 +14,7 @@
 
 from sagemaker_inference.default_handler_service import DefaultHandlerService
 from sagemaker_inference.transformer import Transformer
-from sagemaker_pytorch_serving_container.default_inference_handler import \
-    DefaultPytorchInferenceHandler
+from sagemaker_pytorch_serving_container.default_pytorch_inference_handler import DefaultPytorchInferenceHandler
 
 import os
 import sys
 
@@ -15,8 +15,7 @@
 from subprocess import CalledProcessError
 
 from retrying import retry
-from sagemaker_inference import torchserve
-
+from sagemaker_pytorch_serving_container import torchserve
 from sagemaker_pytorch_serving_container import handler_service
 
 HANDLER_SERVICE = handler_service.__file__
@@ -28,12 +27,12 @@ def _retry_if_error(exception):
 
 @retry(stop_max_delay=1000 * 30,
        retry_on_exception=_retry_if_error)
-def _start_model_server():
+def _start_torchserve():
     # there's a race condition that causes the model server command to
     # sometimes fail with 'bad address'. more investigation needed
     # retry starting mms until it's ready
-    torchserve.start_model_server(handler_service=HANDLER_SERVICE)
+    torchserve.start_torchserve(handler_service=HANDLER_SERVICE)
 
 
 def main():
-    _start_model_server()
+    _start_torchserve()
@@ -0,0 +1,215 @@
+# Copyright 2019-2020 Amazon.com, Inc. or its affiliates. All Rights Reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License"). You
+# may not use this file except in compliance with the License. A copy of
+# the License is located at
+#
+#     http://aws.amazon.com/apache2.0/
+#
+# or in the "license" file accompanying this file. This file is
+# distributed on an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF
+# ANY KIND, either express or implied. See the License for the specific
+# language governing permissions and limitations under the License.
+"""This module contains functionality to configure and start the
+multi-model server."""
+from __future__ import absolute_import
+
+import os
+import signal
+import subprocess
+import sys
+
+import pkg_resources
+import psutil
+from retrying import retry
+
+import sagemaker_pytorch_serving_container
+from sagemaker_inference import default_handler_service, environment, logging, utils
+from sagemaker_inference.environment import code_dir
+
+logger = logging.get_logger()
+
+TS_CONFIG_FILE = os.path.join("/etc", "sagemaker-ts.properties")
+DEFAULT_HANDLER_SERVICE = default_handler_service.__name__
+DEFAULT_TS_CONFIG_FILE = pkg_resources.resource_filename(
+    sagemaker_pytorch_serving_container.__name__, "/etc/default-ts.properties"
+)
+MME_TS_CONFIG_FILE = pkg_resources.resource_filename(
+    sagemaker_pytorch_serving_container.__name__, "/etc/mme-ts.properties"
+)
+DEFAULT_TS_LOG_FILE = pkg_resources.resource_filename(
+    sagemaker_pytorch_serving_container.__name__, "/etc/log4j.properties"
+)
+DEFAULT_TS_MODEL_DIRECTORY = os.path.join(os.getcwd(), ".sagemaker/ts/models")
+DEFAULT_TS_MODEL_NAME = "model"
+DEFAULT_TS_MODEL_SERIALIZED_FILE = "model.pth"
+DEFAULT_HANDLER_SERVICE = "sagemaker_pytorch_serving_container.handler_service"
+
+ENABLE_MULTI_MODEL = os.getenv("SAGEMAKER_MULTI_MODEL", "false") == "true"
+MODEL_STORE = "/" if ENABLE_MULTI_MODEL else DEFAULT_TS_MODEL_DIRECTORY
+
+PYTHON_PATH_ENV = "PYTHONPATH"
+REQUIREMENTS_PATH = os.path.join(code_dir, "requirements.txt")
+TS_NAMESPACE = "org.pytorch.serve.ModelServer"
+
+
+def start_torchserve(handler_service=DEFAULT_HANDLER_SERVICE):
+    """Configure and start the model server.
+
+    Args:
+        handler_service (str): python path pointing to a module that defines
+            a class with the following:
+
+                - A ``handle`` method, which is invoked for all incoming inference
+                    requests to the model server.
+                - A ``initialize`` method, which is invoked at model server start up
+                    for loading the model.
+
+            Defaults to ``sagemaker_pytorch_serving_container.default_handler_service``.
+
+    """
+
+    if ENABLE_MULTI_MODEL:
+        if not os.getenv("SAGEMAKER_HANDLER"):
+            os.environ["SAGEMAKER_HANDLER"] = handler_service
+        _set_python_path()
+    else:
+        _adapt_to_ts_format(handler_service)
+
+    _create_torchserve_config_file()
+
+    if os.path.exists(REQUIREMENTS_PATH):
+        _install_requirements()
+
+    ts_torchserve_cmd = [
+        "torchserve",
+        "--start",
+        "--model-store",
+        MODEL_STORE,
+        "--ts-config",
+        TS_CONFIG_FILE,
+        "--log-config",
+        DEFAULT_TS_LOG_FILE,
+        "--models",
+        "model.mar"
+    ]
+
+    print(ts_torchserve_cmd)
+
+    logger.info(ts_torchserve_cmd)
+    subprocess.Popen(ts_torchserve_cmd)
+
+    ts_process = _retrieve_ts_server_process()
+
+    _add_sigterm_handler(ts_process)
+
+    ts_process.wait()
+
+
+def _adapt_to_ts_format(handler_service):
+    if not os.path.exists(DEFAULT_TS_MODEL_DIRECTORY):
+        os.makedirs(DEFAULT_TS_MODEL_DIRECTORY)
+
+    model_archiver_cmd = [
+        "torch-model-archiver",
+        "--model-name",
+        DEFAULT_TS_MODEL_NAME,
+        "--handler",
+        handler_service,
+        "--serialized-file",
+        os.path.join(environment.model_dir, DEFAULT_TS_MODEL_SERIALIZED_FILE),
+        "--export-path",
+        DEFAULT_TS_MODEL_DIRECTORY,
+        "--extra-files",
+        os.path.join(environment.model_dir, environment.Environment().module_name + ".py"),
+        "--version",
+        "1",
+    ]
+
+    logger.info(model_archiver_cmd)
+    subprocess.check_call(model_archiver_cmd)
+
+    _set_python_path()
+
+
+def _set_python_path():
+    # Torchserve handles code execution by appending the export path, provided
+    # to the model archiver, to the PYTHONPATH env var.
+    # The code_dir has to be added to the PYTHONPATH otherwise the
+    # user provided module can not be imported properly.
+    code_dir_path = "{}:".format(environment.code_dir)
+
+    if PYTHON_PATH_ENV in os.environ:
+        os.environ[PYTHON_PATH_ENV] = code_dir_path + os.environ[PYTHON_PATH_ENV]
+    else:
+        os.environ[PYTHON_PATH_ENV] = code_dir_path
+
+
+def _create_torchserve_config_file():
+    configuration_properties = _generate_ts_config_properties()
+
+    utils.write_file(TS_CONFIG_FILE, configuration_properties)
+
+
+def _generate_ts_config_properties():
+    env = environment.Environment()
+
+    user_defined_configuration = {
+        "default_response_timeout": env.torchserve_timeout,
+        "default_workers_per_model": env.torchserve_workers,
+        "inference_address": "http://0.0.0.0:{}".format(env.inference_http_port),
+        "management_address": "http://0.0.0.0:{}".format(env.management_http_port),
+    }
+
+    custom_configuration = str()
+
+    for key in user_defined_configuration:
+        value = user_defined_configuration.get(key)
+        if value:
+            custom_configuration += "{}={}\n".format(key, value)
+
+    if ENABLE_MULTI_MODEL:
+        default_configuration = utils.read_file(MME_TS_CONFIG_FILE)
+    else:
+        default_configuration = utils.read_file(DEFAULT_TS_CONFIG_FILE)
+
+    return default_configuration + custom_configuration
+
+
+def _add_sigterm_handler(ts_process):
+    def _terminate(signo, frame):  # pylint: disable=unused-argument
+        try:
+            os.kill(ts_process.pid, signal.SIGTERM)
+        except OSError:
+            pass
+
+    signal.signal(signal.SIGTERM, _terminate)
+
+
+def _install_requirements():
+    logger.info("installing packages from requirements.txt...")
+    pip_install_cmd = [sys.executable, "-m", "pip", "install", "-r", REQUIREMENTS_PATH]
+
+    try:
+        subprocess.check_call(pip_install_cmd)
+    except subprocess.CalledProcessError:
+        logger.error("failed to install required packages, exiting")
+        raise ValueError("failed to install required packages")
+
+
+# retry for 10 seconds
+@retry(stop_max_delay=10 * 1000)
+def _retrieve_ts_server_process():
+    ts_server_processes = list()
+
+    for process in psutil.process_iter():
+        if TS_NAMESPACE in process.cmdline():
+            ts_server_processes.append(process)
+
+    if not ts_server_processes:
+        raise Exception("ts model server was unsuccessfully started")
+
+    if len(ts_server_processes) > 1:
+        raise Exception("multiple ts model servers are not supported")
+
+    return ts_server_processes[0]
@@ -24,7 +24,7 @@
 from six import StringIO, BytesIO
 from torch.autograd import Variable
 
-from sagemaker_pytorch_serving_container import default_inference_handler
+from sagemaker_pytorch_serving_container import default_pytorch_inference_handler
 
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 
@@ -49,12 +49,12 @@ def fixture_tensor():
 
 @pytest.fixture()
 def inference_handler():
-    return default_inference_handler.DefaultPytorchInferenceHandler()
+    return default_pytorch_inference_handler.DefaultPytorchInferenceHandler()
 
 
 @pytest.fixture()
 def eia_inference_handler():
-    return default_inference_handler.DefaultPytorchInferenceHandler()
+    return default_pytorch_inference_handler.DefaultPytorchInferenceHandler()
 
 
 def test_default_model_fn(inference_handler):
@@ -178,33 +178,3 @@ def test_default_output_fn_gpu(inference_handler):
     output = inference_handler.default_output_fn(tensor_gpu, content_types.CSV)
 
     assert "1,2,3\n4,5,6\n".encode("utf-8") == output
-
-
-def test_eia_default_model_fn(eia_inference_handler):
-    with mock.patch("sagemaker_pytorch_serving_container.default_inference_handler.os") as mock_os:
-        mock_os.getenv.return_value = "true"
-        mock_os.path.join.return_value = "model_dir"
-        mock_os.path.exists.return_value = True
-        with mock.patch("torch.jit.load") as mock_torch:
-            mock_torch.return_value = DummyModel()
-            model = eia_inference_handler.default_model_fn("model_dir")
-    assert model is not None
-
-
-def test_eia_default_model_fn_error(eia_inference_handler):
-    with mock.patch("sagemaker_pytorch_serving_container.default_inference_handler.os") as mock_os:
-        mock_os.getenv.return_value = "true"
-        mock_os.path.join.return_value = "model_dir"
-        mock_os.path.exists.return_value = False
-        with pytest.raises(FileNotFoundError):
-            eia_inference_handler.default_model_fn("model_dir")
-
-
-def test_eia_default_predict_fn(eia_inference_handler, tensor):
-    model = DummyModel()
-    with mock.patch("sagemaker_pytorch_serving_container.default_inference_handler.os") as mock_os:
-        mock_os.getenv.return_value = "true"
-        with mock.patch("torch.jit.optimized_execution") as mock_torch:
-            mock_torch.__enter__.return_value = "dummy"
-            eia_inference_handler.default_predict_fn(tensor, model)
-        mock_torch.assert_called_once()