dengdifan
diff --git a/‎autoPyTorch/api/time_series_forecasting.py
Lines changed: 6 additions & 1 deletion b/‎autoPyTorch/api/time_series_forecasting.py
Lines changed: 6 additions & 1 deletion
diff --git a/‎autoPyTorch/configs/forecasting_init_cfgs.json
Lines changed: 64 additions & 25 deletions b/‎autoPyTorch/configs/forecasting_init_cfgs.json
Lines changed: 64 additions & 25 deletions
diff --git a/‎autoPyTorch/constants_forecasting.py
Lines changed: 9 additions & 9 deletions b/‎autoPyTorch/constants_forecasting.py
Lines changed: 9 additions & 9 deletions
diff --git a/‎autoPyTorch/data/time_series_forecasting_validator.py
Lines changed: 48 additions & 9 deletions b/‎autoPyTorch/data/time_series_forecasting_validator.py
Lines changed: 48 additions & 9 deletions
@@ -120,6 +120,8 @@ def search(
             target_variables: Optional[Union[Tuple[int], Tuple[str], np.ndarray]] = None,
             n_prediction_steps: int = 1,
             freq: Optional[Union[str, int, List[int]]] = None,
+            start_times_train: List[pd.DatetimeIndex] = [],
+            start_times_test: Optional[List[pd.DatetimeIndex]] = None,
             dataset_name: Optional[str] = None,
             budget_type: str = 'epochs',
             min_budget: Union[int, str] = 5,
@@ -266,12 +268,15 @@ def search(
         # Fit a input validator to check the provided data
         # Also, an encoder is fit to both train and test data,
         # to prevent unseen categories during inference
-        self.InputValidator.fit(X_train=X_train, y_train=y_train, X_test=X_test, y_test=y_test)
+        self.InputValidator.fit(X_train=X_train, y_train=y_train, start_times_train=start_times_train,
+                                X_test=X_test, y_test=y_test, start_times_test=start_times_test)
 
         self.dataset = TimeSeriesForecastingDataset(
             X=X_train, Y=y_train,
             X_test=X_test, Y_test=y_test,
             freq=freq,
+            start_times_train=start_times_train,
+            start_times_test=start_times_test,
             validator=self.InputValidator,
             resampling_strategy=self.resampling_strategy,
             resampling_strategy_args=self.resampling_strategy_args,
 
@@ -4,6 +4,7 @@
         "data_loader:backcast": false,
         "data_loader:sample_strategy": "SeqUniform",
         "data_loader:num_batches_per_epoch": 50,
+        "data_loader:transform_time_features": false,
         "lr_scheduler:__choice__": "ReduceLROnPlateau",
         "lr_scheduler:ReduceLROnPlateau:mode": "max",
         "lr_scheduler:ReduceLROnPlateau:factor": 0.5,
@@ -130,35 +131,42 @@
         },
         "Seq2Seq-Transformer2Transformer": {
             "loss:__choice__": "DistributionLoss",
+            "data_loader:transform_time_features": true,
             "loss:DistributionLoss:dist_cls": "studentT",
             "loss:DistributionLoss:forecast_strategy": "sample",
             "loss:DistributionLoss:aggregation": "median",
             "loss:DistributionLoss:num_samples": 100,
-            "network_backbone:__choice__": "TransformerEncoder",
-            "network_backbone:TransformerEncoder:d_model_log": 5,
-            "network_backbone:TransformerEncoder:activation": "gelu",
-            "network_backbone:TransformerEncoder:num_layers": 1,
-            "network_backbone:TransformerEncoder:decoder_type": "TransformerDecoder",
-            "network_backbone:TransformerEncoder:use_dropout": true,
-            "network_backbone:TransformerEncoder:use_positional_encoder": true,
-            "network_backbone:TransformerEncoder:dropout_positional_encoder": 0.1,
-            "network_backbone:TransformerEncoder:d_feed_forward_log": 7,
-            "network_backbone:TransformerEncoder:n_head_log": 3,
-            "network_backbone:TransformerEncoder:layer_norm_eps": 1e-05,
-            "network_backbone:TransformerEncoder:dropout": 0.1,
-            "network_backbone:TransformerEncoder:use_layer_norm_output": true,
-            "network_backbone:TransformerEncoder:layer_norm_eps_output": 1e-05,
-            "network_backbone:TransformerDecoder:activation": "gelu",
-            "network_backbone:TransformerDecoder:num_layers": 1,
-            "network_backbone:TransformerDecoder:use_dropout": true,
-            "network_backbone:TransformerDecoder:use_positional_decoder": true,
-            "network_backbone:TransformerDecoder:dropout_positional_decoder": 0.1,
-            "network_backbone:TransformerDecoder:d_feed_forward_log": 7,
-            "network_backbone:TransformerDecoder:n_head_log": 3,
-            "network_backbone:TransformerDecoder:layer_norm_eps": 1e-05,
-            "network_backbone:TransformerDecoder:dropout": 0.1,
-            "network_backbone:TransformerDecoder:use_layer_norm_output": true,
-            "network_backbone:TransformerDecoder:layer_norm_eps_output": 1e-05
+            "network_backbone:__choice__": "seq_encoder",
+            "network_backbone:seq_encoder:skip_connection": false,
+            "network_backbone:seq_encoder:num_blocks": 1,
+            "network_backbone:seq_encoder:use_temporal_fusion": false,
+            "network_backbone:seq_encoder:variable_selection": false,
+            "network_backbone:seq_encoder:decoder_auto_regressive": true,
+            "network_backbone:seq_encoder:block_1:__choice__": "TransformerEncoder",
+            "network_backbone:seq_encoder:block_1:TransformerEncoder:d_model_log": 5,
+            "network_backbone:seq_encoder:block_1:TransformerEncoder:activation": "gelu",
+            "network_backbone:seq_encoder:block_1:TransformerEncoder:num_layers": 1,
+            "network_backbone:seq_encoder:block_1:TransformerEncoder:decoder_type": "TransformerDecoder",
+            "network_backbone:seq_encoder:block_1:TransformerEncoder:use_dropout": true,
+            "network_backbone:seq_encoder:block_1:TransformerEncoder:use_positional_encoder": true,
+            "network_backbone:seq_encoder:block_1:TransformerEncoder:dropout_positional_encoder": 0.1,
+            "network_backbone:seq_encoder:block_1:TransformerEncoder:d_feed_forward_log": 7,
+            "network_backbone:seq_encoder:block_1:TransformerEncoder:n_head_log": 3,
+            "network_backbone:seq_encoder:block_1:TransformerEncoder:layer_norm_eps": 1e-05,
+            "network_backbone:seq_encoder:block_1:TransformerEncoder:dropout": 0.1,
+            "network_backbone:seq_encoder:block_1:TransformerEncoder:use_layer_norm_output": true,
+            "network_backbone:seq_encoder:block_1:TransformerEncoder:layer_norm_eps_output": 1e-05,
+            "network_backbone:seq_encoder:block_1:TransformerDecoder:activation": "gelu",
+            "network_backbone:seq_encoder:block_1:TransformerDecoder:num_layers": 1,
+            "network_backbone:seq_encoder:block_1:TransformerDecoder:use_dropout": true,
+            "network_backbone:seq_encoder:block_1:TransformerDecoder:use_positional_decoder": true,
+            "network_backbone:seq_encoder:block_1:TransformerDecoder:dropout_positional_decoder": 0.1,
+            "network_backbone:seq_encoder:block_1:TransformerDecoder:d_feed_forward_log": 7,
+            "network_backbone:seq_encoder:block_1:TransformerDecoder:n_head_log": 3,
+            "network_backbone:seq_encoder:block_1:TransformerDecoder:layer_norm_eps": 1e-05,
+            "network_backbone:seq_encoder:block_1:TransformerDecoder:dropout": 0.1,
+            "network_backbone:seq_encoder:block_1:TransformerDecoder:use_layer_norm_output": true,
+            "network_backbone:seq_encoder:block_1:TransformerDecoder:layer_norm_eps_output": 1e-05
         },
         "NBEATS-I": {
             "target_scaler:__choice__": "TargetNoScaler",
@@ -206,6 +214,37 @@
             "network_backbone:flat_encoder:NBEATSDecoder:weight_sharing_g": false,
             "network_backbone:flat_encoder:NBEATSDecoder:expansion_coefficient_length_g": 32,
             "network_backbone:flat_encoder:NBEATSDecoder:dropout_g": 0.1
+        },
+        "TemoporalFusionTransformer": {
+            "loss:__choice__": "QuantileLoss",
+            "target_scaler:__choice__": "TargetStandardScaler",
+            "data_loader:transform_time_features": true,
+            "loss:QuantileLoss:lower_quantile": 0.1,
+            "loss:QuantileLoss:upper_quantile": 0.9,
+            "network_backbone:__choice__": "seq_encoder",
+            "network_backbone:seq_encoder:skip_connection": true,
+            "network_backbone:seq_encoder:num_blocks": 1,
+            "network_backbone:seq_encoder:variable_selection": true,
+            "network_backbone:seq_encoder:share_single_variable_networks": false,
+            "network_backbone:seq_encoder:skip_connection_type": "gate_add_norm",
+            "network_backbone:seq_encoder:variable_selection_use_dropout": true,
+            "network_backbone:seq_encoder:variable_selection_dropout_rate": 0.1,
+            "network_backbone:seq_encoder:grn_use_dropout": true,
+            "network_backbone:seq_encoder:grn_dropout_rate": 0.1,
+            "network_backbone:seq_encoder:block_1:__choice__": "RNNEncoder",
+            "network_backbone:seq_encoder:decoder_auto_regressive": false,
+            "network_backbone:seq_encoder:block_1:RNNEncoder:cell_type": "lstm",
+            "network_backbone:seq_encoder:block_1:RNNEncoder:num_layers": 1,
+            "network_backbone:seq_encoder:block_1:RNNEncoder:hidden_size": 32,
+            "network_backbone:seq_encoder:block_1:RNNEncoder:bidirectional": false,
+            "network_backbone:seq_encoder:block_1:RNNEncoder:use_dropout": false,
+            "network_backbone:seq_encoder:block_1:RNNEncoder:decoder_type": "RNNDecoder",
+            "network_backbone:seq_encoder:block_1:RNNDecoder:decoder_type": "RNNDecoder",
+            "network_backbone:seq_encoder:use_temporal_fusion": true,
+            "network_backbone:seq_encoder:temporal_fusion:attention_d_model_log": 5,
+            "network_backbone:seq_encoder:temporal_fusion:attention_n_head_log": 2,
+            "network_backbone:seq_encoder:temporal_fusion:use_dropout": true,
+            "network_backbone:seq_encoder:temporal_fusion:dropout_rate": 0.1
         }
     }
 }
@@ -5,15 +5,15 @@
 FORECASTING_BUDGET_TYPE = ['resolution', 'num_seq', 'num_sample_per_seq']
 
 SEASONALITY_MAP = {
-    "minutely": [1440, 10080, 525960],
-    "10_minutes": [144, 1008, 52596],
-    "half_hourly": [48, 336, 17532],
-    "hourly": [24, 168, 8766],
-    "daily": 7,
-    "weekly": 365.25 / 7,
-    "monthly": 12,
-    "quarterly": 4,
-    "yearly": 1
+    "1min": [1440, 10080, 525960],
+    "10min": [144, 1008, 52596],
+    "30min": [48, 336, 17532],
+    "1H": [24, 168, 8766],
+    "1D": 7,
+    "1W": 365.25 / 7,
+    "1M": 12,
+    "1Q": 4,
+    "1Y": 1
 }
 
 MAX_WINDOW_SIZE_BASE = 500
 
@@ -2,9 +2,10 @@
 
 # -*- encoding: utf-8 -*-
 import logging
-from typing import Optional, Tuple, List, Union
+import warnings
+from typing import Optional, Tuple, List, Union, Dict
 import numpy as np
-
+import pandas as pd
 from sklearn.base import BaseEstimator
 from sklearn.exceptions import NotFittedError
 
@@ -23,6 +24,10 @@ def __init__(self,
         self._is_uni_variant = False
         self.known_future_features = None
         self.n_prediction_steps = 1
+        self.start_times_train = None
+        self.start_times_test = None
+        self.feature_shapes = {}
+        self.feature_names = []
 
     """
     A validator designed for a time series forecasting dataset.
@@ -35,10 +40,33 @@ def fit(
             y_train: SUPPORTED_TARGET_TYPES,
             X_test: Optional[SUPPORTED_FEAT_TYPES] = None,
             y_test: Optional[SUPPORTED_TARGET_TYPES] = None,
+            start_times_train: Optional[List[pd.DatetimeIndex]] = None,
+            start_times_test: Optional[List[pd.DatetimeIndex]] = None,
+            freq: str = '1Y',
             n_prediction_steps: int = 1,
             known_future_features: Optional[List[Union[int, str]]] = None,
+            use_time_features: bool = False
     ) -> BaseEstimator:
         self.n_prediction_steps = n_prediction_steps
+
+        if y_test is not None and bool(start_times_test) != bool(start_times_train):
+            warnings.warn('One of start_times_test or start_times_train is missing! This might result in the '
+                          'risk of not proper evaluated ')
+
+        if start_times_train is None:
+            start_times_train = [pd.DatetimeIndex(pd.to_datetime(['1900-01-01']), freq=freq)] * len(y_train)
+        else:
+            assert len(start_times_train) == len(y_train), 'start_times_train must have the same length as y_train!'
+
+        if y_test is not None:
+            if start_times_test is None:
+                start_times_test = [pd.DatetimeIndex(pd.to_datetime(['1900-01-01']), freq=freq)] * len(y_test)
+            else:
+                assert len(start_times_train) == len(y_train), 'start_times_train must have the same length as y_train!'
+
+        self.start_times_train = start_times_train
+        self.start_times_test = start_times_test
+
         if X_train is None:
             self._is_uni_variant = True
         if self._is_uni_variant:
@@ -64,13 +92,22 @@ def fit(
                                      " {} for features and {} for targets".format(len(X_test), len(y_test), ))
                 # TODO write a feature input validator to check X_test for known_future_features
                 super().fit(X_train[0], y_train[0], X_test[0], y_test[0])
-            else:
-                super().fit(X_train[0], y_train[0])
+            self.feature_validator.fit(X_train[0], None if X_test is None else X_test[0])
+            self.target_validator.fit(y_train[0], None if y_test is None else y_test[0])
+            self._is_fitted = True
 
             self.check_input_shapes(X_train, y_train, is_training=True)
 
             if X_test is not None:
                 self.check_input_shapes(X_test, y_test, is_training=False)
+            if hasattr(X_train[0], 'columns'):
+                features = X_train[0].columns.values.tolist()
+            else:
+                features = list(map(str, range(len(X_train[0]))))
+            for feature in features:
+                self.feature_names.append(feature)
+                self.feature_shapes[feature] = 1
+
             return self
 
     @staticmethod
@@ -125,20 +162,23 @@ def transform(
 
         start_idx = 0
 
+        group_ids = np.arange(len(sequence_lengths)).repeat(sequence_lengths)
+
         if self._is_uni_variant:
-            y_flat = np.empty([num_data, num_targets])
+            y_flat = pd.DataFrame(np.empty([num_data, num_targets]), index=group_ids)
             for seq_idx, seq_length in enumerate(sequence_lengths):
                 end_idx = start_idx + seq_length
                 y_flat[start_idx: end_idx] = np.array(y[seq_idx]).reshape([-1, num_targets])
                 start_idx = end_idx
-            y_transformed = self.target_validator.transform(y_flat)  # type:np.ndarray
+            y_transformed = self.target_validator.transform(y_flat)
             if y_transformed.ndim == 1:
                 y_transformed = np.expand_dims(y_transformed, -1)
             return np.asarray([]), y_transformed, sequence_lengths
 
         # a matrix that is concatenated by all the time series sequences
-        X_flat = np.empty([num_data, num_features])
-        y_flat = np.empty([num_data, num_targets])
+
+        X_flat = pd.DataFrame(np.empty([num_data, num_features]), index=group_ids)
+        y_flat = pd.DataFrame(np.empty([num_data, num_targets]), index=group_ids)
 
         start_idx = 0
         for seq_idx, seq_length in enumerate(sequence_lengths):
@@ -152,4 +192,3 @@ def transform(
         if y_transformed.ndim == 1:
             y_transformed = np.expand_dims(y_transformed, -1)
         return X_transformed, y_transformed, sequence_lengths
-