Predicting User Behavior & Battery Drain 📱🔋 100% - MLOps

Vídeo de Demonstração

0. Setup

0.1 Dependências

pip install -r requirements.txt

0.2 .env

Na raiz do projeto existe um arquivo .env.example que deve ser copiado e renomeado para .env e preenchido com as credenciais da AWS.

0.3 AWS

Também é necessário configurar as credenciais da AWS. Para isso, execute:

aws configure

1. Input de Dados

Os dados são baixados e pré-processados automaticamente. Para isso, execute:

python src/process_data.py

2. Mlflow

Para inicializar o mlflow, execute:

mlflow ui

3. Treinamento

Para treinar o modelo, execute:

python src/train.py

O treinamento do modelo irá gerar um novo experimento no mlflow. Caso deseje registrar o modelo, altere a flag register_model para True no arquivo src/train.py.

Gera logs no diretório logs/ e um gráfico da matriz de confusão no diretório results/.

4. Data Drift

O arquivo src/data_drift.py contém a análise de data drift, em que é possível verificar comparar a distribuição dos dados utilizados na produção com os dados novos.

Gera logs no diretório logs/ e um gráfico da matriz de confusão no diretório results/.

Também são gerados artefatos no mlflow.

5. Deploy Local

Para realizar o deploy local, execute:

mlflow models serve -m runs:/<run_id>/user_behavior_model --no-conda -p 8080

5.1. Teste

Após o deploy, é possível realizar um teste com o arquivo test/test_prediction.py:

python test/test_prediction.py

6. Logging

Cada arquivo gera um log no diretório logs/.

7. DVC

É possível utilizar o DVC para versionar os dados e os modelos. Para isso, execute:

dvc init
dvc add data/user_behavior_dataset_processed.csv

7.1. S3

Para armazenar os dados no S3, primeiro crie um bucket no S3 (modifique o arquivo), executando:

python src/s3/create_bucket.py

Para deletar o bucket, execute:

python src/s3/delete_bucket.py

E então, execute:

dvc remote add -d myremote s3://<bucket-name>
dvc remote default myremote
dvc push

7.2. Pipeline

Para executar o pipeline de treinamento, execute:

dvc repro

Referências

Notebook: User Behavior Notebook
Dataset: User Behavior Dataset

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
.dvc		.dvc
data		data
logs		logs
notebooks		notebooks
results		results
src		src
test		test
.dvcignore		.dvcignore
.env.example		.env.example
.gitignore		.gitignore
README.md		README.md
dvc.lock		dvc.lock
dvc.yaml		dvc.yaml
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Predicting User Behavior & Battery Drain 📱🔋 100% - MLOps

Vídeo de Demonstração

0. Setup

0.1 Dependências

0.2 .env

0.3 AWS

1. Input de Dados

2. Mlflow

3. Treinamento

4. Data Drift

5. Deploy Local

5.1. Teste

6. Logging

7. DVC

7.1. S3

7.2. Pipeline

Referências

About

Uh oh!

Releases

Packages

Uh oh!

Languages

gianvr/Predicting-User-Behavior-Battery-Drain-MLOps

Folders and files

Latest commit

History

Repository files navigation

Predicting User Behavior & Battery Drain 📱🔋 100% - MLOps

Vídeo de Demonstração

0. Setup

0.1 Dependências

0.2 .env

0.3 AWS

1. Input de Dados

2. Mlflow

3. Treinamento

4. Data Drift

5. Deploy Local

5.1. Teste

6. Logging

7. DVC

7.1. S3

7.2. Pipeline

Referências

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages