Exercício: criando um classificador para um problema de Human Activity Recognition

Contexto e objetivo

O grupo de pesquisa da PUC-Rio, construiu um dataset com 5 classes (sitting-down, standing-up, standing, walking and sitting) coletando durante 8 horas atividades de 4 pessoas saudáveis. Os dados adquiridos são: idade, altura, peso, entre outras informações, incluindo dados de acelerômetros que estão presentes em equipamentos que as pessoas estão usando.

O objetivo deste trabalho é construir um classificador capaz de dizer que atividade uma pessoa esta realizando a partir dos atributos mencionados acima.

Dataset

O dataset que deverá ser utilizado neste estudo está no arquivo data/dataset-har-PUC-Rio-ugulino.csv. Mais informações sobre o dataset podem ser obtidas em docs/2012.Ugulino.WearableComputing.HAR.Classifier.RIBBON.pdf.

O que deve ser entregue

Cada equipe, composta com até 2 integrantes, deve entregar um relatório descrevendo:

  • Como os dados foram adquiridos e como os dados foram pré-processados;
  • A análise descritiva dos dados. Não é necessário apresentar toda a análise. Apenas apresente aquilo que é relevante para o relatório final, por exemplo, os principais padrões que contribuem para a construção do classificador.
  • Quais as etapas para construção do classificador e avaliação do classificador utilizando os algoritmos ctree e knn.
  • Os resultados encontrados pelos classificadores desenvolvidos pela equipe e a comparação entre este classificador e os resultados apresentados no artigo citado acima.

Entrega

O prazo máximo para entrega do relatório é 24 de maio de 2016.

Cada equipe deve entregar o script R que faz a aquisição, pré-processamento, modelagem e avaliação do modelo (com matriz de classificação). A avaliação do modelo deve ser feita preferencialmente utilizando o método de validação cruzada.