Using data from Taarifa and the Tanzanian Ministry of Water, can you predict which pumps are functional, which need some repairs, and which don’t work at all?
Predict one of these three classes based on a number of variables about what kind of pump is operating, when it was installed, and how it is managed. A smart understanding of which waterpoints will fail can improve maintenance operations and ensure that clean, potable water is available to communities across Tanzania.
O dataset está disponível no site Driven Data dentro da competição Pump it Up: Data Mining the Water Table.
Para ter acesso ao dataset é necessário se cadastrar na competição.
Cada equipe, composta por até 2 integrantes, deve submeter o seu modelo no site Driven Data e criar um relatório descrevendo o que foi feito.
O relatório deve conter:
O prazo máximo para entrega do relatório é 22 de setembro de 2016.
Cada equipe deve entregar o script R que faz a aquisição, pré-processamento, modelagem e avaliação do modelo (com matriz de classificação).