Ambiente de programação R
Na maioria das situações quando você trabalha com a criação de modelos preditivos ou descritivos, você utiliza ferramentas como RapidMiner, Weka, SPSS, SAS ou R. Desde que eu comecei a trabalhar na VAGAS, eu troquei ferramentas como RapidMiner, Weka e libsvm pelo R. Esta troca foi motivada porque:
- Eu estava precisando de uma ferramenta com funcionalidades tanto para a análise descritiva, quanto para a análise preditiva. O R possui uma infinidade de pacotes, a cada mês são lançados novos pacotes e a comunidade é muito ativa - muito mais que a comunidade do RapidMiner ou Weka ou SAS/SPSS, por exemplo.
- Eu estava com dificuldades para realizar o controle de versões dos experimentos utilizando RapidMiner e Weka. Eu sei que todos os processos definidos no RapidMiner são salvos em XML, mas nada é melhor do que um simples script escrito em R :)
- Eu preciso manipular datasets com milhões de registros, tanto na criação de modelos descritivos, quanto na criação de modelos preditivos. O R não é uma maravilha para trabalhar com datasets enormes. No entanto, nem RapidMiner, nem Weka e nem SAS ou SPSS são. Além disso, o R possui alguns pacotes para computação paralela e é muito fácil integrar scripts do R com outros scripts escritos em Python ou Ruby ou Bash. Ou seja, é possível desenvolver soluções bem otimizadas [estilo map reduce] utilizando os recursos [de pipe] do próprio sistema operacional (só funciona com sistema operacional de verdade - *unix).
- Eu preciso criar relatórios com gráficos bem bonitos em vários formatos (por exemplo: html, pdf ou ppt). Com o R é possível gerar bons relatórios em HTML utilizando o knitr ou documentos em pdf com o LaTeX, por exemplo.
Resumo da ópera: não perdi tempo aprendendo a utilizar o R. Atualmente, o R é com certeza o ambiente de programação que eu mais utilizo no dia-a-dia. Se você está com curiosidade sobre o que é possível fazer com esta linguagem de programação então da uma olhada aqui.