Hoje é 22/10/17 - Dia do Pára-quedista; Dia do Radioamador; Dia Internacional da Gagueira;


04/10/2017
40 Técnicas utilizadas pelos cientistas de dados

Essas técnicas cobrem a maioria dos dados que os cientistas e profissionais relacionados estão usando em suas atividades diárias, quer eles usem soluções oferecidas por um fornecedor ou se eles criam ferramentas proprietárias.
Quando você clica em qualquer um dos 40 links abaixo, você encontrará uma seleção de artigos relacionados à entrada em questão. A maioria desses artigos é difícil de encontrar com uma pesquisa do Google, por isso, de certa forma, isso lhe dá acesso à literatura escondida sobre ciência dos dados, aprendizado de máquinas e ciência estatística. Muitos desses artigos são fundamentais para a compreensão da técnica em questão, e vem com mais referências e código fonte.
As técnicas de classificação (marcadas com um *) pertencem ao que eu chamo de ciência de dados profunda , um ramo da ciência de dados que tem pouco ou mesmo sobreposição com campos estreitamente relacionados, como aprendizado de máquina, ciência da computação, pesquisa operacional, matemática ou estatística. Mesmo as técnicas clássicas de aprendizagem e técnicas de máquinas, tais como agrupamento, estimativa de densidade ou testes de hipóteses, possuem versões robustas, baseadas em dados e robustas, projetadas para processamento automatizado (como em comunicações máquina-máquina) e, portanto, também pertencem a Ciência profunda dos dados . No entanto, essas técnicas não são atualizadas aqui, já que as versões padrão dessas técnicas são mais conhecidas (e, infelizmente, mais usadas) do que o equivalente em ciência profunda de dados .
Para saber mais sobre ciência profunda dos dados,   clique aqui . Note que, ao contrário do aprendizado profundo, a ciência profunda dos dados não é a interseção da ciência dos dados e da inteligência artificial; No entanto, a analogia entre ciência profunda dos dados e aprendizado profundo não é completamente sem sentido, no sentido de que ambos lidam com a automação.
Além disso, para descobrir em que contextos e aplicações as 40 técnicas abaixo são usadas, convido você a ler os seguintes artigos:
Finalmente, ao usar uma técnica, você precisa testar seu desempenho. Leia este artigo  sobre  11 técnicas de avaliação de modelo importantes que todos devem saber.
 
As 40 técnicas de ciência de dados
  1. Regressão linear
  2. Regressão Logística
  3. Regressão Jackknife  *
  4. Estimativa de densidade
  5. Intervalo de confiança
  6. Teste de Hipóteses
  7. Reconhecimento de padrões
  8. Clustering  - (também conhecido como Learning não supervisionado)
  9. Aprendizagem supervisionada
  10. Série de tempo
  11. Árvores de decisão
  12. Números aleatórios
  13. Simulação de Monte-Carlo
  14. Estatísticas Bayesianas
  15. Bayes nao
  16. Análise de componentes principais  - (PCA)
  17. Conjuntos
  18. Redes neurais
  19. Support Vector Machine  - (SVM)
  20. Vizinhos mais próximos  - (k-NN)
  21. Seleção de características  - (também conhecido como Redução de variável)
  22. Indexação / Catalogação  *
  23. (Geo-) Modelagem espacial
  24. Recomendação Engine  *
  25. Search Engine  *
  26. Modelagem de Atribuição  *
  27. Filtragem colaborativa  *
  28. Sistema de Regra
  29. Análise de ligação
  30. Regras da Associação
  31. Motor de pontuação
  32. Segmentação
  33. Modelagem Preditiva
  34. Gráficos
  35. Aprendizagem profunda
  36. Teoria do jogo
  37. Imputação
  38. Análise de sobrevivência
  39. Arbitragem
  40. Modelagem de elevação
  41. Otimização de rendimento
  42. Validação cruzada
  43. Montagem de modelo
  44. Algoritmo de Relevância  *
  45. Design experimental
 
O número de técnicas é superior a 40 porque atualizamos o artigo e adicionamos outros adicionais.
Fonte: http://bicomvatapa.blogspot.com.br/2017/09/estudo-40-tecnicas-utilizadas-pelos.html