Os últimos 25 anos testemunharam a confirmação da importância da estimação de densidade e dos métodos não paramétricos na análise de dados moderna, nesta era do “big data”. Com a revolução na computação o acesso a dados de complexidade sem precedentes tornou-se comum. Mais variáveis estão sendo medidas e o volume de dados está crescendo exponencialmente. Ao mesmo tempo, os avanços no desempenho computacional conferiram novo poder ao analista de dados.

Com essas mudanças, surgiu uma demanda crescente por ferramentas capazes de detectar e resumir a estrutura multivariada em dados complexos. A estimação de densidade é hoje reconhecida como uma ferramenta útil para dados univariados e bivariados; um objetivo destas notas é demonstrar que ela também é uma ferramenta poderosa em dimensões superiores, com ênfase particular em dados trivariados e quadrivariados.

Estas notas focam em promover uma compreensão intuitiva da metodologia subjacente e da teoria que a sustenta. Procuramos destacar os desafios apresentados por conjuntos de dados massivos ou para esclarecer oportunidades teóricas e novos algoritmos. Assim, estas notas estão dirigidas ao leitor interessado nos aspectos teóricos da estimação não paramétrica, bem como para o leitor interessado na aplicação desses métodos a dados multivariados.

Optamos por apresentar as principais ideias no contexto do histograma clássico, que permanece o estimador não paramétrico mais amplamente aplicado e mais intuitivo. Consideramos instrutivo desenvolver as ligações entre o histograma e métodos estatisticamente mais eficientes. Essa abordagem simplifica bastante o tratamento de estimadores avançados, uma vez que grande parte da novidade do contexto teórico foi transferida para o ambiente familiar do histograma.