Binning e agrupamento é uma forma de visualização de dados na qual os valores individuais dos dados são classificados em classes ou categorias e representados graficamente para ajudar a explicar o significado dos dados. O agrupamento e agrupamento é útil quando existem tantos elementos gráficos individuais em um gráfico, que distingui-los é difícil.
O agrupamento de dados estatísticos oferece uma forma de agrupar valores contínuos em um número menor de caixas. Por exemplo, dados sobre um grupo de pessoas poderiam ser organizados em um número menor de intervalos de idade (por exemplo, agrupando a cada cinco anos juntos). Ideally, bins deve conter o mesmo número de itens e, quando possível, o conjunto de dados deve ser igualmente divisível pelo número de bins. Bins should include all data under study, including outliers, and boundaries for bins should be whole numbers to make the data easier to visualize.
Large data sets typically require a large number of bins. Deciding on the exact number is often a judgment call. Choosing the right number of bins with the right number of items to provide the information needed is important but can be challenging.