Apache Parquet

Apache Parquet é um formato de armazenamento orientado a colunas para o Hadoop. Hadoop é um framework de programação livre, baseado em Java que suporta o processamento de grandes conjuntos de dados em um ambiente de computação distribuída. Parquet é otimizado para trabalhar com dados complexos em massa e inclui métodos para compressão de dados … Ler mais