DataBricks é uma organização e grande plataforma de processamento de dados fundada pelos criadores do Apache Spark.
DataBricks foi fundada para fornecer uma alternativa ao sistema MapReduce e fornece uma plataforma baseada em nuvem just-in-time para grandes clientes de processamento de dados.
DataBricks foi criada para cientistas, engenheiros e analistas de dados para ajudar os usuários a integrar as áreas de ciência de dados, engenharia e o negócio por trás deles em todo o ciclo de vida de aprendizagem da máquina. Esta integração ajuda a facilitar os processos desde a preparação dos dados até a experimentação e implementação de aplicações de aprendizagem de máquinas.
De acordo com a empresa, a plataforma DataBricks é cem vezes mais rápida do que o Apache Spark de código aberto. Ao unificar o pipeline envolvido com o desenvolvimento de ferramentas de aprendizagem de máquinas, DataBricks é dito para acelerar o desenvolvimento e inovação e aumentar a segurança. Os clusters de processamento de dados podem ser configurados e implantados com apenas alguns cliques. A plataforma inclui vários recursos integrados de visualização de dados para gráficos data.
DataBricks está sediada em São Francisco, Califórnia e foi fundada por Ali Ghodsi, Andy Konwinshi, Scott Shenker, Ion Stoica, Patrick Wendell, Reynold Xin e Matei Zaharia.