Apache Cassandra é um sistema de base de dados distribuído de código aberto que foi concebido para armazenar e gerir grandes quantidades de dados através de servidores de mercadorias. Cassandra pode servir tanto como um armazenamento de dados operacionais em tempo real para aplicações transacionais online como um banco de dados de leitura intensiva para sistemas de business intelligence (BI) em larga escala.
Originalmente criado para o Facebook, Cassandra é projetado para ter nós simétricos peer-to-peer, em vez de nós mestre ou nomeados, para garantir que nunca possa haver um único ponto de falha (SPoF). A Cassandra particiona automaticamente os dados em todos os nós do cluster do banco de dados, mas o administrador tem o poder de determinar quais dados serão replicados e quantas cópias dos dados serão criadas.
Após o código de código aberto do Facebook, a Cassandra tornou-se um projeto Apache Incubator em 2008 e um projeto Apache de alto nível em 2010. A partir desta escrita, as implementações da Cassandra incluem Netflix, Digg, Adobe, Twitter, HP, IBM, Rackspace, Cisco e Reddit.
O nome Cassandra foi inspirado pela bela vidente mística na mitologia grega cujas previsões para o futuro nunca foram acreditadas.
Este tutorial da DataStax fornece uma excelente visão geral da Cassandra: