Azure HDInsight é um serviço baseado em nuvem da Microsoft para grandes análises de dados que ajuda as organizações a processar grandes quantidades de streaming ou dados históricos. A Microsoft promove o HDInsight para aplicações em cenários de data warehousing e ETL (extrair, transformar, carregar), bem como aprendizagem de máquinas e ambientes de Internet das Coisas (IoT).
O serviço totalmente gerenciado e de código aberto é baseado na distribuição Hortonworks Data Platform (HDP) Hadoop e inclui implementações de produtos Apache, incluindo:
- Spark
- HBase
- Storm
- Pig
- Hive
- Sqoop
- Oozie
- Ambari
p>HDInsight permite a integração com ferramentas de business intelligence como Power BI, Excel, SQL Server Analysis Services e SQL Server Reporting Services. As medidas de segurança dos dados do serviço incluem criptografia, monitoramento, redes virtuais, autenticação Active Directory, autorização e controle de acesso baseado em funções (RBAC).