Reliabilidade, Disponibilidade e Serviceability (RAS) é um conjunto de atributos relacionados que devem ser considerados ao projetar, fabricar, comprar ou usar um produto ou componente de computador. O termo foi usado pela primeira vez pela IBM para definir especificações para seus mainframe s e originalmente aplicado apenas a hardware . Hoje o RAS é relevante também para software e pode ser aplicado a redes, programas de aplicação, sistemas operacionais ( OS s), computadores pessoais ( PC s), servidores e supercomputadores s.
O termo confiabilidade refere-se à capacidade de um componente de hardware ou software relacionado a um computador para desempenhar consistentemente de acordo com suas especificações. Em teoria, um produto confiável é totalmente livre de erros técnicos. Na prática, os fornecedores geralmente expressam a confiabilidade do produto como uma porcentagem. O Institute of Electrical and Electronics Engineers ( IEEE ) patrocina uma organização dedicada à confiabilidade em engenharia conhecida como IEEE Reliability Society (IEEE RS).
Availability é a razão entre o tempo que um sistema ou componente está funcional e o tempo total que é necessário ou esperado para funcionar. Isto pode ser expresso como uma proporção direta (por exemplo, 9/10 ou 0,9) ou como uma porcentagem (por exemplo, 90%). Também pode ser expresso em termos de tempo médio de inatividade por semana, mês ou ano ou como tempo total de inatividade para uma determinada semana, mês ou ano. Às vezes, a disponibilidade é expressa em termos qualitativos, indicando até que ponto um sistema pode continuar a funcionar quando um componente ou conjunto de componentes significativos é desligado.
Serviceability é uma expressão da facilidade com que um componente, dispositivo ou sistema pode ser mantido e reparado. A detecção precoce de potenciais problemas é crítica a este respeito. Alguns sistemas têm a capacidade de corrigir problemas automaticamente antes da ocorrência de problemas sérios; exemplos incluem recursos embutidos de sistemas operacionais como o Microsoft Windows XP e software antivírus e programas de detecção e remoção de spyware habilitados para autoproteção. Idealmente, as operações de manutenção e reparo devem causar o menor tempo de inatividade ou interrupção possível.
Alguns dos elementos-chave do RAS são:
- Over-engenharia, que está projetando sistemas com especificações melhores que os requisitos mínimos.
- Duplicação, que é o uso extensivo de sistemas e componentes redundantes.
- Recoverability, que é o uso de métodos de engenharia tolerantes a falhas.
- Atualização automática, que é manter os sistemas operacionais e aplicações atualizados sem a intervenção do usuário.
- Backup de dados , que previne a perda catastrófica de informações críticas.
- Arquivamento de dados , que mantém extensos registros de dados em caso de auditorias ou outras necessidades de recuperação.
- Substituição de componentes ou periféricos hot swap.
- O uso de máquinas virtuais, que minimiza o impacto de falhas de sistema operacional ou de software.
- Utilização de supressores de picos de corrente, que minimiza o risco de danos a componentes resultantes de anomalias na linha de alimentação.
- Energia contínua, que é a utilização de uma fonte de alimentação ininterrupta, que mantém os sistemas operacionais enquanto comuta de energia comercial para energia de reserva ou auxiliar.
- Fonte de energia de backup, que inclui baterias e geradores para manter os sistemas operacionais durante interrupções prolongadas na energia comercial.