Por Henrique Bissochi e Edmar Cioletti
Em um mundo cada vez mais digital, os Data Centers são as espinhas dorsais da internet, processando e armazenando uma quantidade colossal de dados a cada segundo. Mas, o que é necessário para manter esses gigantes tecnológicos operando sem parar?
Como é a Gestão de Facilities em um Data Center?
Em um Data Center o foco é manter a operação funcionando e para isso primeiramente é necessário criar uma infraestrutura física que esteja aderente ao negócio da empresa. Existem 4 categorias de infraestrutura física, denominadas “camadas de redundância”. Em uma infraestrutura mais simples (TIER 1), somente com 1 No-Break e 1 Gerador, é estimada uma interrupção de energia de até 29horas/ano. Porém, na melhor infraestrutura (TIER 4), é estimada uma interrupção de energia de somente 0,4hora/ano.
O Data Center do Santander Brasil é o único que possui a máxima classificação do Mercado Financeiro Brasileiro.
Mesmo com a melhor infraestrutura física no Data Center, é necessária uma equipe de operação e manutenção especializada em Missão Crítica, pois 70% das falhas são causadas por fator humano.
Qual a importância de FM em Missão Crítica?
Em Tecnologia da Informação, o conceito de Missão Crítica refere-se à essencialidade de aplicações, serviços e processos cuja interrupção ou perda de dados importantes pode causar problemas significativos, afetando não apenas o aspecto financeiro, mas também social, ambiental e a reputação das empresas. Enquanto alguns Data Centers podem ser desligados temporariamente para manutenção sem impactar as operações, como é o caso de fábricas que não operam nos finais de semana, a continuidade é vital para o setor financeiro. Uma simples falha pode tornar todo o sistema financeiro inacessível a milhões de clientes. Diferente da manutenção de aeronaves, que pode ser realizada com estas estacionadas e vazias, Data Centers financeiros precisam realizar manutenções sem interromper o funcionamento, comparável a trocar a turbina de um avião em voo. Isso exige preparação para manutenções não programadas, além das programadas, para assegurar a operação contínua da infraestrutura crítica.
Mas como é possível fazer essa atividade?
Para realizar a manutenção e operação crítica em Data Centers, é essencial contar com empresas especializadas e profissionais qualificados em Facilities de Missão Crítica, os quais são escassos diante da rápida expansão do mercado de Data Centers no Brasil. Estes profissionais, geralmente treinados internamente devido à falta de especialistas no mercado, são altamente valorizados. É crucial um planejamento estratégico detalhado, que inclua avaliação de riscos, plano de manutenção anual, e estratégias de longo prazo para substituição ou retrofit de equipamentos, prevendo até peças de reposição para evitar paradas inesperadas. Todos os procedimentos devem ser meticulosamente documentados para garantir a execução sem falhas. Com o aumento da dependência tecnológica, a segurança, confiabilidade e sustentabilidade dos Data Centers se tornam prioritárias, exigindo auditorias e certificações rigorosas para prevenir falhas, inclusive aquelas causadas por erros humanos, assegurando a operação ininterrupta dos serviços digitais.
Por que medir a maturidade do modelo?
Medir a maturidade do modelo de Operação e Manutenção de Facilities em Data Centers é crucial para implementar objetivos estratégicos eficazmente, identificando áreas de força e fraqueza. Este processo permite à administração ajustar e melhorar a eficiência operacional e a resiliência organizacional, estabelecendo metas claras para aprimorar a operação e manutenção. A avaliação, baseada em metodologias reconhecidas como PMI e normas ISO, envolve coleta de dados e análise crítica para oferecer insights para o desenvolvimento estratégico, comprometimento da equipe com a excelência operacional e fechamento de lacunas em capacidades e recursos. Os auditores, certificados em ambientes críticos, conduzem o processo seguindo critérios de prioridade, coletando informações para análise e recomendações futuras.
A metodologia adotada alia técnicas de Gerência de Projeto com PMI – PMP Gerenciamento de Projetos (Guia PMBOK®), Metodologias Ágeis e conformidade com as normas ISO/IEC 19011:2018 e ISO/IEC 17021-1:2016.
Os auditores responsáveis pelo processo de Método de Levantamento, Análise de Gaps e Findings possuem a certificação CEA - Auditor de Ambientes Críticos – do ICOR. (The International Consortium for Organizational Resillience).
Qual a metodologia para avaliar os processos?
A metodologia para avaliar os processos do Data Center utiliza o Framework do FOMM (Facility Operations Maturity Model), que é um modelo de referência que avalia a maturidade operacional sem se basear em tecnologias específicas, mas sim em processos e elementos comuns de operação e manutenção de Facilities. Desenvolvido a partir da análise de instalações críticas ao longo de 30 anos, o FOMM divide-se em sete disciplinas, incluindo segurança, resposta a emergências, gestão de manutenção, entre outras, subdivididas em 25 elementos e 78 subelementos. Este modelo permite às organizações medir sua maturidade atual e estabelecer metas para alcançar níveis mais elevados de maturidade, alinhados aos seus objetivos de negócios. O FOMM serve como ferramenta de benchmarking, ajudando a desenvolver operações de infraestrutura crítica mais eficientes e seguras, ao mesmo tempo que possibilita a comparação com outras instalações e a formação de estratégias para atingir objetivos empresariais.
Pontuação de Maturidade
A pontuação de maturidade classifica cada subelemento de operações de facilities em cinco níveis, do menos ao mais maduro, de “1” a “5”. Esses níveis vão de inicial e ad hoc, caracterizado por ser imprevisível e sem padronização, até otimizado, em que os processos são refinados e baseados em melhoria contínua. Esta escala, inspirada no modelo do IT Governance Institute (COBIT), ajuda administradores e auditores a avaliar a maturidade operacional de uma organização, facilitando a identificação de áreas para desenvolvimento e aprimoramento.
Durante o processo de auditoria:
A auditoria focou na avaliação de equipamentos, operação, manutenção, e processos para identificar riscos de erros humanos e melhorar os padrões de operação e manutenção para classe mundial, visando a certificação. Incluiu a análise dos processos atuais, a manutenção de equipamentos críticos, e a elaboração de planos de ação para melhorar a maturidade dos processos e a confiabilidade das instalações. Os temas principais abordaram a avaliação de procedimentos operacionais e de manutenção, análise de documentação, aplicação de melhores práticas, treinamento de equipes, gestão de manutenção, e avaliação de riscos, com o objetivo de maximizar a disponibilidade e eficiência dos Data Centers. Mais de 500 procedimentos foram avaliados, com mais de 2.000 documentos revisados e mais de 29.000 ordens de serviço analisadas, resultando em um extenso treinamento de equipe e desenvolvimento de um framework global de maturidade para relatórios e ações corretivas.
Resultado da auditoria
Após 12 meses de trabalho minucioso em 100% dos processos, o resultado da auditoria final apontou que o nível de maturidade da operação dos Data Centers é espetacular, ficando bem acima da pontuação mínima para a certificação. Em todas as disciplinas, superou as expectativas, sendo a maior pontuação de todas as auditorias no Brasil, tornando essa operação um benchmarking na gestão de Facilities em um Data Center. O empenho de toda a equipe demonstrou a excelência de operação que temos no Data Center na execução das tarefas em inúmeros equipamentos, com planejamento exemplar e profissionais do mais alto nível técnico do mercado, garantindo a confiabilidade e altíssima disponibilidade para os serviços de tecnologia aos nossos clientes. Ao alcançar o certificado ICOR, consolida a excelência da manutenção e operação dos Data Centers Santander.