Resolução mais rápida de problemas do sistema
Melhoria na acessibilidade dos dados para os funcionários que oferecem aos clientes informações e serviços essenciais quando eles precisam
Roadmap de longo prazo para monitoramento e manutenção da infraestrutura
A gigante brasileira do setor de energia monitora sistemas críticos para os negócios com a Elastic
Fundado há mais de um século, o Grupo Energisa é a maior empresa privada do setor brasileiro de energia elétrica, com mais de oito milhões de clientes. Com foco na sustentabilidade, a missão da empresa é gerar e fornecer energia de forma a beneficiar a qualidade de vida de seus clientes, ao mesmo tempo apoiando o crescimento dos negócios e da economia.
Mas a expansão contínua traz desafios. À medida que a empresa cresce, mais sistemas de tecnologia são adicionados, os quais devem ser acessíveis aos funcionários e oferecer aos clientes informações e serviços essenciais quando eles precisam. Manter esses sistemas continuamente disponíveis, registrando e resolvendo problemas técnicos o mais rápido possível, é fundamental.
Até recentemente, os analistas da Energisa não conseguiam observar facilmente o desempenho desses sistemas críticos para os negócios. Os logs de serviços e aplicações eram gerados em formato de texto, dificultando sua localização em um sistema descentralizado. A grande quantidade de informações e o tamanho dos arquivos, armazenados em um banco de dados relacional tradicional, aumentavam o desafio.
Como extrair utilidade dos dados
Os analistas gastavam muito tempo vasculhando bancos de dados ou arquivos de texto, muitas vezes recorrendo a planilhas complexas para observar o desempenho do sistema. Rômulo Maini Pinto, líder da equipe de Engenharia de Software da Energisa, diz: “Com o nosso processo anterior, era difícil responder a perguntas simples, detectar a causa raiz do problema ou até mesmo tomar medidas preventivas.”
Para enfrentar esses desafios, Maini e sua equipe pesquisaram o mercado em busca de uma solução de observabilidade que atendesse às necessidades da Energisa. “Queríamos centralizar os logs de aplicações e infraestrutura, possibilitando a análise de causa raiz e a intervenção precoce para manter a disponibilidade dos nossos sistemas”, diz Maini. “Também queríamos ajudar os analistas a economizar tempo, fornecendo alertas oportunos e apresentando as informações de uma forma que facilitasse a compreensão e as ações.”
Trabalhando ao lado de Altamir Dias Cassiano e Guilherme da Silva Lima, analistas de sistemas da Energisa, Maini escolheu a solução Elastic Observability.
Escolhemos a Elastic por causa da comunidade de usuários ativa e da evolução contínua da solução para atender às necessidades dos nossos clientes. Também fomos atraídos pelo excelente suporte técnico 24 horas por dia, 7 dias por semana, pelas visualizações de dados claras e pela facilidade de uso de forma geral.
A Energisa agora usa a Elastic para gerenciar mais de 1,4 mil servidores, monitorando métricas relacionadas a infraestrutura, CPU, memória e muito mais.
A equipe de analistas também aproveitou as vantagens das APIs da Elastic para a manutenção dos servidores, desenvolvendo uma aplicação para evitar alarmes falsos quando os servidores são colocados offline para manutenção ou mudam de status durante o uso regular.
Suporte aos negócios da Energisa e a seus clientes
Com a implantação, a Energisa melhorou drasticamente a observação do ambiente de servidores.
Com o Watcher do Elasticsearch, a equipe de analistas é alertada pela ferramenta de comunicação da empresa com bastante antecedência para que possa intervir e resolver os problemas antes que se tornem demorados. E como os logs são precisos, analistas e engenheiros podem ver exatamente o que precisa ser feito e evitar os alarmes falsos gerados por soluções menos precisas.
A resolução de problemas também conta com o suporte do Canvas, uma ferramenta de visualização de dados incorporada ao Kibana. Isso significa que a equipe de infraestrutura da Energisa pode visualizar a integridade do ambiente inteiro em uma única tela, priorizar os problemas que precisam de resolução urgente e garantir que suas aplicações continuem dando suporte aos clientes e aos negócios de forma geral.
Economia de tempo e melhoria dos processos
A Energisa também observou melhorias significativas no monitoramento das aplicações. As equipes de desenvolvimento podem avaliar a integridade das aplicações e o ambiente onde estão hospedadas. Podem também encontrar rapidamente logs específicos que auxiliam na correção de bugs e na resolução de incidentes.
Em uma instância, a equipe foi capaz de intervir e resolver um problema em dez minutos. Antes da Elastic, isso teria levado pelo menos uma hora e poderia até ter sido impossível.
Além de ajudar a resolver problemas, a Elastic simplifica os processos relacionados ao funcionamento dos negócios e às responsabilidades da equipe analítica. “Com separação de espaços, o Kibana possibilita a governança sobre logs e métricas, permitindo que os analistas acessem dados relacionados apenas à sua área de atuação”, diz Maini.
Para o futuro, Maini tem planos de introduzir um software de machine learning para dar suporte a análises preditivas mais avançadas e espera trabalhar com a Elastic conforme sua solução Observability continua a evoluir.