5 razões pelas quais observabilidade e segurança funcionam bem juntas

Apesar de terem funções muito diferentes, a engenharia de confiabilidade do local (SREs) e a análise de segurança compartilham muitos objetivos. Ambas empregam monitoramento proativo e estratégias de resposta a incidentes para identificar e resolver possíveis problemas antes que eles prejudiquem os serviços. Elas também priorizam a estabilidade e a resiliência da organização, a fim de minimizar o tempo de inatividade e as interrupções.
No entanto, quando enfatizam a colaboração e a comunicação não só dentro como entre as respectivas equipes, as duas atingem um nível mais alto de resiliência operacional e respondem mais proativamente às possíveis ameaças à empresa do que se operassem de forma independente.
Confira cinco melhorias quando as equipes de segurança e de observabilidade trabalham juntas:
1. Colaboração aprimorada entre equipes

Para fornecedores e parceiros de tecnologia, a matemática é simples: mais ferramentas = mais processos manuais e mais tempo gasto resolvendo problemas. Tecnologias isoladas e avulsas aumentam a carga da colaboração e dos insights sobre as equipes, o que aumenta o trabalho e o risco de erros. As ferramentas a mais também aumentam a carga de gestão, atualização e manutenção dos softwares. A unificação das tecnologias reduz não só essa carga de trabalho manual como a superfície de ataque de uma organização, pois limita o acesso que as ferramentas têm aos sistemas da organização.
Colaboração em ação
O negócio de receita de anúncios da DISH Media ingere e processa 10 bilhões de registros por dia de 25 milhões de endpoints de dispositivos — incluindo dados operacionais, comerciais e de segurança. Com uma solução unificada e um único independente (a Elastic), os dashboards e os dados agora estão disponíveis em um único local para a análise rápida das duas equipes.
Isso tem reduzido bastante a detecção de incidentes e o MTTR, melhorando a experiência dos clientes. Graças ao agente independente da Elastic, as anomalias em milhões de sistemas e aparelhos dos clientes são detectadas muito mais rapidamente, acelerando a análise da causa-raiz e a correção. E, com a equipe operando com um só agente, não houve mais custos na implementação.
“Com a Elastic, agora temos uma visão unificada dos dados que podemos correlacionar para detectar padrões e anomalias”, comemora John Haskell, chefe de engenharia da DISH Media. “Antes, a análise e a remediação da causa-raiz levavam semanas. Agora leva horas."
2. Visibilidade completa com uma plataforma de dados unificada

As equipes de observabilidade e segurança são inundadas com dados à medida que a complexidade da infraestrutura e das aplicações aumenta. Muitas vezes, esses dados são os mesmos, mas usados pelas duas equipes de forma diferente. A separação dos dados em ferramentas isoladas cria limites artificiais, o que deixa a detecção e a resolução dos problemas mais lentas do ponto de vista do desempenho e da detecção de ameaças. Além disso, é provável que os dados gerados por diferentes sistemas estejam em formatos diferentes, o que cria outros desafios para a visibilidade em toda a organização. Uma plataforma unificada, que dependa de um só esquema de dados ingeridos e armazenados, facilita a busca e a correlação das informações relevantes, melhorando a visibilidade em toda a organização.
Colaboração em ação
O OpenTelemetry, um dos projetos de maior velocidade no ecossistema da Cloud Native Computing Foundation (CNCF), é considerado o real padrão nos dados de telemetria e uma estrutura amplamente adotada nas equipes de SRE e segurança. O framework OTel Semantic Conventions reduz o tempo e o esforço para consultar e correlacionar dados diversos, cria visualizações e analisa recursos para aplicações de machine learning.
Normalizar dados de segurança e observabilidade com as Convenções Semânticas OTel é uma ferramenta que reduz drasticamente a complexidade que tantas vezes dificulta a análise eficiente de software, desempenho e problemas na segurança. As equipes de SRE e segurança, juntamente com fornecedores de tecnologia, vêm adotando padrões de dados abertos para viabilizar a análise holística de dados diversos e heterogêneos.
3. Detecção de anomalias e ameaças

O crescimento exponencial dos dados, juntamente com o ritmo acelerado da implantação de código e infraestrutura, traz o desafio de encontrar anomalias e detectar ameaças antes que elas afetem os serviços. Usando modelos de machine learning personalizáveis e prontos para uso, os recursos de AIOps detectam automaticamente as anomalias, gerando uma análise da causa-raiz e o suporte à correção. Nas soluções em observabilidade, a capacidade de reduzir o ruído depende dos dados de telemetria, incluindo métricas, logs, rastreamentos e dados de criação de perfil.
Logs, rastreamento distribuído e métricas dão uma visão do fluxo de solicitação, quantidade e tipo de solicitações, juntamente com outras características de desempenho. Esses dados correlacionados e contextuais nos sistemas distribuídos dão uma visão abrangente do comportamento da aplicação, que também pode ser usada para investigar incidentes na segurança. A análise dos dados e a identificação dos desvios com base em linhas de base históricas estabelecidas aceleram as investigações na segurança.
Com a evolução dos recursos de IA generativa e de geração aumentada de recuperação (RAG), as equipes de SRE e de segurança investigam e analisam ainda mais com assistentes interativos que entendem a linguagem natural e podem dar respostas rápidas a todos os níveis de operações e equipes de segurança, reduzindo o tempo de resolução.
Colaboração em ação
Soluções SIEM e outras tecnologias de segurança que se integram às plataformas de observabilidade usam insights de logs, métricas e rastreamentos. Essa abordagem unificada viabiliza a identificação proativa de padrões anormais, atividades suspeitas e possíveis incidentes na segurança.
Ao correlacionar picos anormais de log no tráfego da rede com as métricas de desempenho do servidor, as organizações distinguem rapidamente os picos de tráfego legítimos de possíveis ataques de DDoS. Padrões incomuns, como falhas repetidas no login ou acesso de locais incomuns, surgem rapidamente, reduzindo bastante a probabilidade de um ataque bem-sucedido.
4. Consolidação das ferramentas e redução nos custos

Além da maior visibilidade e da identificação proativa de problemas, consolidar os recursos de observabilidade e segurança em uma plataforma unificada também leva à consolidação de ferramentas que traz também o benefício da economia nos custos. Uma plataforma unificada reduz o custo total de propriedade, pois agrupa as taxas operacionais associadas, serviços, armazenamento de dados e pessoal necessário para gerenciar ambas as práticas.
Colaboração em ação
Líder em gestão de dados em nuvem empresarial, a Informatica trocou as soluções complexas em observabilidade e SIEM pela plataforma unificada da Elastic. Isso turbinou o desempenho da aplicação e protegeu os sistemas de ameaças externas — gerando uma enorme economia no orçamento.
“Com a Elastic, temos um só fornecedor de observabilidade e SIEM. Para uma organização do nosso porte, isso representa uma economia de 50% em comparação a outras soluções", explica Amreth Chandrasehar, diretor de engenharia de ML, observabilidade e engenharia de confiabilidade do site da Informatica.
E o desempenho não precisa ser prejudicado pela consolidação. Aliás, a Informatica descobriu que é o oposto. “A funcionalidade das buscas da Elastic é incrivelmente rápida”, explica Chandrasehar. "Armazenamos trilhões de documentos, mas uma consulta de busca retorna resultados precisos em pouco mais de 10 segundos.”
5. Conformidade regulatória para o tratamento dos dados

Com o fortalecimento das práticas de segurança, as organizações cumprem os regulamentos do setor que regem o tratamento de dados de observabilidade. Ao alinhar as iniciativas de observabilidade com requisitos rigorosos de conformidade, as organizações não apenas evitam repercussões legais como inspiram confiança nas partes interessadas.
Esse alinhamento facilita a integração das ferramentas de observabilidade em um ambiente regulamentado, além de mostrar o potencial de uma relação simbiótica entre segurança e observabilidade no cumprimento desses padrões.
Colaboração em ação
Nenhum setor conhece tão bem os requisitos de conformidade quanto o financeiro. O Emirates NBD, um dos maiores grupos bancários do Oriente Médio em ativos, criou um sistema de registro centralizado que processa vários terabytes de dados por dia a partir de uma infinidade de fontes de dados. Com a Elastic no núcleo, esse novo ambiente equivale ao que o vice-presidente de plataformas de dados e nuvem do Emirates NBD, Ali Rey, caracteriza como a base de uma única fonte da verdade.
O logging centralizado dá ao banco um meio de reforçar a segurança e armazenar e recuperar os logs de auditoria exigidos pelas partes interessadas na governança. “Se há alguma contestação ou qualquer dúvida, consulta ou qualquer coisa que acontece do ponto de vista interno ou externo, temos esses logs de auditoria que não foram adulterados”, diz Rey.
Graças à migração para o logging centralizado com a Elastic, o banco expandiu o investimento original em observabilidade para segurança, a fim de detectar ameaças externas e internas.
Dê o primeiro passo em direção à visibilidade unificada dos dados
Quando funcionam em harmonia, as funções de observabilidade e segurança garantem um ambiente operacional mais seguro e confiável. A prática da segurança fortificada não é apenas uma medida defensiva essencial para a saúde dos negócios e da reputação, mas também um catalisador para a eficácia das ferramentas de observabilidade. E, em um ciclo de autoperpetuação, a postura de segurança é reforçada por discrepâncias surgidas no monitoramento da observabilidade.
Confiar em uma plataforma de dados unificada baseada, em padrões abertos para práticas de segurança e observabilidade, pode parecer uma meta distante, mas dê os passos iniciais hoje para preparar sua organização no longo prazo.
Leia o relatório do SANS, Brilhando uma luz no escuro: observabilidade + segurança, ou assista ao webinar para saber mais sobre essa estratégia emergente e como você pode tomar medidas para unificar as funções de observabilidade e segurança da sua organização.
O lançamento e o tempo de amadurecimento de todos os recursos ou funcionalidades descritos neste artigo permanecem a exclusivo critério da Elastic. Os recursos ou funcionalidades não disponíveis no momento poderão não ser entregues ou não chegarem no prazo previsto.