Observability
Food and Beverage/Hospitality

A PepsiCo aumenta a eficiência e reduz o MTTR em 30% com o Elastic Observability

Baixar PDF

Reduz o MTTR em 30%

A PepsiCo reduziu o MTTR em 30% com o Elastic Observability para resolver problemas em questão de minutos e horas, em vez de dias.

Reduz a quantidade de ferramentas de monitoramento de 55 para menos de 20

Essa consolidação e simplificação de ferramentas contribuíram para um tempo de funcionamento de 99,9% e aumentaram a confiabilidade do serviço em todas as nossas operações digitais.

Reduz os custos de hardware em até 25% ao ano

Com o Elastic Observability no Elastic Cloud, a PepsiCo reduziu as despesas com hardware em centenas de milhares de dólares.

A PepsiCo padroniza a Elastic para alcançar o Full Stack Observability, reduzindo os tempos de resolução de incidentes em 30% e os custos de hardware em até 25% ao ano.

Os produtos da PepsiCo são apreciados por consumidores mais de um bilhão de vezes por dia em mais de 200 países e territórios no mundo. Com quase US$ 92 bilhões em receita líquida em 2024, o portfólio de produtos inclui uma ampla variedade de alimentos e bebidas, como Doritos, Cheetos, Gatorade, Pepsi-Cola, Quaker e SodaStream.

A organização fez da TI e da inovação pilares fundamentais das operações e estratégia de crescimento ao longo dos 130 anos de história. Agora, está colocando a Elastic no centro dos esforços de transformação digital, enquanto capitaliza os mais recentes avanços em machine learning e IA generativa.

Observability Full Stack com a Elastic

Ao longo dos anos, a PepsiCo investiu em um conjunto diversificado de ferramentas de observabilidade adaptadas para oferecer suporte a aplicativos individuais. Embora essa abordagem permitisse o monitoramento focado, a ausência de uma plataforma unificada limitava a capacidade de otimizar o desempenho e a confiabilidade de forma holística em infraestrutura e aplicativos críticos.

Em resposta, a empresa implantou o Elastic Observability como a base da plataforma Full Stack Observability (FSO), consolidando dados MELT (métricas, eventos, logs e rastreamentos) de mais de 38 aplicativos críticos em dashboards padronizados do Grafana. Centenas de usuários na organização confiam na plataforma, incluindo aqueles que trabalham no One PepsiCo Operation Center, em centros de comando equipados com dashboards para Full Stack Observability e Value Stream Monitoring.

Ao descrever os benefícios da Elastic, Vinod Chilakalapudi, Diretor - Observability do One PepsiCo Operations Center, enfatiza o feedback positivo dos usuários finais, incluindo os Centros de Operação. "A Elastic é a espinha dorsal da inteligência operacional da PepsiCo, possibilitando detecção proativa de anomalias, isolamento rápido da causa raiz e tempo de funcionamento quase contínuo. Isso se traduziu em reduções mensuráveis no tempo de inatividade e mais confiabilidade do serviço em nossas operações digitais", diz ele.

Desde a implantação da plataforma FSO, a PepsiCo racionalizou as ferramentas de monitoramento de 55 para menos de 20. Essa abordagem facilita a identificação e resolução proativas de problemas, resultando em uma redução de 30% no tempo médio de resolução (MTTR).

A nova plataforma também permitiu que a PepsiCo consolidasse o investimento na Elastic, permitindo mais volumes de dados e reduzindo os custos líquidos graças a acordos de licenciamento favoráveis. "Padronizamos a Elastic como o núcleo do mecanismo para ingestão e análise de dados MELT na PepsiCo, com um roadmap para cobertura de 99%. Essa base está acelerando a automação orientada por telemetria, permitindo insights contextuais e melhorando operações inteligentes em escala empresarial", diz Chilakalapudi.

"Nossa migração para o Elastic Cloud eliminou a sobrecarga da infraestrutura legada, desbloqueando economias anuais. Mais importante, permitiu escalabilidade dinâmica e observabilidade em tempo real, acelerando nossa mudança para operações nativas da nuvem".

– Vinod Chilakalapudi, Diretor - Observability no One PepsiCo Operations Center

Alcança 99,9% de tempo de funcionamento

O Full Stack Observability da Elastic transformou nossos Centros de Operação em torres de controle preditivas, interceptando problemas antes que eles escalem e reforça a resiliência dos sistemas globais da PepsiCo. A identificação e resolução rápida de problemas resulta em 99,9% de tempo de funcionamento do aplicativo. Além disso, a PepsiCo alcançou uma taxa de automação de 23% no gerenciamento de incidentes, permitindo que as equipes de TI se concentrem em iniciativas estratégicas em vez de solucionar problemas reativos.

Consolidar várias ferramentas em uma única plataforma também impulsiona a eficiência em toda a plataforma de observabilidade da PepsiCo. Com uma visão clara dos padrões de consumo, as equipes podem entender melhor as necessidades de dados, incluindo os períodos de retenção para dados prontamente acessíveis. A abordagem em camadas da Elastic, com camadas quentes, frias e congeladas, oferece inúmeras oportunidades para otimizar os custos de armazenamento.

O Elastic Observability também desempenha um papel estratégico, informando a tomada de decisões empresariais mais amplas em várias funções da PepsiCo. Com 13,7 terabytes de dados ingeridos mensalmente, incluindo 1 terabyte dedicado ao FSO, as equipes da empresa recebem insights baseados em dados para informar decisões estratégicas e aprimorar a resiliência operacional geral.

Serviços de consultoria com base em resultados

A parceria estratégica com a Elastic Consulting acelerou a otimização arquitetônica — inovando em forma de parceria os pipelines de dados, estratégias de ingestão e casos de uso de ML para impulsionar tanto a eficiência de custos quanto a velocidade de insights. Isso inclui o envio de dados diretamente para a Elastic usando pipelines, o que tem o potencial de economizar mais 20%.

Além disso, o suporte da Elastic também desempenhou um papel fundamental. "Em vez de especialistas de vários fornecedores, a equipe contou principalmente com nosso Engenheiro de Suporte Designado da Elastic, o que simplificou bastante tanto o recurso quanto a manutenção", diz Chilakalapudi. O Engenheiro de Suporte Designado (DSE) tem sido crucial durante marcos críticos, principalmente na migração do local para a nuvem.

Estado futuro com IA

Olhando para o futuro, Chilakalapudi e a equipe planejam integrar dados adicionais do MELT, aproveitando os recursos de IA da Elastic, incluindo o banco de dados vetorizado e a capacidade de integrar com segurança grandes modelos de linguagem (LLMs) usando retrieval-augmented generation (RAG). Isso permitirá a geração de alertas proativos, aumentará o tempo de funcionamento do aplicativo e reduzirá tanto o MTTR quanto o tempo médio de detecção (MTTD).

"Nossa visão é a de criar um ecossistema de observabilidade de última geração impulsionado por agentes de IA e telemetria integrada aos LLM", diz Chilakalapudi. "Os avanços da Elastic em busca vetorial e RAG se alinham com nosso roadmap para operações autônomas e orientadas por insights".

Chilakalapudi prevê expandir o uso do Elastic Observability para abranger outras funções críticas de negócios. E, na busca por mais ganhos de eficiência, ele vê oportunidades de otimizar os custos da nuvem analisando os padrões de uso para identificar medidas de economia.

"A Elastic se tornou o padrão ouro da PepsiCo para ingestão, correlação e velocidade de resolução de telemetria. Agora, ela define referências de desempenho em todo o nosso ecossistema de observabilidade".

– Vinod Chilakalapudi, Diretor - Observability no One PepsiCo Operations Center