12 de julho de 2018

Monitoramento de Kubernetes e Containers Docker com os Beats: logs, métricas e metadados

Este post é sobre o monitoramento de um ambiente de containers, que pode incluir o Google Kubernetes Engine (GKE), o IBM Cloud Kubernetes Service e qualquer outro ambiente Kubernetes (k8s) e Docker. Neste post, usarei o IBM Cloud Kubernetes Service.

Você deve estar se perguntando por que escrevo sobre o monitoramento de containers Docker e Kubernetes. Certamente, os provedores da nuvem estão gerenciando a infraestrutura para que eu possa me preocupar apenas com a minha aplicação, certo? Você pode ter razão, mas eu sou o tipo de pessoa que lê as avaliações do Yelp mesmo se um conhecido me recomendar algum lugar, porque quanto mais informações eu tiver, melhor. Eu quero ter todos os logs e métricas da minha aplicação e do ambiente dela, e quero também poder pesquisar, visualizar e receber alertas sobre tudo isso. Aquele monitoramento comum de containers é ótimo, mas eu também vou mostrar a você um jeito interessante de usar eventos e metadados do Kubernetes para anotar o gráfico de performance da minha aplicação com notificações sobre aumento de capacidade ou atualizações sem interrupção.

Vamos definir alguns termos antes de continuar.

Log: é um carimbo de data/hora e uma mensagem. Inclui entradas típicas de log, como “NGINX iniciou às 13h42” e eventos do k8s, como “Houve um recuo em um container do NGINX reinicializando container falho às 16h20.”
Métrica: uma medida numérica coletada em período predeterminado. Por exemplo, “As vendas pelo site de e-commerce totalizaram US$ 50.000 nos últimos 10 minutos” ou “A utilização da CPU foi de 17% das 14:00:00 às 14:00:10”.

Implantação de aplicações em um cluster do Kubernetes

No meu exemplo, vou usar esta aplicação baseada em Apache HTTP Server, PHP e Redis.

Além disso, para monitorar a aplicação e a infraestrutura de containers, temos:

Uma implantação hospedada do Elasticsearch Service no Elastic Cloud.
Beats, expedidores leves de logs e métricas implantados como um DaemonSet no mesmo cluster de Kubernetes. Observe que ele pode substituir o fluentd que é geralmente implantado em um cluster de Kubernetes.

Logs e métricas

A aplicação acima é apenas uma parte de um ecossistema que está constantemente gerando informações úteis que devemos capturar. Estes são os níveis em que coletamos esses logs e métricas:

Orquestração (Kubernetes)
Hosts
Aplicação
Container (Docker)

Para coletar os dados, usamos os Beats (Filebeat, Metricbeat e Packetbeat) e os módulos System, Kubernetes e Docker juntamente com os módulos de aplicação (Apache e Redis). Implantamos um DaemonSet para cada Beat e deixamos o Kubernetes gerenciá-los. A lista parece longa, mas fique tranquilo, pois a descoberta automática dos Beats mantém a simplicidade do processo. Os detalhes sobre a implantação dos Beats para monitorar uma aplicação estão neste post e no vídeo que o acompanha. Para começar do início, confira a página de monitoramento de containers da Elastic.

Para indexar, armazenar, pesquisar, analisar e visualizar os dados, eu usei o Elasticsearch Service hospedado. A implantação do Elasticsearch Service no Elastic Cloud está detalhada em nossa página de introdução, bem como a implantação do Elasticsearch e do Kibana em um sistema que você mesmo gerencia. De um jeito ou de outro, funciona bem.

Eu mencionei Beats e módulos, e estes pontos merecem uma apresentação mais detalhada. Um Beat é um agente leve que envia dados para o Elasticsearch e para o Logstash. Em alguns casos, os Beats são implantados no ponto de origem dos dados, como em sistemas físicos ou virtuais, e, em outros, a implantação acontece paralela às fontes, por exemplo, como um DaemonSet (e esta é forma descrita neste post). Os módulos simplificam o processo de coleta, análise, indexação e visualização de formatos comuns de logs.

Isso soou meio enfadonho, mas deixe-me explicar melhor: os módulos do Elastic são uma experiência pré-empacotada. Digamos que você saiba tudo sobre o gerenciamento do Apache HTTPD Server, mas NGINX é novidade para você. Talvez você pergunte a alguém que conheça o NGINX: “O que você observa nos logs? Que métricas você acompanha? Tem como obter os greps do seu arquivo de histórico?” As respostas a essas perguntas definem os módulos Beat para mim: dashboards prontos, pesquisas salvas, parsing e coleta para um monte de coisas, como Kubernetes, Docker, NGINX, Apache, sistemas operacionais, bancos de dados, etc. Na minha experiência, é um conjunto de recursos bastante potente.

O módulo k8s coleta métricas relacionadas a pods, nós, volumes, ReplicaSets, implantações, etc. Cada métrica tem um conjunto rico de metadados para que você atrelar os dados à sua aplicação. Por exemplo, talvez você não se importe que o pod xyz esteja próximo ao limite do uso de memória, mas se a métrica aparecer como associada ao front-end da sua aplicação, você saberá o valor dessa informação para o seu negócio. Ela também coleta eventos (lembre-se de que eu incluí os eventos de Kubernetes na definição de log acima), que usaremos para enriquecer um gráfico de performance no vídeo abaixo.

O módulo do Docker coleta métricas relacionadas a containers, hosts, memória, rede, checks de saúde, etc. Assim como o módulo do Kubernetes, os metadados são muito valiosos para entender a performance da sua aplicação e do ambiente.

Há muitos outros módulos para o Filebeat e para o Metricbeat. Além disso, o Packetbeat vem com muitos dashboards para serviços como Cassandra, Flows, HTTP, MySQL, MongoDB, etc.

Assista para ver como é fácil transformar dados em inteligência acionável. O vídeo mostra:

Visualização de eventos de Kubernetes com métricas de performance da aplicação
Aprofundamento no conjunto de métricas de eventos do módulo de Kubernetes do Metricbeat
Navegação pelos eventos do Kubernetes e construção da visualização customizada

Engenharia de contexto

Banco de dados vetorial

Aplicativos baseados em busca

Logs

Proteção contra ameaças

Fluxos de trabalho

Elasticsearch

Kibana (Discover, Dashboards)

Elastic Agent Builder

AutoOps

Linguagem de consulta com barras verticais

Modelos de busca Jina AI

Elastic Cloud Serverless

Elastic Cloud Hosted

Elasticsearch autogerenciado

Busca para e-commerce

Busca para suporte ao cliente

Apps focados em buscas

Analítica de logs

Monitoramento de infraestrutura

Monitoramento da experiência digital

Monitoramento de desempenho do app

AIOps

Observabilidade do LLM

SIEM de última geração

Fluxos de trabalho para segurança

XDR e segurança de endpoint

IA para segurança

10x o valor dos seus dados

Provedor de serviços em nuvem

Ecossistema Elastic AI

Programa Search AI Partner

AV-Comparatives

Líder do Forrester Wave™

Líder do Magic Quadrant da Gartner

Líder do IDC MarketScape

Busca

Segurança

Observabilidade

Começar

Galeria de demonstrações

Downloads

Integrações

Documentos

Elastic Search Labs

Elastic Security Labs

Elastic Observability Labs

Blog

Comunidade

Eventos

Webinars

Discussão

Treinamento

Suporte

Consultoria

Monitoramento de Kubernetes e Containers Docker com os Beats: logs, métricas e metadados

Implantação de aplicações em um cluster do Kubernetes

Logs e métricas