Enterprise Search
Medios y Entretenimiento

The Guardian: Revitalización de la industria periodística con datos sobre lecturas en tiempo real

RESUMEN

  • 360
    millones de documentos en total
  • 40
    millones de nuevos documentos por día
  • 500
    usuarios activos en toda la organización

El desafío

¿Cómo asegurarte de que el contenido web se presente y se exponga correctamente a 5 millones de lectores?

La solución

Mediante la construcción de una solución de analíticas en Elasticsearch, que procesa 40 millones de documentos por día para brindar visibilidad en tiempo real del tráfico del sitio en toda la organización.

Lo destacado de los casos de estudio

Aprovechamiento de analíticas en tiempo real

  • Realiza búsquedas ágiles en 360 millones de documentos
  • Observa el tráfico de todo el contenido en tiempo real
  • Obtén información sobre la manera en que las actualizaciones afectan al tráfico del sitio

Empodera a la organización

  • Proporciona a toda la organización información en tiempo real sobre la participación de la audiencia
  • Democratiza el acceso a analíticas a más de 500 usuarios
  • Fomenta una cultura de exploración e innovación entre todos los empleados

Manteniéndose al día con el cambiante ciclo de noticias

Fundado en 1821 como un periódico con base en el Reino Unido, hoy The Guardian es un proveedor global de contenido de noticias. El sitio de la compañía, theguardian.com, es uno de los sitios web más populares del mundo, con 5 millones de visitantes únicos por día: es el tercer sitio web más grande del mundo de un periódico de habla inglesa.

Ophan, el sistema de analíticas desarrollado internamente por The Guardian, permite que los usuarios de toda la empresa (incluidos los editores, los periodistas, el equipo de optimización de búsqueda y los desarrolladores) vean en tiempo real exactamente cómo interactúan los usuarios con el contenido. En el entorno de las noticias, que cambia a cada minuto, la visibilidad en tiempo real es invaluable. The Guardian aprovecha los datos generados por Ophan para garantizar que el contenido se exponga en el momento adecuado, en las plataformas de redes sociales adecuadas, con los titulares adecuados.

Procesamiento de 40 millones de documentos por día en Elasticsearch

"Antes de que Elasticsearch permitiera a The Guardian desarrollar Ophan, usábamos un paquete de analíticas tradicional que tenía un retraso de cuatro horas", recuerda Graham Tackley, director de Arquitectura de The Guardian. "Tratar de conseguir datos de ese sistema era horrible. Era espantosamente lento. Así que simplemente no teníamos la capacidad de ver los resultados de lo que habíamos hecho, de obtener alguna pista. Trabajábamos a ciegas".

Elasticsearch le dio a The Guardian la libertad de construir un sistema de analíticas interno muy poderoso, en lugar de confiar en una solución de analíticas genérica y hecha en serie. Con el respaldo de Elasticsearch, procesando 40 millones de documentos por día y entregando resultados en tiempo real, Ophan se ha convertido en una herramienta de analíticas empresariales para toda la organización, con más de 500 usuarios activos. Una gran parte del negocio de The Guardian se basa en el uso de Elasticsearch para comprender cómo se consume su contenido.

Los casos de uso de Elasticsearch en The Guardian son variados: la visibilidad que ofrece el sistema de analíticas se usa para ver cuántos resultados recibe cada elemento de contenido; qué titulares y contenidos generan más tráfico; desde donde se envía el tráfico; en qué plataformas de redes sociales promover contenido específico y cuándo hacerlo para obtener la máxima exposición; y qué enlaces proporcionarle al lector para que haga clic a continuación. Los ingenieros incluso están usando Elasticsearch para diagnosticar problemas de rendimiento del sitio web mediante la búsqueda de eventos.

"Elasticsearch permite que nuestro equipo se centre en mejorar el contenido y los titulares, y en la promoción del contenido", señala Tackley. "Se trata de brindar una gran experiencia al usuario y de mostrarle qué podría interesarle a continuación. Naturalmente, también es bueno para nosotros porque obtenemos más clics, pero también es bueno para el lector porque le brinda contenido que le interesa".

Screenshot of The Guardian’s Elasticsearch-back Ophan analytics dashboard

Respuesta al cambio en tiempo real

"Somos una organización de noticias", explica Tackley. "Necesitamos responder a la agenda de noticias. Una parte importante de nuestro contenido obtendrá mucho tráfico en muy poco tiempo. En ese tipo de situaciones, tenemos que ser capaces de responder en el momento de auge, por lo que necesitamos tener la información de inmediato. Si esperásemos hasta el final del día para ver qué está pasando, sería demasiado tarde".

Elasticsearch proporciona visibilidad en tiempo real. The Guardian necesita asegurarse de que se está promoviendo el contenido adecuado en las redes sociales correctas en el momento adecuado. "Elasticsearch mejora nuestra comprensión del efecto de las redes sociales en nuestro tráfico y nos ha permitido usar mejor las plataformas de las redes sociales", señala Tackley.

"Como parte del proceso editorial, es muy importante entender qué contenido recibe tráfico y qué contenido no lo recibe".

– Graham Tackley, Director de Arquitectura de The Guardian

Democratización del acceso a analíticas

Además de impulsar una mejora en tiempo real, minuto a minuto, The Guardian también impulsa una mejora general del sitio porque toda la organización está aprendiendo cómo refinar el contenido y los titulares para satisfacer las expectativas de los lectores.

"Como parte del proceso editorial, es muy importante entender qué contenido recibe tráfico y qué contenido no lo recibe", explica Tackley. "Uno de los grandes logros que hemos podido alcanzar mediante el uso de Elasticsearch es ayudar a los periodistas a que investiguen la audiencia de su contenido. Estamos democratizando el acceso a los datos para que los editores y los periodistas puedan aprender y explorar por su cuenta. Elasticsearch fomenta una cultura de la autoexploración que es muy emocionante".

Y continúa: "Hemos visto un cambio de actitud dentro de la organización. Hace un par de años, solo los directivos de alto nivel podían ver los datos de tráfico. A los demás, la posibilidad de ver los datos de tráfico nos preocupaba, porque temíamos que nos convirtiera en un periódico sensacionalista. Hoy, todos los que forman parte de la organización entienden que la capacidad de ver qué está sucediendo con su contenido los ayuda a hacer su trabajo".

Escalabilidad, sin sacrificar la productividad

"El escalado de Elasticsearch ha sido fantástico para nosotros", asegura Tackley. "Cuando producimos una nueva característica que estresa a Elasticsearch más de lo que esperábamos, agregamos capacidad a nuestro cluster de Elasticsearch. Cada vez que lo hacemos, funciona a la perfección. La capacidad de escalar rápido ha sido invaluable para acelerar la innovación en nuestra organización".

"El hecho de que solo tengamos que hacer optimizaciones bastante pequeñas para poder realizar un facetado bastante complejo es una gran ventaja", añade Phil Wills, arquitecto de software sénior en The Guardian. "Podemos hacer búsquedas en más de 360 millones de documentos sin la necesidad de invertir enormes cantidades de tiempo en la optimización; además, Elasticsearch nos ha permitido hacerlo con un pequeño equipo de desarrollo, sin tener que invertir todo nuestro tiempo trabajando en este aspecto. Sin Elasticsearch no habríamos podido implementar una serie de características que tenemos, en el margen de tiempo que tenemos".

"Cuando presentamos una nueva característica que destaca a Elasticsearch más de lo que esperábamos, agregamos capacidad a nuestro cluster de Elasticsearch. Cada vez que lo hacemos, funciona a la perfección. La capacidad de escalar rápido ha sido invaluable para acelerar la innovación en nuestra organización".

– Graham Tackley, Director de Arquitectura de The Guardian

Productos usados

Los beneficios de The Guardian al usar Elasticsearch

  • Más visualizaciones de las páginas

    Elasticsearch ayuda a The Guardian a mejorar el contenido, los titulares y la promoción de diversas maneras, lo que en última instancia incrementa la cantidad de vistas en las páginas y el éxito del sitio.

  • Mejoras en la experiencia del usuario

    The Guardian usa analíticas impulsadas por Elasticsearch para proporcionar a los lectores más contenido que satisfaga sus demandas, lo que mejora la experiencia del usuario en el sitio web de la organización.

  • Empoderamiento del equipo

    El acceso a Elasticsearch en toda la organización ha empoderado a editores y periodistas para que participen más y para que adopten un enfoque proactivo en el proceso de mejora del sitio y su contenido.

  • Mejoras en el rendimiento del sitio

    El equipo de operaciones de TI de The Guardian usa Elasticsearch para hacer un seguimiento de cómo los cambios afectan el rendimiento del sitio, diagnosticar problemas y mantener el sitio en funcionamiento con el máximo rendimiento.