Mejora del rendimiento de AWS Elastic Serverless

Elastic Cloud Serverless ya es la solución definitiva para los desarrolladores que desean crear aplicaciones eficientes de búsqueda e inteligencia artificial sin la carga operativa que supone la gestión de la infraestructura. Ahora, estamos llevando el rendimiento de tus proyectos sin servidor a un nivel completamente nuevo.

Completamos una importante actualización de infraestructura para todos los proyectos de Elastic Cloud Serverless que funcionan en AWS, al migrar a hardware más nuevo y rápido. Este cambio se ha implementado automáticamente en todos los proyectos sin servidor. Ofrece mayor rendimiento y menor latencia para proyectos serverless de Elasticsearch, Elastic Observability y Elastic Security en AWS.

Beneficios clave de rendimiento para desarrolladores

La nueva infraestructura de hardware de AWS sustenta todo lo que haces con Elastic Cloud Serverless, lo que se traduce en beneficios tangibles para la velocidad y la capacidad de respuesta de tus aplicaciones.

Latencia de consulta reducida… rendimiento aumentado.

El hardware mejorado aumenta drásticamente la velocidad de los recursos informáticos, lo que significa que tus consultas de búsqueda se procesan más rápido que nunca.

Búsqueda y búsqueda vectorial: ya sea que estés ejecutando búsquedas de texto tradicionales o empleando una búsqueda vectorial de vanguardia para tus aplicaciones de inteligencia artificial generativa y RAG, verás una marcada disminución en la latencia. La evaluación interna mostró una disminución promedio del 35% en la latencia de búsqueda.
Indexación más rápida: Las tasas de ingesta de datos están optimizadas, lo que te permite indexar volúmenes masivos de datos y documentos complejos con mayor rendimiento. Esto es crucial para las aplicaciones que requieren visibilidad de datos casi en tiempo real. La evaluación comparativa interna mostró un aumento promedio del 26% en el rendimiento al indexar.

Rendimiento constante bajo carga

Elastic Cloud Serverless está diseñado para escalar dinámicamente en tiempo real y satisfacer la demanda, lo que minimiza la latencia, independientemente de tu carga de trabajo. Gracias a esta actualización de hardware, ahora el escalado es más eficaz y ofrece una mayor capacidad de respuesta.

Manejar los picos con facilidad: ya sea que te enfrentes a un aumento repentino en el tráfico de usuarios o a una ingesta masiva de datos batch, la nueva infraestructura garantiza que tus recursos de búsqueda e indexación se escalen de manera más eficiente para mantener una latencia constantemente baja.
Desacoplamiento optimizado de computación y almacenamiento: La arquitectura serverless separa computación y almacenamiento, lo que permite que las cargas de trabajo escalen de forma independiente para lograr un rendimiento óptimo y eficiencia de costos. El hardware más rápido mejora la capa de cómputo, lo que maximiza la eficiencia de este diseño desacoplado.

Por dentro: Resultados de evaluación comparativa interna

Para cuantificar el impacto de la actualización de nuestra infraestructura de AWS, el equipo de ingeniería de Elastic llevó a cabo una exhaustiva evaluación comparativa interna con una serie de cargas de trabajo sin servidor. Estas cargas de trabajo proporcionaron evidencia empírica de mejoras de rendimiento que puedes esperar en todas tus aplicaciones, independientemente de tu caso de uso.

El enfoque comparativo

Centramos nuestras pruebas en las métricas clave que afectan directamente a la experiencia de los desarrolladores y a la capacidad de respuesta de las aplicaciones: el tiempo de respuesta (es decir, la latencia) y el rendimiento en las operaciones de búsqueda e indexación.

Cargas de trabajo probadas: Las pruebas incluyeron operaciones de búsqueda de alta concurrencia típicas de las aplicaciones orientadas al usuario, consultas de búsqueda vectorial complejas y la ingesta/indexación de grandes volúmenes de datos para casos de uso de observabilidad y seguridad. En concreto, nuestra metodología de pruebas utilizó sets de datos disponibles públicamente para Rally, la herramienta de evaluación comparativa de Elastic.
- wikipedia: Un conjunto de datos derivado de un snapshot del contenido textual de Wikipedia, para medir el rendimiento de la búsqueda de texto de propósito general.
- MSMARCO-Passage-Ranking: Un conjunto de datos derivado de la comprensión de lectura automática de Microsoft (MS MARCO), para medir el rendimiento de búsqueda en campos vectoriales dispersos.
- OpenAI_Vector: Un set de datos derivado del NQ de BEIR y enriquecido con incrustaciones generadas por el modelo text-embedding-ada-002 de OpenAI, para medir el rendimiento de búsqueda en campos vectoriales densos.
Medición: Comparamos el rendimiento en la infraestructura antigua y nueva, al medir la latencia en el percentil 99 (P99) para capturar el peor de los casos, el rendimiento de latencia en la cola y las operaciones por segundo. Cada pista se ejecutó cinco veces para cada perfil de hardware para garantizar la consistencia en los resultados.
El objetivo: nuestro objetivo era validar la capacidad de la infraestructura para ofrecer un rendimiento más rápido y predecible de forma constante en todos los ámbitos, incluso durante los periodos de autoescalado rápido.

Resumen de datos de rendimiento

Los resultados confirman un aumento significativo en la eficiencia y la velocidad. Estas ganancias se traducen directamente en tiempos de respuesta más bajos para tus usuarios y menores costos operativos como resultado de la capacidad de completar la misma cantidad de trabajo con menos recursos de cómputo.

Las siguientes tablas detallan las mejoras cuantitativas. Los valores más altos son mejores para el rendimiento; los valores más bajos son mejores para la latencia.

Búsqueda de resultados del índice de referencia:

Benchmark	Comparación	Infraestructura antigua	Nueva infraestructura	Diferencial
`wikipedia` (texto sin formato)	Rendimiento de operaciones de búsqueda (ops/s)	729	1107	+52 %
`wikipedia` (texto sin formato)	Latencia de la operación de búsqueda (p99, ms)	56	35	-37 %
`MSMARCO-Passage-Ranking` (vectores dispersos)	Rendimiento de operaciones de búsqueda (ops/s)	22	31	+40 %
`MSMARCO-Passage-Ranking` (vectores dispersos)	Latencia de la operación de búsqueda (p99, ms)	108	67	-38 %
`OpenAI_Vector` (vectores densos)	Rendimiento de operaciones de búsqueda (ops/s)	475	624	+31 %
`OpenAI_Vector` (vectores densos)	Latencia de la operación de búsqueda (p99, ms)	35	22	-37 %

Resultados de referencia de indexación:

Benchmark	Comparación	Infraestructura antigua	Nueva infraestructura	Diferencial
`wikipedia` (texto sin formato)	Rendimiento de operaciones de búsqueda (ops/s)	2845	3220	+13 %
`wikipedia` (texto sin formato)	Latencia de la operación de búsqueda (p99, ms)	1769	1120	-37 %
`MSMARCO-Passage-Ranking` (vectores dispersos)	Rendimiento de operaciones de búsqueda (ops/s)	7087	8900	+26 %
`MSMARCO-Passage-Ranking` (vectores dispersos)	Latencia de la operación de búsqueda (p99, ms)	824	677	-18 %
`OpenAI_Vector` (vectores densos)	Rendimiento de operaciones de búsqueda (ops/s)	2972	3187	+7 %
`OpenAI_Vector` (vectores densos)	Latencia de la operación de búsqueda (p99, ms)	2946	2944	0 %

La ventaja adicional: reducción de costos

Aunque nuestro objetivo es ofrecer un rendimiento de baja latencia, la eficiencia del nuevo hardware también tiene un impacto directo y positivo en los costos de los proyectos de Elasticsearch.

El precio de Elasticsearch Serverless se basa en el uso, lo que significa que solo pagas por los recursos de ingesta y búsqueda que consumes. Debido a que el hardware más nuevo y rápido es más eficiente, tus cargas de trabajo a menudo completarán tareas empleando menos recursos, lo que genera una reducción de costos inherente para la mayoría de los proyectos. Obtendrás un aumento de rendimiento superior sin un precio premium: la definición de eficiencia optimizada.

¿Qué significa esto para ti, el desarrollador?

Esta actualización de infraestructura está gestionada íntegramente por Elastic, así que no tienes que mover un dedo: no hay migraciones ni cambios de configuración. La mejora es inmediata y automática en todos tus proyectos serverless basados en AWS.

Esta actualización te permite:

Crea aplicaciones más rápidas: concéntrate en la velocidad de las características, sabiendo que tu plataforma de búsqueda subyacente ofrece la velocidad que exigen tus usuarios.
Innova con confianza: despliega nuevas características de búsqueda, observabilidad y seguridad, incluidas capacidades complejas de IA, como búsqueda vectorial y clasificación de relevancia, con la seguridad de que la Platform puede manejar la carga al máximo rendimiento.
Simplifica tu stack: Usa un servicio totalmente gestionado que gestione la infraestructura, la planificación de la capacidad y el escalado, para que puedas centrarte en tu código y datos.

¿Te ha sido útil este contenido?

No es útil

Algo útil

Muy útil

Reporta un problema

Contenido relacionado

Una búsqueda, múltiples proyectos de Elasticsearch Serverless: presentación de la búsqueda entre proyectos

Elastic Cloud Serverless

18 de mayo de 2026

Una búsqueda, múltiples proyectos de Elasticsearch Serverless: presentación de la búsqueda entre proyectos

La búsqueda entre proyectos en Elastic Cloud Serverless te permite buscar datos entre proyectos aislados en un solo Elasticsearch o ES|QL: sin duplicación, sin peering de red y sin egreso de costos por copiar logs.

MP NH

Por: Michael Peterson y Najwa Harif

Búsqueda con IA de agentes y barreras de protección determinísticas en Elasticsearch para una ejecución segura de consultas

Operaciones

18 de mayo de 2026

Búsqueda con IA de agentes y barreras de protección determinísticas en Elasticsearch para una ejecución segura de consultas

Los sistemas de búsqueda con IA de agentes suelen fallar cuando los LLM generan consultas directamente. Aprende cómo las barreras de protección deterministas y la arquitectura de plano de control permiten una ejecución de consultas segura, fiable y regulada con Elasticsearch.

AM HK TR

Por: Alexander Marquardt, Honza Král y Taylor Roy

Personalización de la búsqueda en comercio electrónico: integración del historial de compras y cohortes de usuarios

Operaciones

11 de mayo de 2026

Personalización de la búsqueda en comercio electrónico: integración del historial de compras y cohortes de usuarios

Aprende a crear una experiencia de búsqueda personalizada en Elasticsearch sin infringir la gobernanza. En esta publicación se explica cómo destacar los productos que un comprador ha adquirido previamente y cómo activar políticas específicas de cohortes basadas en perfiles de usuario.

AM HK TR

Por: Alexander Marquardt, Honza Král y Taylor Roy

Percolador de Elasticsearch para la gobernanza de búsquedas en comercio electrónico: traducir búsquedas ambiguas en estrategias de recuperación controladas

Operaciones

4 de mayo de 2026

Percolador de Elasticsearch para la gobernanza de búsquedas en comercio electrónico: traducir búsquedas ambiguas en estrategias de recuperación controladas

Aprende a usar el percolador de Elasticsearch para implementar la gobernanza de búsquedas. En este blog, describimos los patrones necesarios para crear un motor de políticas regulado en producción y establecer una estrategia de recuperación controlada.

AM HK TR

Por: Alexander Marquardt, Honza Král y Taylor Roy

Creación de un plano de control para gestionar las búsquedas en el comercio electrónico

Operaciones

1 de mayo de 2026

Creación de un plano de control para gestionar las búsquedas en el comercio electrónico

Cómo construir un plano de control gobernado para el comercio electrónico que integre políticas de búsqueda conflictivas en un solo plan de ejecución (sin cambios de código).

AM HK TR

Por: Alexander Marquardt, Honza Král y Taylor Roy

Mayor rendimiento y menor latencia: Elastic Cloud Serverless en AWS recibe un aumento significativo del rendimiento

Beneficios clave de rendimiento para desarrolladores

Latencia de consulta reducida… rendimiento aumentado.

Rendimiento constante bajo carga

Por dentro: Resultados de evaluación comparativa interna

El enfoque comparativo

Resumen de datos de rendimiento

La ventaja adicional: reducción de costos

¿Qué significa esto para ti, el desarrollador?

¿Te ha sido útil este contenido?

Contenido relacionado

Una búsqueda, múltiples proyectos de Elasticsearch Serverless: presentación de la búsqueda entre proyectos

Búsqueda con IA de agentes y barreras de protección determinísticas en Elasticsearch para una ejecución segura de consultas

Personalización de la búsqueda en comercio electrónico: integración del historial de compras y cohortes de usuarios

Percolador de Elasticsearch para la gobernanza de búsquedas en comercio electrónico: traducir búsquedas ambiguas en estrategias de recuperación controladas

Creación de un plano de control para gestionar las búsquedas en el comercio electrónico

¿Estás listo para crear experiencias de búsqueda de última generación?