Libérate de las operaciones con Elastic Cloud Serverless. Escala automáticamente, maneja picos de carga y concéntrate en crear: ¡inicia una prueba gratuita de 14 días para probarlo por tu cuenta!
Puedes seguir estas guías para crear una experiencia de búsqueda impulsada por inteligencia artificial o buscar en sistemas y software empresariales.
Elastic Cloud Serverless ya es la solución definitiva para los desarrolladores que desean crear aplicaciones eficientes de búsqueda e inteligencia artificial sin la carga operativa que supone la gestión de la infraestructura. Ahora, estamos llevando el rendimiento de tus proyectos sin servidor a un nivel completamente nuevo.
Completamos una importante actualización de infraestructura para todos los proyectos de Elastic Cloud Serverless que funcionan en AWS, al migrar a hardware más nuevo y rápido. Este cambio se ha implementado automáticamente en todos los proyectos sin servidor. Ofrece mayor rendimiento y menor latencia para proyectos serverless de Elasticsearch, Elastic Observability y Elastic Security en AWS.
Beneficios clave de rendimiento para desarrolladores
La nueva infraestructura de hardware de AWS sustenta todo lo que haces con Elastic Cloud Serverless, lo que se traduce en beneficios tangibles para la velocidad y la capacidad de respuesta de tus aplicaciones.
Latencia de consulta reducida… rendimiento aumentado.
El hardware mejorado aumenta drásticamente la velocidad de los recursos informáticos, lo que significa que tus consultas de búsqueda se procesan más rápido que nunca.
- Búsqueda y búsqueda vectorial: ya sea que estés ejecutando búsquedas de texto tradicionales o empleando una búsqueda vectorial de vanguardia para tus aplicaciones de inteligencia artificial generativa y RAG, verás una marcada disminución en la latencia. La evaluación interna mostró una disminución promedio del 35% en la latencia de búsqueda.
- Indexación más rápida: Las tasas de ingesta de datos están optimizadas, lo que te permite indexar volúmenes masivos de datos y documentos complejos con mayor rendimiento. Esto es crucial para las aplicaciones que requieren visibilidad de datos casi en tiempo real. La evaluación comparativa interna mostró un aumento promedio del 26% en el rendimiento al indexar.
Rendimiento constante bajo carga
Elastic Cloud Serverless está diseñado para escalar dinámicamente en tiempo real y satisfacer la demanda, lo que minimiza la latencia, independientemente de tu carga de trabajo. Gracias a esta actualización de hardware, ahora el escalado es más eficaz y ofrece una mayor capacidad de respuesta.
- Manejar los picos con facilidad: ya sea que te enfrentes a un aumento repentino en el tráfico de usuarios o a una ingesta masiva de datos batch, la nueva infraestructura garantiza que tus recursos de búsqueda e indexación se escalen de manera más eficiente para mantener una latencia constantemente baja.
- Desacoplamiento optimizado de computación y almacenamiento: La arquitectura serverless separa computación y almacenamiento, lo que permite que las cargas de trabajo escalen de forma independiente para lograr un rendimiento óptimo y eficiencia de costos. El hardware más rápido mejora la capa de cómputo, lo que maximiza la eficiencia de este diseño desacoplado.
Por dentro: Resultados de evaluación comparativa interna
Para cuantificar el impacto de la actualización de nuestra infraestructura de AWS, el equipo de ingeniería de Elastic llevó a cabo una exhaustiva evaluación comparativa interna con una serie de cargas de trabajo sin servidor. Estas cargas de trabajo proporcionaron evidencia empírica de mejoras de rendimiento que puedes esperar en todas tus aplicaciones, independientemente de tu caso de uso.
El enfoque comparativo
Centramos nuestras pruebas en las métricas clave que afectan directamente a la experiencia de los desarrolladores y a la capacidad de respuesta de las aplicaciones: el tiempo de respuesta (es decir, la latencia) y el rendimiento en las operaciones de búsqueda e indexación.
- Cargas de trabajo probadas: Las pruebas incluyeron operaciones de búsqueda de alta concurrencia típicas de las aplicaciones orientadas al usuario, consultas de búsqueda vectorial complejas y la ingesta/indexación de grandes volúmenes de datos para casos de uso de observabilidad y seguridad. En concreto, nuestra metodología de pruebas utilizó sets de datos disponibles públicamente para Rally, la herramienta de evaluación comparativa de Elastic.
wikipedia: Un conjunto de datos derivado de un snapshot del contenido textual de Wikipedia, para medir el rendimiento de la búsqueda de texto de propósito general.MSMARCO-Passage-Ranking: Un conjunto de datos derivado de la comprensión de lectura automática de Microsoft (MS MARCO), para medir el rendimiento de búsqueda en campos vectoriales dispersos.OpenAI_Vector: Un set de datos derivado del NQ de BEIR y enriquecido con incrustaciones generadas por el modelotext-embedding-ada-002de OpenAI, para medir el rendimiento de búsqueda en campos vectoriales densos.
- Medición: Comparamos el rendimiento en la infraestructura antigua y nueva, al medir la latencia en el percentil 99 (P99) para capturar el peor de los casos, el rendimiento de latencia en la cola y las operaciones por segundo. Cada pista se ejecutó cinco veces para cada perfil de hardware para garantizar la consistencia en los resultados.
- El objetivo: nuestro objetivo era validar la capacidad de la infraestructura para ofrecer un rendimiento más rápido y predecible de forma constante en todos los ámbitos, incluso durante los periodos de autoescalado rápido.
Resumen de datos de rendimiento
Los resultados confirman un aumento significativo en la eficiencia y la velocidad. Estas ganancias se traducen directamente en tiempos de respuesta más bajos para tus usuarios y menores costos operativos como resultado de la capacidad de completar la misma cantidad de trabajo con menos recursos de cómputo.
Las siguientes tablas detallan las mejoras cuantitativas. Los valores más altos son mejores para el rendimiento; los valores más bajos son mejores para la latencia.
Búsqueda de resultados del índice de referencia:
| Benchmark | Comparación | Infraestructura antigua | Nueva infraestructura | Diferencial |
|---|---|---|---|---|
| `wikipedia` (texto sin formato) | Rendimiento de operaciones de búsqueda (ops/s) | 729 | 1107 | +52 % |
| `wikipedia` (texto sin formato) | Latencia de la operación de búsqueda (p99, ms) | 56 | 35 | -37 % |
| `MSMARCO-Passage-Ranking` (vectores dispersos) | Rendimiento de operaciones de búsqueda (ops/s) | 22 | 31 | +40 % |
| `MSMARCO-Passage-Ranking` (vectores dispersos) | Latencia de la operación de búsqueda (p99, ms) | 108 | 67 | -38 % |
| `OpenAI_Vector` (vectores densos) | Rendimiento de operaciones de búsqueda (ops/s) | 475 | 624 | +31 % |
| `OpenAI_Vector` (vectores densos) | Latencia de la operación de búsqueda (p99, ms) | 35 | 22 | -37 % |
Resultados de referencia de indexación:
| Benchmark | Comparación | Infraestructura antigua | Nueva infraestructura | Diferencial |
|---|---|---|---|---|
| `wikipedia` (texto sin formato) | Rendimiento de operaciones de búsqueda (ops/s) | 2845 | 3220 | +13 % |
| `wikipedia` (texto sin formato) | Latencia de la operación de búsqueda (p99, ms) | 1769 | 1120 | -37 % |
| `MSMARCO-Passage-Ranking` (vectores dispersos) | Rendimiento de operaciones de búsqueda (ops/s) | 7087 | 8900 | +26 % |
| `MSMARCO-Passage-Ranking` (vectores dispersos) | Latencia de la operación de búsqueda (p99, ms) | 824 | 677 | -18 % |
| `OpenAI_Vector` (vectores densos) | Rendimiento de operaciones de búsqueda (ops/s) | 2972 | 3187 | +7 % |
| `OpenAI_Vector` (vectores densos) | Latencia de la operación de búsqueda (p99, ms) | 2946 | 2944 | 0 % |
La ventaja adicional: reducción de costos
Aunque nuestro objetivo es ofrecer un rendimiento de baja latencia, la eficiencia del nuevo hardware también tiene un impacto directo y positivo en los costos de los proyectos de Elasticsearch.
El precio de Elasticsearch Serverless se basa en el uso, lo que significa que solo pagas por los recursos de ingesta y búsqueda que consumes. Debido a que el hardware más nuevo y rápido es más eficiente, tus cargas de trabajo a menudo completarán tareas empleando menos recursos, lo que genera una reducción de costos inherente para la mayoría de los proyectos. Obtendrás un aumento de rendimiento superior sin un precio premium: la definición de eficiencia optimizada.
¿Qué significa esto para ti, el desarrollador?
Esta actualización de infraestructura está gestionada íntegramente por Elastic, así que no tienes que mover un dedo: no hay migraciones ni cambios de configuración. La mejora es inmediata y automática en todos tus proyectos serverless basados en AWS.
Esta actualización te permite:
- Crea aplicaciones más rápidas: concéntrate en la velocidad de las características, sabiendo que tu plataforma de búsqueda subyacente ofrece la velocidad que exigen tus usuarios.
- Innova con confianza: despliega nuevas características de búsqueda, observabilidad y seguridad, incluidas capacidades complejas de IA, como búsqueda vectorial y clasificación de relevancia, con la seguridad de que la Platform puede manejar la carga al máximo rendimiento.
- Simplifica tu stack: Usa un servicio totalmente gestionado que gestione la infraestructura, la planificación de la capacidad y el escalado, para que puedas centrarte en tu código y datos.




