Cuando introduces una pregunta en el frontend, se envía una petición POST al endpoint /api/chat . El cuerpo de la solicitud debe incluir la pregunta del usuario, en el siguiente formato:
La respuesta de la aplicación es un flujo de eventos, tal y como se define en la especificación de Eventos Enviados por el Servidor (SSE). Los eventos que el servidor devuelve al cliente tienen la siguiente secuencia:
data: [SESSION_ID] session-id-assigned-to-this-chat-sessiondata: [SOURCE] json-formatted-document(repetido para cada fuente relevante del documento identificada)data: response chunk(repetido para cada fragmento de respuesta devuelto por el LLM)data: [DONE]
El cliente puede elegir hacer una pregunta de seguimiento agregando un argumento de session_id cadena de consulta a la URL de la solicitud.
La lógica de alto nivel para el endpoint del chatbot está en la función api_chat() de la aplicación Flask, en la API de archivo/app.py:
La función ask_question() en la API/chat.py de archivos es una función generadora que transmite los eventos descritos anteriormente empleando la función de streaming de respuesta de Flask, que se basa en la palabra clave yield :
Previamente
IngestaPróximo
Fase de recuperación