Logstash pour les devs - 31 - Glossaire Logstash de A a Z

Tous les termes Logstash de la serie, définis simplement avec des liens vers les articles correspondants.

  1. 01 Logstash pour les devs - 00 - Pourquoi Logstash existe encore en 2026
  2. 02 Logstash pour les devs - 01 - L'Elastic Stack de A a Z
  3. 03 Logstash pour les devs - 02 - Installer Logstash avec Docker en 5 minutes
  4. 04 Logstash pour les devs - 03 - Anatomie d'un pipeline Logstash
  5. 05 Logstash pour les devs - 04 - Inputs stdin et file : lire des donnees locales
  6. 06 Logstash pour les devs - 05 - Input Beats : recevoir des logs de Filebeat
  7. 07 Logstash pour les devs - 06 - Inputs HTTP, TCP et UDP : recevoir des donnees réseau
  8. 08 Logstash pour les devs - 07 - Inputs Kafka et JDBC : sources avancees
  9. 09 Logstash pour les devs - 08 - Les codecs : decoder et encoder les donnees
  10. 10 Logstash pour les devs - 09 - Le filtre Grok : parser n'importe quel log
  11. 11 Logstash pour les devs - 10 - Le filtre Dissect : parser sans regex
  12. 12 Logstash pour les devs - 11 - Le filtre Mutate : transformer les champs
  13. 13 Logstash pour les devs - 12 - Filtres Date et GeoIP : temps et geolocalisation
  14. 14 Logstash pour les devs - 13 - Filtres KV, JSON et XML : parser les formats structures
  15. 15 Logstash pour les devs - 14 - Le filtre Ruby : quand les autres ne suffisent pas
  16. 16 Logstash pour les devs - 15 - Filtres Aggregate et Metrics : correler les événements
  17. 17 Logstash pour les devs - 16 - Conditionnels et contrôle de flux
  18. 18 Logstash pour les devs - 17 - Output Elasticsearch : envoyer les donnees
  19. 19 Logstash pour les devs - 18 - Outputs file, stdout et les autres
  20. 20 Logstash pour les devs - 19 - Gerer le multiline : stack traces et logs multi-lignes
  21. 21 Logstash pour les devs - 20 - Pipelines multiples et pipeline-to-pipeline
  22. 22 Logstash pour les devs - 21 - Performance et tuning Logstash
  23. 23 Logstash pour les devs - 22 - Monitoring Logstash : metriques et alertes
  24. 24 Logstash pour les devs - 23 - Dead Letter Queue : ne plus perdre d'événements
  25. 25 Logstash pour les devs - 24 - Sécurité Logstash : SSL, auth et secrets
  26. 26 Logstash pour les devs - 25 - Debugger un pipeline Logstash
  27. 27 Logstash pour les devs - 26 - Tester ses pipelines avant la prod
  28. 28 Logstash pour les devs - 27 - Cas pratique : centraliser des logs applicatifs
  29. 29 Logstash pour les devs - 28 - Cas pratique : ETL avec Logstash et PostgreSQL
  30. 30 Logstash pour les devs - 29 - Cas pratique : enrichir des donnees en temps réel
  31. 31 Logstash pour les devs - 30 - Logstash en production : architecture et bonnes pratiques
  32. 32 Logstash pour les devs - 31 - Glossaire Logstash de A a Z

31 - Glossaire Logstash de A a Z

Ce que tu vas trouver ici

Tous les termes techniques de la serie, définis en 1-2 phrases avec un lien vers l'article ou ils sont expliques en détail. Ce glossaire sert de référencé rapide.


A

Aggregate (filtre) : filtre qui regroupe plusieurs événements en un seul en utilisant un identifiant de correlation (task_id). Necessite pipeline.workers: 1. Voir article 15.

API de monitoring : API REST exposee par Logstash sur le port 9600. Donne acces aux statistiques de sante, de performance et aux hot threads. Voir article 22.

Auto_offset_reset : paramètre de l'input Kafka qui definit le comportement au premier démarrage. earliest lit depuis le début du topic, latest ne lit que les nouveaux messages. Voir article 07.

B

Backpressure : mecanisme qui ralentit l'input quand le pipeline ne peut pas suivre. Filebeat bufferise en local, Kafka garde les messages dans le topic. Voir article 05.

Batch size : nombre d'événements traites en un seul lot par un worker (pipeline.batch.size, défaut 125). Un batch plus grand réduit l'overhead mais augmente la latence. Voir article 21.

Beats : famille d'agents legers de collecte de donnees (Filebeat, Metricbeat, Heartbeat). Filebeat est le plus utilise, il lit des fichiers de log et les envoie a Logstash. Voir article 05.

Bool query : pas un terme Logstash mais Elasticsearch. Combinaison de conditions must/should/must_not/filter pour la recherche.

Bulk API : API d'Elasticsearch utilisee par l'output Logstash pour envoyer des lots de documents en une seule requête HTTP. Voir article 17.

C

Codec : composant qui decode les donnees a l'entree du pipeline (bytes -> événement) et encode les donnees a la sortie (événement -> bytes). Exemples : json, plain, rubydebug, multiline. Voir article 08.

Conditionnel : structure if/else if/else qui contrôle le flux du pipeline. Permet de router les événements selon leurs champs, tags ou type. Voir article 16.

Consumer group : identifiant Kafka qui relie plusieurs consumers. Les partitions d'un topic sont reparties entre les consumers du meme groupe. Voir article 07.

Convert : opération du filtre mutate qui change le type d'un champ (string -> integer, float, boolean). Voir article 11.

D

Date (filtre) : filtre qui parse un timestamp dans un champ string et le convertit en objet date. Utilise pour ecraser @timestamp avec le vrai timestamp du log. Voir article 12.

Dead Letter Queue (DLQ) : file d'attente sur disque qui recoit les événements rejetes par Elasticsearch. Permet de les corriger et re-indexer. Voir article 23.

Dissect (filtre) : filtre de parsing qui decoupe le texte sans regex, en se basant sur des delimiteurs fixes. 5 a 10 fois plus rapide que Grok. Voir article 10.

Drop (filtre) : filtre qui supprime un événement du pipeline. L'événement ne passe pas aux filtres suivants et n'est pas envoye a l'output. Voir article 16.

E

Elastic Stack : ensemble de quatre outils : Elasticsearch (stockage/recherche), Logstash (transformation), Kibana (visualisation), Beats (collecte). Anciennement "ELK". Voir article 01.

Elasticsearch (output) : output le plus utilise. Envoie les événements dans Elasticsearch via la Bulk API. Voir article 17.

Event : unité de donnees dans Logstash. Un objet avec des champs (@timestamp, message, etc.) qui traverse le pipeline. Voir article 03.

F

Fan-out : pattern ou un événement est envoye a plusieurs outputs (Elasticsearch + Kafka + fichier). Voir article 18.

Filebeat : agent leger (15 Mo RAM) qui lit des fichiers de log et les envoie a Logstash ou Elasticsearch. Gere la position de lecture et le retry. Voir article 05.

Filter : bloc central du pipeline qui transforme les événements. Les filtres s'executent dans l'ordre du fichier .conf. Voir article 03.

G

GeoIP (filtre) : filtre qui ajoute la geolocalisation (pays, ville, coordonnees) à partir d'une adresse IP. Utilise la base MaxMind GeoLite2. Voir article 12.

Grok (filtre) : filtre de parsing base sur des patterns regex nommes. %{PATTERN:field} extrait un champ. Le filtre le plus utilise et le plus lent. Voir article 09.

Grok Debugger : outil en ligne ou dans Kibana pour tester des patterns Grok sur des lignes de log. Voir article 09.

_grokparsefailure : tag ajoute a un événement quand aucun pattern Grok ne matche. Voir article 09.

H

Heap (JVM) : mémoire allouee a la machine virtuelle Java. Controllee par -Xms et -Xmx. Ne pas dépasser 50% de la RAM totale. Voir article 21.

Hot threads : endpoint de l'API de monitoring (_node/hot_threads) qui montre les threads les plus actifs. Utile pour identifier le bottleneck. Voir article 22.

HTTP (input) : input qui transforme Logstash en serveur HTTP. Recoit des requêtes POST (webhooks, logs applicatifs). Voir article 06.

I

ILM (Index Lifecycle Management) : fonctionnalité d'Elasticsearch qui gere le cycle de vie des index : rollover, warm, cold, delete. Voir article 17.

Index template : modèle qui definit le mapping et les settings appliques automatiquement aux nouveaux index Elasticsearch. Voir article 17.

Input : premier bloc du pipeline. Lit les donnees depuis une source (fichier, Beats, HTTP, Kafka, JDBC). Voir article 03.

J

JDBC (input) : input qui exécuté une requête SQL a intervalles réguliers et envoie les résultats dans le pipeline. Utilise pour la synchronisation base de donnees -> Elasticsearch. Voir article 07.

jdbc_static (filtre) : filtre d'enrichissement qui charge des donnees SQL en mémoire et fait des lookups sans appel réseau par événement. Voir article 29.

JSON (codec) : codec qui parse un objet JSON complet par message. Chaque champ JSON devient un champ de l'événement. Voir article 08.

json_lines (codec) : codec qui parse un objet JSON par ligne (format NDJSON). Voir article 08.

K

Kafka (input/output) : Logstash peut lire et écrire dans des topics Kafka. L'input gere les consumer groups et les offsets. Voir article 07.

Keystore : stockage chiffre de secrets (mots de passe, API keys) accessible via ${VARIABLE} dans les fichiers .conf. Voir article 24.

KV (filtre) : filtre qui parse des paires clé=valeur. Utile pour les query strings et les logs key-value. Voir article 13.

L

Logstash.yml : fichier de configuration globale de Logstash (API, log level, rechargement, DLQ). Ne definit pas les pipelines. Voir article 02.

M

@metadata : champ special invisible dans les outputs. Utilise pour stocker des informations de routage et de debug sans polluer les donnees. Voir article 03.

Metrics (filtre) : filtre qui calcule des compteurs et des percentiles en temps réel sur les événements. Voir article 15.

Multiline : regroupement de plusieurs lignes en un seul événement. Necessaire pour les stack traces Java, Python, etc. Voir article 19.

Mutate (filtre) : filtre de transformation de champs : rename, remove, convert, gsub, lowercase, split, join, copy. Le plus utilise apres Grok. Voir article 11.

N

NDJSON : Newline Delimited JSON. Un objet JSON par ligne. Format standard pour les fichiers de log JSON et le codec json_lines.

O

Offset : position de lecture dans un topic Kafka. Gere par consumer group. Permet a Logstash de reprendre ou il s'est arrêté apres un redemarrage. Voir article 07.

Output : dernier bloc du pipeline. Envoie les événements vers une destination (Elasticsearch, Kafka, fichier, HTTP, S3). Voir articles 17 et 18.

P

Persistent queue : queue sur disque qui survit aux crashes de Logstash. Activee avec queue.type: persisted. Voir article 21.

Pipeline : chaîne de traitement définie dans un fichier .conf : input -> filter -> output. Voir article 03.

Pipeline-to-pipeline : communication entre pipelines via les plugins pipeline input/output. Permet les patterns distributeur et collecteur. Voir article 20.

Pipelines.yml : fichier qui definit les pipelines a charger, avec leurs paramètres individuels (workers, batch_size, queue). Voir article 20.

Plugin : composant modulaire de Logstash. Chaque input, filter, output et codec est un plugin. Voir article 03.

Q

Queue : file d'attente interne entre les inputs et les workers. Deux types : memory (défaut, rapide) et persisted (disque, durable). Voir article 21.

R

Rubydebug (codec) : codec de sortie qui affiche les événements dans un format lisible avec indentation. Utilise pour le debug. Voir article 08.

Ruby (filtre) : filtre qui exécuté du code Ruby pour des transformations complexes. L'API Event donne acces aux champs (event.get, event.set). Voir article 14.

S

Sincedb : fichier interne du plugin file input qui enregistre la position de lecture dans chaque fichier. Permet de reprendre apres un redemarrage. Voir article 04.

sql_last_value : variable du JDBC input qui contient la dernière valeur de la colonne de tracking. Utilisee pour la synchronisation incrementale. Voir article 07.

SSL/TLS : chiffrement des communications entre Filebeat et Logstash, et entre Logstash et Elasticsearch. Voir article 24.

stdout (output) : output qui affiche les événements dans la console. Avec le codec rubydebug pour le dev, json pour la prod. Voir article 18.

T

@timestamp : champ système qui contient la date/heure de l'événement. Utilise par Kibana pour la timeline. Mis à jour par le filtre date. Voir article 12.

Tags : tableau de strings attache a un événement. Ajoutes par les inputs, filtres ou erreurs (_grokparsefailure). Utilisees dans les conditionnels pour le routage. Voir article 16.

Translate (filtre) : filtre de lookup statique qui remplace une valeur par une autre selon un dictionnaire (YAML ou inline). Voir article 29.

Type : champ special défini dans l'input (type => "nginx"). Utilise dans les conditionnels pour router les événements par source. Voir article 16.

U

Upsert : créer un document Elasticsearch s'il n'existe pas, le mettre à jour s'il existe. Realise avec document_id et action => "index". Voir article 17.

W

Workers : threads de traitement qui executent les filtres et outputs en parallèle (pipeline.workers). Défaut : nombre de CPUs. Voir article 21.

X

XML (filtre) : filtre qui parse du XML et extrait des champs avec XPath. Voir article 13.


Precedent : 30 - Logstash en production

La serie complète

# Article
00 Pourquoi Logstash existe encore en 2026
01 L'Elastic Stack de A a Z
02 Installer Logstash avec Docker
03 Anatomie d'un pipeline
04 Inputs stdin et file
05 Input Beats et Filebeat
06 Inputs HTTP, TCP, UDP
07 Inputs Kafka et JDBC
08 Les codecs
09 Le filtre Grok
10 Le filtre Dissect
11 Le filtre Mutate
12 Filtres Date et GeoIP
13 Filtres KV, JSON, XML
14 Le filtre Ruby
15 Aggregate et Metrics
16 Conditionnels et contrôle de flux
17 Output Elasticsearch
18 Outputs file, stdout et autres
19 Gerer le multiline
20 Pipelines multiples
21 Performance et tuning
22 Monitoring
23 Dead Letter Queue
24 Sécurité
25 Debugging
26 Testing
27 Cas pratique : logs applicatifs
28 Cas pratique : ETL PostgreSQL
29 Cas pratique : enrichissement
30 Logstash en production
31 Glossaire

Réservez un audit gratuit de 30 minutes. Je vous montre concrètement ce qu'on peut automatiser.