Reading Time: 3 minutes

È appena stata rilasciata le versione 6.6.0 di Elastic Stack! Abbiamo analizzato le principali novità di questa versione. Approfondiamo alcune funzionalità che ci sembrano particolarmente interessanti:

Index Lifecycle Management

Gestire i dati presenti da tempo all’interno di un cluster può essere un’attività complessa. Soprattutto quando c’è bisogno di spostare informazioni meno rilevanti, ridurre la potenza di calcolo per l’elaborazione, eliminare repliche non necessarie e così via.
La funzionalità Lifecycle, pur essendo ancora in versione beta, introdotta in Elastic Stack 6.6.0 viene in aiuto per semplificare queste attività.

Permette infatti di suddividere gli indici in specifiche fasi: hot, warm, cold, delete

Una volta fatto questo, è possibile associare delle regole di gestione dei dati, differenti per ogni singola fase. È possibile ad esempio:

  •  Avere un shard primario su ogni nodo hot per massimizzare il throughput di indicizzazione.
  • Sostituire l’indice hot con un nuovo indice vuoto non appena l’indice esistente è “pieno” o dopo un dato periodo di tempo.
  • Spostare il vecchio indice in nodi hot, dove può essere ridotto ad un singolo shard e unito a un singolo segmento per ottimizzare la memorizzazione e l’interrogazione.
  • Spostare l’indice sui nodi cold per una conservazione più lunga e meno dispendiosa in termini di risorse

Frozen Indices

Anche questa nuova funzionalità riguarda lo stato degli indici. Questo stato permette di tenere in memoria un indice senza impatto sulla heap memory, permettendo la gestione di un numero maggiore di dati su singolo nodo. Questo incide naturalmente sulle performance di ricerca, che avranno di conseguenza una latenza maggiore.
Questa soluzione troverà sicuramente spazio a molti casi d’uso di Elasticsearch, rimanendo in linea con la flessibilità di gestione che da sempre caratterizza questa tecnologia.

.ml config index (MACHINE LEARNING)

Altra novità importante: le informazioni sui processi e le configurazioni da adesso in poi saranno registrate nell’indice .ml-config. Fino ad ora queste informazioni venivano registrate nel clusterstate. Questa funzionalità facilita molto la portabilità dei Job ML, che non dovranno essere reinizializzati da un progetto a un altro.

Per maggiori info: https://github.com/elastic/elasticsearch/pull/36698

 

Altre novità:

 

Elasticsearch SQL: introdotta nuova funzionalità di query temporale.

Machine learning: aggiunto supporto per testo annotato, gestibile direttamente da interfaccia utente.

Distributed tracing: in Beta nella precedente versione, il tracciamento distribuito è adesso passato in GA!

Fonte: Blog Elastic

Contatta Seacom

Vuoi rimanere aggiornato su tutte novità Elastic o richiedere una consulenza a Seacom?
Visita la pagina dedicata, oppure