Caricamento...
img

La ricerca full text migliora il tuo business

Creato da Francesco Bianco, il 03/02/2020

Oggi giorno siamo letteralmente travolti dai dati, soprattutto in ambito professionale siamo destinatari di costanti moli di informazioni, che nostro malgrado, siamo costretti a ignorare. Ogni dispositivo che usiamo, ogni servizio di cui siamo utenti, genera costantemente dati, sappiamo che essi ci sono, ma non sappiamo trasformare questi dati in un elemento di vantaggio per il nostro business. Gli ostacoli alla loro elaborazione spesso sono: il tempo richiesto per poterli consultare e la complessità per poterli raggruppare insieme in un unico sistema di ricerca. Ad esempio, quanto sarebbe utile confrontare le informazioni fornite dai GPS nelle nostre automobili, con quelli presenti nel nostro CRM aziendale? Oppure, mettere insieme i report dei consumi elettrici dei macchinari industriali con i cicli di manutenzione degli impianti? Perché la loro analisi ci rischia di rallentare? Morale della favola, non ci resta che archiviarli qua e là per poi sperare di avere il tempo di consultarli. E invece no! La soluzione è a portata di mano, ed è pure gratuita!

La soluzione

Elasticsearch è la risposta a tutti i vostri problemi di ricerca e analisi di dati distribuiti, con il software Elasticsearch e tutti i suoi strumenti potrai facilmente costruire un'infrastruttura di analisi di dati provenienti dalle più disparate tipologie di sorgenti, tutto questo perché lo stack ELK costituito da Elasticsearch, Logstash e Kibana si basa su API semplici da usare e facilmente integrabili con tutti i sistemi esistenti. Prima di andare oltre chiariamo alcuni aspetti, cosa vuol dire API? Si tratta di una sigla che indica l'acronimo inglese di Application Programming Interface, cioè Interfaccia di Programmazione Applicazioni, nello specifico Elasticsearch utilizza uno standard molto popolare chiamato REST API usato da quasi il 70% di tutti i servizi presenti sul mercato; ovviamente non preoccupatevi se i vostri software fanno parte del 30% che non usa la tecnologia REST API, perché con molta probabilità esisterà uno strumento di conversione che verrà in vostro aiuto. Puoi pensare ad Elasticsearch come ad un vero e proprio database che contiene tutti i dati che possono interessate il tuo business.

Dietro le quinte

Il segreto di Elasticsearch consiste nel suo potente sistema di indicizzazione e di ricerca, cerchiamo di comprendere cosa vuol dire indicizzare, una definizione molto intuitiva di indicizzazione è derivata dall'idea di assegnare ad ogni documento di un archivio un posto dentro un indice alfanumerico, come ad esempio il vecchio elenco telefonico, nel quale conoscendo il cognome e il nome di una persona potrete trovare il suo numero di telefono. Questo concetto così semplice ma ripetuto all'ennesima potenza porta Elasticsearch a gestire simultaneamente milioni di indici, permettendo di fatto la ricerca in tempo reale. Inoltre, incrociando i documenti si potranno trovare similitudini, affinità, discrepanze, o ridondanze nei dati. Elasticsearch processa i documenti in un formato standard chiamato JSON, esso garantisce un'elevata compatibilità con sistemi esistenti ma inoltra è dotato un elevato grado di flessibilità ed adattabilità ad ogni contesto. Infatti, oggi sono trattati in formato JSON dati meteorologici, dati sismici, dati generati da apparecchiature mediche, dati generati da macchinari industriali, etc... 

Il coltellino svizzero

La ricerca "full text" rappresenta un ulteriore punto di forza di Elasticsearch, non entriamo nel merito della definizione tecnica di ricerca "full text" ma per intenderci questo tipo di ricerca fornisce risultati che sono estrapolati in maniera smart, simile a come Google vi trova il titolo di una canzone partendo da alcune parole contenute nel testo, oppure il nome di un attore se digitate il titolo di un suo film. Usare la ricerca "full text" nei propri documenti potrebbe darvi risultati che neanche potete immaginare, ma che in realtà sono nascosti tra le righe.  

Connettiamoci

Il secondo elemento nello stack ELK è sicuramente quello più tecnico da conoscere ma è quello che permette ad Elasticsearch di essere mantenuto costantemente aggiornato con i dati delle sorgenti. Si tratta di Logstash, il suo compito è quello di leggere una sorgente, estrapolare i dati fondamentali richiesti dal vostro business, preparare il pacchetto JSON ed inviarlo a Elasticsearch, tutto questo in maniera continua nel tempo. Il ruolo di Logstash è quello di pulire e rendere leggibile il dato grezzo, avendo così una funzione di filtro per ciò che potrebbe risultare inutile da processare. Logstash risulta lo strumento essenziale se i dati che volete processare sono conservati nei molto popolari file LOG, quei file che tutti i sistemi generano per tracciare il loro utilizzo, spesso in questo tipo di file vengono riportati errori che il sistema a riscontra, tentativi di accesso fraudolenti, allarmi di vario genere, e altri eventi anomali. Insomma, Logstash è l'anello di congiunzione tra Elasticsearch ed il mondo esterno.

L'oracolo del sapere

Se Elasticsearch è il nostro database, Kibana è il nostro cruscotto di osservazione e consultazione dei dati. Lo strumento Kibana permette di visualizzare i risultati della ricerca poterli organizzare sotto forma di grafici, permette anche di incrociare grafici temporali ad esempio per poter fare dei confronti con dati di diversi periodi storici. Le combinazioni di visualizzazione dei dati in Kibana sono infinite, partendo dai grafici standard, come gli istogrammi e i grafici a torta, si può arrivare alle mappe geografiche o addirittura agli algoritmi di intelligenza artificiale.

Conclusioni

Se siete stanchi di rinunciare a interconnettere il vostro business con i dati in vostro possesso e volete cominciare a provare Elasticsearch da subito, potete farlo gratuitamente! Lo stack ELK è Open Source il che vuol dire che potrete utilizzarlo tranquillamente nella vostra azienda, con licenza valida e tutti i diritti di cui necessitate. Vi basterà una workstation e potrete installare tutto al suo interno, trovate tutto sul sito ufficiale di Elastic https://www.elastic.co/start.
Se invece volete saperne di più sul mondo Elasticsearch e volete portare il vostro team aziendale alla metodologia di analisi dei dati non esitate a contattarci.