Mentre le organizzazioni modernizzano infrastrutture e applicazioni facendo sempre più riferimento a cloud e microservizi, le loro piattaforme di raccolta dati non riescono a stare al passo con i tempi. Questo perché parliamo di applicazioni che sono state pensate nell’era pre-cloud e che non si adattano ai sistemi moderni. Inoltre, anche se è facile avviarle, le soluzioni open-source richiedono un notevole impegno per renderle scalabili, consumando risorse preziose a livello ingegneristico.
Si rischia di impegnare più tempo a creare indici, re indicizzare, suddividere in blocchi, riorganizzare il provisioning di calcolo e di storage che a trovare la causa delle scarse performance. Le soluzioni legacy hanno anche un vincolo tra calcolo e archiviazione e non è possibile distribuirle in modo indipendente, con il risultato di predisporre un’infrastruttura sottoutilizzata, il cui livello di inefficienza viene spesso trasferito ai clienti, aumentando sensibilmente il TCO.
La necessità di un nuovo approccio
Le moderne piattaforme di analisi dei dati devono poter gestire dati LIVE. Dal momento che i dati cambiano continuamente sarebbe opportuno che fossero acquisiti una sola volta, aggregati, arricchiti, trasformati e resi disponibili per qualsiasi utilizzo. Le piattaforme di dati devono essere facili da utilizzare e rendere scalabili, progettate e costruite per l’efficienza al fine di offrire un costo totale di proprietà più basso, mettendo contemporaneamente la sicurezza al primo posto.
La differenza di DataSet
DataSet sta rivoluzionando l’enorme mercato dell’analisi dei dati. In poche parole, consente di ricavare valore da tutti i tipi di dati in tutti i periodi di tempo – in streaming o storici – in tempo reale e su scala. I dati in tempo reale sono necessari perché nel mondo digitale tanto più rapidamente si derivano i dati, tanto più agile e reattiva pùò essere un’impresa
- Peak Performance: I dati sono disponibili per l’interrogazione istantaneamente dopo l’ingest in pochi secondi e le query ritornano in millisecondi anche su scala petabyte. Questo è veloce, incredibilmente veloce.
- Effortless scalability Scalabilità senza sforzo: DataSet scala elasticamente fino a una scala praticamente illimitata. Non c’è bisogno di riequilibrare i nodi, gestire lo storage o allocare le risorse. Come ha detto uno dei nostri clienti – funziona e basta!
- TCO più basso: Fornito come un servizio cloud-native, DataSet abbassa il TCO di alcuni ordini di grandezza; fornendo un valore senza precedenti a un costo senza precedenti.
Al centro si trova l’architettura unica di SentinelOne che combina alte prestazioni, un design senza indici a basso overhead e un’elaborazione parallela su larga scala che consente di ottenere un’esperienza di dati senza pari.
- Schema-Less Ingestion: i dati si presentano in molte forme diverse – strutturati, semi-strutturati o non strutturati. DataSet offre un’enorme flessibilità nella raccolta e nell’ingestione dei dati senza alcun sovraccarico di elaborazione della valutazione dello schema.
- Streaming Engine: mentre i dati scorrono attraverso il sistema, lo Streaming Engine crea visualizzazioni materializzate per le query ripetute, così le dashboard ad alta risoluzione si aggiornano, gli avvisi accurati scattano e le attività di automazione si attivano in pochi secondi.
- Index-free design: L’indicizzazione è un approccio tradizionale all’organizzazione dei dati. Gli indici causano overhead durante l’ingestione e il recupero, così come un inutile consumo di risorse per costruire e ricostruire gli indici.
DataSet utilizza un formato di dati a colonne, eliminando la necessità di mantenere cluster di indici, reindicizzazione e re-sharding dello storage.
- Massively Parallel Query Engine: il motore di query di DataSet utilizza uno scheduling orizzontale, dedicando l’intero cluster. Questa semplice potenza di calcolo grezza fornisce prestazioni senza precedenti, aumenta significativamente l’utilizzo delle risorse e quindi offre un buon rapporto costo-efficacia.
- Cost-Efficient Object Storage: l’affidabilità, la scalabilità e il costo dei sistemi di storage a oggetti come Amazon S3 non possono essere battuti. DataSet utilizza l’object store per conservare i dati storici, e abbiamo architettato il sistema per abbattere ogni barriera nel raggiungimento delle migliori prestazioni della categoria.
- Sophisticated Analytics Using PowerQuery: con DataSet PowerQuery si può andare oltre l’esplorazione e la trasformazione dei dati con un ricco set di comandi per filtrare, eseguire calcoli, estrarre nuovi campi al volo e creare raggruppamenti e riepiloghi statistici.
I Live Data sono multiuso
L’analisi in tempo reale di tutti i dati in tutti i periodi di tempo alimenta molteplici casi d’uso:
- Full-stack Log Analytics: Aggregazione istantanea, ricerca e analisi dei dati di log nell’intero stack. Non importa dove si verifichi un’anomalia, con DataSet è possibile rilevare, trattare, individuare la causa e risolvere.
- DataSet come Data Lake: DataSet rompe i silos di dati e permette ai clienti di portare tutti i loro dati e guidare la collaborazione tra i team di ingegneria, DevOps e sicurezza, ridurre il tempo di risoluzione dei problemi e prendere decisioni e azioni guidate dai dati.
Molte organizzazioni limitano i dati a causa di costi elevati, problemi di scalabilità o fonti di dati non supportate. DataSet permette ai clienti di conservare tutti i loro dati per tutto il tempo di cui hanno bisogno (long term retention) e di ridurre al minimo il costo totale di proprietà. Con la piattaforma Live Data Analytics di DataSet, tutti i vostri dati sono immediatamente disponibili – non importa dove risiedono i dati o quando sono stati acquisiti.
Per ulteriori informazioni consultare www.sentinelone.it