AIOps, acronimo di Artificial Intelligence for IT Operations, è un termine ombrello per l’uso di analytics big data, machine learning (ML) e altre tecnologie AI per automatizzare l’identificazione e la risoluzione di problemi comuni nelle operazioni IT. Nelle grandi aziende, soprattutto con i progressi nelle architetture distribuite come i container, i microservizi e gli ambienti multi-cloud, i sistemi, i servizi e le applicazioni producono immense quantità di dati di log e performance che possono ostacolare la capacità del management di individuare e risolvere errori.
Una piattaforma AIOps dovrebbe fornire la capacità di:
- Automatizzare le pratiche quotidiane. Ad esempio, AIOps può abilitare un sistema di help desk a elaborare e soddisfare automaticamente una richiesta di un utente per la fornitura automatica di una risorsa. Le piattaforme AIOps possono anche valutare un allarme e determinare che non richiede azione perché le metriche rilevanti e i dati di supporto disponibili sono entro i parametri normali.
- Riconoscere problemi gravi più velocemente e con maggiore precisione rispetto agli esseri umani. I professionisti IT potrebbero affrontare un evento malware noto su un sistema non critico, ma ignorare un download o un processo insolito su un server critico perché non stanno monitorando questa minaccia. AIOps affronta questo scenario in modo diverso: dando priorità all’evento sul sistema critico come possibile attacco o infezione perché il comportamento è fuori dal normale, e declassando l’evento malware noto eseguendo una funzione antimalware.
- Razionalizzare le interazioni tra gruppi e team del data center. AIOps fornisce a ciascun gruppo IT funzionale dati e prospettive pertinenti. Senza operazioni abilitate dall’IA, come il monitoraggio, l’automazione e il service desk, i team devono condividere, analizzare e processare le informazioni attraverso riunioni o invio manuale dei dati. AIOps dovrebbe imparare quali dati di analisi e monitoraggio mostrare a ciascun gruppo o team dalla vasta gamma di metriche delle risorse.
Come funziona AIOps?
AIOps utilizza tecnologie analitiche avanzate come il machine learning per automatizzare ed ottimizzare i processi delle operazioni IT. Tipicamente, AIOps opera seguendo i seguenti passaggi:
- Raccolta dati. Le piattaforme AIOps raccolgono informazioni da diverse fonti, tra cui log delle applicazioni, dati sugli eventi, dati di configurazione, incidenti, metriche delle prestazioni e traffico di rete. Questi dati possono essere strutturati, come i database, o non strutturati, come i post sui social media e i documenti.
- Analisi dei dati. I dati raccolti vengono analizzati utilizzando algoritmi per il rilevamento di anomalie, il rilevamento di pattern e l’analisi predittiva per trovare anomalie che potrebbero richiedere l’attenzione del personale IT. Questo passaggio assicura che i problemi reali siano separati dal rumore o dagli allarmi falsi.
- Inferenza e analisi delle cause radici. AIOps effettua l’analisi delle cause radici per aiutare a individuare le origini dei problemi. I team delle Operations IT possono cercare di prevenire la ricorrenza di problemi futuri indagando sulle cause radici dei problemi attuali.
- Collaborazione. Una volta completata l’analisi delle cause radici, AIOps notifica i team e gli individui appropriati, fornendo loro informazioni pertinenti e promuovendo una collaborazione efficiente nonostante la potenziale distanza geografica tra loro. Inoltre, questa collaborazione aiuta a conservare i dati sugli eventi che potrebbero essere essenziali per identificare futuri problemi di natura simile.
- Rimedio automatico. AIOps può rimediare automaticamente ai problemi, riducendo significativamente l’intervento manuale e accelerando la risposta agli incidenti. Questi possono essere interventi automatizzati, come la scalabilità delle risorse, il riavvio di un servizio o l’esecuzione di script predefiniti per affrontare i problemi.
Principali casi d’uso di AIOps
AIOps è generalmente utilizzato in aziende che utilizzano il cloud computing, in aziende grandi e complesse.
AIOps utilizza una combinazione di varie strategie di intelligenza artificiale, tra che fanno leva su:
- Apprendimento automatico. Può includere una varietà di tecniche come apprendimento supervisionato, apprendimento non supervisionato, apprendimento per rinforzo e deep learning. In AIOps, le tecniche sono tipicamente utilizzate per il rilevamento di anomalie, l’analisi delle cause radici, la correlazione degli eventi e l’analisi predittiva.
- Analytics. I dati AIOps provengono dai file di log, dalle metriche e dagli strumenti di monitoraggio, dai sistemi di ticketing degli help desk e da altre fonti. Le tecniche di analytics possono interpretare le informazioni grezze provenienti da queste fonti per creare nuovi dati e metadati. Analytics riduce il rumore, ovvero i dati non necessari o spurii, e individua tendenze e modelli che consentono agli strumenti di identificare e isolare problemi, prevedere la domanda di capacità e gestire altri eventi.
- Algoritmi. L’analisi richiede anche algoritmi per codificare l’esperienza IT dell’organizzazione, le politiche aziendali e gli obiettivi. Gli algoritmi consentono a una piattaforma AIOps di fornire le azioni o gli esiti desiderati; sono come il personale IT prioritizza gli eventi legati alla sicurezza e insegna le decisioni sulle prestazioni delle applicazioni alla piattaforma. Gli algoritmi formano la base per il machine learning, dove la piattaforma stabilisce una linea di base dei comportamenti e delle attività normali e può quindi evolvere o creare nuovi algoritmi man mano che i dati dell’ambiente cambiano nel tempo.
- Automazione. Le funzioni automatizzate avvengono quando vengono attivate dai risultati di analytics e machine learning. Ad esempio, le analisi predittive determinano che un’applicazione abbia bisogno di più spazio di archiviazione, quindi avvia un processo automatico per eseguire l’archiviazione aggiuntiva in incrementi conformi alle regole algoritmiche.
- Visualizzazione: dashboard, report, grafici e altre uscite leggibili, in modo che gli utenti possano seguire le modifiche e gli eventi nell’ambiente. Con queste visualizzazioni, si può agire sulle informazioni che richiedono capacità decisionali al di là di quelle del software AIOps.
Ora che avete una panoramica generale…sta a voi colmare le lacune nella vostra azienda!