AIOps: intelligenza artificiale a supporto dell’IT Operations

Scenario

Il termine DevOps, proveniente da “Development” e “Operation”, rappresenta l’insieme di attività necessarie per pianificare, sviluppare, rilasciare e manutenere un prodotto software o un’infrastruttura informatica. In questo contesto, ogni procedura è propedeutica alla successiva ed è fondamentale che i team che si occupano di ogni fase siano coordinati e allineati riguardo a tutte le informazioni, requisiti e dettagli relativi al software che si sta sviluppando. L’approccio DevOps prevede quindi la collaborazione tra i team che si occupano di sviluppo e i team che si occupano di operation. DevOps fornisce numerosi vantaggi come: collaborazione tra team, coinvolgimento dei team su tutte le fasi di progetto, aumento della velocità dei cicli di rilascio, capacità di rispondere tempestivamente a nuovi requisiti.

Nonostante ciò, l’approccio DevOps può essere migliorato grazie a tecnologie di intelligenza artificiale generativa sotto diversi aspetti, tra i principali: la gestione di grandi quantità di dati provenienti da fonti eterogenee, la reattività nell’identificare nuove necessità del cliente, l’efficienza nella diffusione dello stato attuale del progetto a tutti i team. L’utilizzo di soluzioni basate su intelligenza artificiale generativa può fornire uno sprint vigoroso in termini di efficienza e tempi di reazione a tutte le procedure DevOps ben rodate che una company come Technology Reply possiede.


Soluzione

Da sempre al passo con le tecnologie più all’avanguardia, Technology Reply propone ai propri clienti innovative soluzioni che implementano i concetti di AIOps con l’obiettivo di rendere performanti tutte le fasi del ciclo di vita del software e della gestione di infrastrutture informatiche.

AIOps, proveniente da “Artificial Intelligence” e “Operations”, prevede l’utilizzo di algoritmi di machine learning, intelligenza artificiale generativa e approcci di automazione nelle operazioni tipiche del paradigma DevOps. Gli algoritmi di AI permettono di semplificare e velocizzare processi ripetitivi e schematizzati, talvolta eseguendo tali processi senza alcun intervento umano. È inoltre possibile rimuovere gli elementi di distrazione estraendo e sintetizzando le informazioni più rilevanti, in modo da fornire all’esperto informatico umano solo i dettagli essenziali per svolgere l’attività al meglio.


Le soluzioni tecnologiche possibili in questo contesto sono principalmente basate su Large Language Models (LLM) e approcci come prompt engineering, fine-tuning e Retrieval-Augmented Generation (RAG). Le LLM sono modelli linguistici di grandi dimensioni che hanno il compito di generare risposte in seguito ad una domanda posta da un utente. Tali modelli sono in grado di far ciò grazie alla grandissima quantità di dati su cui sono addestrati. Per adattare i modelli LLM a esigenze specifiche di un'organizzazione, si utilizza l'approccio RAG. Questo metodo consiste nel fornire al modello non solo la richiesta di un utente, ma anche una serie di documenti pertinenti e specifici al dominio di interesse, che possono includere documenti dell'organizzazione stessa. Questi documenti fungono da fonte di dati aggiuntiva, permettendo al modello di estrarre e utilizzare conoscenze dettagliate e mirate per rispondere in modo più preciso alle richieste ricevute. Mentre per adattare i modelli LLM a task di dettaglio si ricorre al fine-tuning: ossia addestrare nuovamente il modello utilizzando dati specifici all’ambito di applicazione.

Le soluzioni descritte finora possono essere agevolmente implementate grazie all’utilizzo di servizi Oracle come OCI Generative AI service. Tale servizio integra LLM basate su modelli Cohere e Meta Llama 2. L’ambiente Oracle offre inoltre la possibilità di poter personalizzare tali modelli (fine-tuning) e integrarli in soluzioni enterprise che prevedono l’utilizzo di un sistema RAG. Il tutto è supportato da cluster GPU Oracle dedicati che garantiscono privacy, affidabilità e sicurezza.

Alcuni contesti in cui è possibile adottare soluzioni di AIOps sono:

  • Assistenza service desk: chatbot in grado di sintetizzare, classificare e proporre soluzioni all’interno di un sistema di supporto informatico basato su ticket. Il chatbot ha il ruolo di un AI agent in grado di semplificare l’elaborazione di dati e supportare l’esperto informatico umano nella gestione e risoluzione di ticket operativi.
  • Analisi di eventi e log: soluzione in grado di monitorare lo stato operativo di un sistema informatico, analizzare log, individuare comportamenti non attesi e attuare autonomamente soluzioni di remediation. In aggiunta, l’esperto informatico umano può interagire con un chatbot integrato per ottenere informazioni sintetizzate sui log e sullo stato del sistema monitorato.
  • Generazione documentazione IT: sistema in grado di analizzare e documentare il codice di un prodotto software o una infrastruttura Tale sistema estrae conoscenza e informazioni di contesto che possono essere di supporto ad esperti informatici durante le fasi di mantenimento del codice, migrazione dei sistemi e di modifiche migliorative.

Vantaggi

I vantaggi di cui una organizzazione può beneficiare adottando i processi di gestione del software e dei sistemi basati su intelligenza artificiale generativa sono molteplici, tra cui:

  • Semplificazione e maggiore efficienza nella gestione di un sistema di ticketing.
  • Riduzione del carico di lavoro per il monitoraggio dei sistemi e l’esecuzione di attività sanatorie.
  • Minor tempo di risoluzione quando si verificano guasti o malfunzionamenti di software o infrastrutture IT.
  • Velocizzare lo studio di codice legacy, migliorare le fasi di mantenimento del codice e semplificare la pianificazione e l’esecuzione di migrazioni
  • Migliore osservabilità dei sistemi e condivisione dell’informazione tra team di lavoro.
  • Riduzione dei costi operativi dovuta all’automazione di processi ripetitivi e strutturati.

Il nostro team

Technology Reply offre esperienza e competenze ai propri clienti per implementare e facilitare l’utilizzo di soluzioni basate su AIOps. La business unit Cloud Operation lavora attivamente ogni giorno per approfondire le tematiche di AI generativa e per cercare nuovi use case e soluzioni che possano semplificare i processi produttivi dei propri clienti con il fine di proporre approcci all’avanguardia ed efficienti.