Case Study

Modello di gestione dei Big Data per il digital business 

Data Reply ha implementato per RCS un modello armonizzato di gestione dei big data per abilitare nuove opportunità di digital business.

Una piattaforma su misura per la gestione dei dati

La soluzione implementata da Data Reply per RCS - uno dei principali gruppi editoriali multimediali italiani, attivo in tutti i settori dell'editoria: dai quotidiani ai magazine, dai libri alla TV, dalle radio ai new media - ha permesso di attivare un nuovo canale di monetizzazione che sfrutta il valore intrinseco delle informazioni digitali, grazie ad una piattaforma realizzata su misura che permette di trattare facilmente la complessa moltitudine di dati relativi a utenti e contenuti. RCS ha oggi a disposizione una piattaforma che gli permette di adattarsi alle crescenti esigenze di digital business delle diverse aree del Gruppo.

Esigenze e obiettivi

L’emergere e lo svilupparsi di innovative tecniche in ambito Big Data e Machine Learning ha aperto per RCS MediaGroup nuovi scenari e opportunità di business per valorizzare e monetizzare i dati relativi a utenti e contenuti, raccolti direttamente o tramite software di terze parti. Al fine di muovere i primi passi in questa direzione RCS si è rivolta a Data Reply, che grazie alla sua considerevole esperienza in questi ambiti ha progettato e implementato una piattaforma in grado di collezionare e aggregare le varie fonti di dati, per produrre i primi promettenti risultati in termini di analisi avanzate tramite modelli di machine learning.

Con un totale di 15 milioni di utenti unici mensili, l’offering online di RCS MediaGroup genera un’incredibile quantità di informazioni che può essere conservata e arricchita, sia con fonti esterne sia con relazioni sinergiche tra le fonti esistenti, per generare valore per il gruppo stesso e per i suoi utenti. In particolare le iniziative sulle quali RCS e Data Reply collaborano hanno l’obiettivo di abilitare iniziative di marketing mirato online, di migliorare significativamente la user experience e di promuovere la customer retention.

Attraverso la piattaforma realizzata, RCS e Data Reply hanno potuto rapidamente lavorare all’abilitazione dei primi progetti di data monetization:

  • Audience enrichment: predire i parametri demografici (es. sesso, età, etc) dei navigatori anonimi così da poter somministrare loro contenuti mirati al pari di quanto fatto per utenti registrati;

  • Category intenders: identificare i consumatori interessati a specifiche categorie merceologiche, così da sottoporre loro campagne pubblicitarie di interesse o prodotti in linea con le loro preferenze;

  • Propensity to click: individuare gli utenti che sono maggiormente propensi a cliccare sui banner di una determinata campagna web;

  • Churn prevention: individuare le caratteristiche comportamentali, socio-demografiche e di abbonamento che spingono un utente a non rinnovare il suo abbonamento e, con l’aiuto di queste informazioni, cercare di mantenere i clienti tramite campagne di marketing mirate;

  • Content and product recommendation: individuare prodotti o contenuti reputati interessanti da una certa tipologia target di utenti.

Soluzione

A partire dai requisiti di RCS e basandosi sull’esperienza maturata presso numerosi clienti, Data Reply ha progettato e implementato una soluzione in cloud Microsoft IaaS fondata sulla piattaforma Hadoop e nello specifico sulla distribuzione di Cloudera, azienda della quale Data Reply è Silver partner. Sono diverse ed eterogenee le informazioni registrate nei sistemi di RCS in seguito alla navigazione degli utenti:

  • Data Management Platform: metadati su pagine e loro contenuto, eventi di navigazione (e.g. click su un articolo) e visualizzazione (e.g. riproduzione video), mappatura degli utenti sui loro segmenti di interesse a livello di contenuto;

  • Web analytics solution: informazioni di navigazione in real-time (app, store, C+);

  • Datawarehouse: visione a 360° degli utenti, come abbonati e acquirenti;

  • Semantic analysis platform: informazioni tassonomiche e semantiche sui contenuti testuali.

Per integrare queste fonti dati tra loro e metterle in sinergia è stato progettato e implementato un layer di data ingestion verso l’ambiente Cloudera, che mantiene l’informazione sincronizzata con la sorgente. In questo modo l’ambiente Big Data diviene un playground naturale per la data exploration, la data analysis e le tecniche di advanced analytics, come punto unico di accesso e integrazione dell’informazione. L’architettura e la possibilità di scalare orizzontalmente tipiche di Hadoop, che tramite l’aggiunta di nuove macchine commodity permettono di far crescere secondo necessità la potenza computazionale, consentono inoltre di trattare il dato in maniera agnostica rispetto alle sue caratteristiche di volume, velocità e varietà, così da permettere al team dedicato alla data science un’esplorazione ed elaborazione libera dei dati per la creazione di modelli nel contesto di iniziative rivolte ai principali obiettivi di business. R e Python usati attraverso un’innovativa piattaforma collaborativa per la data science hanno permesso al team di data scientists di accelerare nell’ottenimento dei primi promettenti risultati, visualizzati attraverso KPI di business su una dashboard custom dedicata.

Roadmap

Nel Q2 del 2016 RCS era ai blocchi di partenza di questa nuova esperienza e, con l’aiuto di Data Reply, ha implementato la piattaforma Big Data e ottenuto dei primi importanti risultati nell’ambito dell’audience enrichment e dei category intenders. Durante H2 2016 gli sforzi si sono poi concentrati sul consolidamento della piattaforma esistente e sull’industrializzazione degli use case già implementati. Nel corso del 2017 RCS continuerà a perseguire nuove ambiziose iniziative: migrerà la piattaforma su infrastruttura on-premise per ridurre i costi operativi e implementerà i diversi scenari che erano stati inizialmente ipotizzati.

Picture

Data Reply è la società del gruppo Reply specializzata nella gestione del dato con metodologie Big Data & Advanced Analytics e supporta il cliente nel disegno e nell’implementazione delle piattaforme dati che permettono di valorizzare il patrimonio informativo aziendale. Data Reply è un team di Big Data Engineer e Data Scientist di consolidata esperienza e vanta un’elevato numero di sistemi Big Data in produzione.