SMART SEARCH

Sviluppiamo il motore di ricerca per i tuoi portali B2B, B2C e intranet aziendale

La ricerca semantica, o semantic search, è un nuovo approccio di Information Retrieval. Qual'è la sua caratteristica? Non vengono considerate soltanto le parole chiave (keyword) ma anche la loro semantica approfondendo il significato dei termini richiesti (query).


All'interno dello scenario aziendale, molto spesso emerge nell'utente l'esigenza di trovare rapidamente le informazioni contenute in un documento di cui però non si conosce l'esatta posizione. E' un problema che chiaramente può essere indirizzato attraverso l'utilizzo di motore di ricerca. L'utente attraverso l'uso di una barra di ricerca scrive alcune parole correlate al contenuto che sta cercando ed il motore dopo averle analizzate restituisce i risultati più idonei in pagina.
Per quanto l'utilizzo di un motore di ricerca possa essere lato utente un'esperienza semplice e molto fruibile, la realizzazione e la manutenzione devono tenere conto di alcuni aspetti chiave, vediamone alcuni.

I documenti non sono dei semplici "contenitori" di testo ma presentano:

  • Una struttura complessa (tabelle, parti discorsive, capitoli, paragrafi, immagini,..);
  • Diversi formati come PDF, PDF scansionati, word, excel e molti altri;
  • Un livello di visibilità, che va dal pubblico al privato secondo la definizione di specifiche Access Control List (ACL), qualora vengano definite.

Oltre agli elementi sopra il testo contenuto in un documento tipicamente è scritto in linguaggio naturale e come tale:

  • Parole, discorsi, frasi, paragrafi, hanno loro significati ed esprimono atti linguistici come ad esempio opinioni, domande, descrizioni;
  • Le parole e le espressioni sono correlate tra loro;
  • Nomi e verbi sono importanti per la comprensione e non tutte le parole esprimono un contenuto, si penso alle preposizioni , pronomi o ai quantificatori;
  • Il linguaggio è in continua evoluzione e ogni giorno nascono nuove parole o espressioni o cambiano gli usi linguistici. Questo è vero nei social come nella realtà aziendale.

Come realizzare un motore di ricerca efficace che tenga presente questi aspetti?

I motori di ricerca classici basati su keywords

I motori di ricerca tradizionale lavorano per keyword: viene presa in input la parola chiave digitata dall'utente nella richiesta (query), viene verificato dal motore quali documenti la contengono che successivamente li elenca in una pagina dei risultati (serp) secondo un particolare ordine. Tutti i documenti elencati hanno una caratteristica, quella di includere al loro interno la parola chiave indicata dall'utente nella sua query di ricerca. Ora,trascurando come avviene l'ordinamento dei risultati elencati, quello che occorre ricordare è soprattutto il fatto che tutte presentano una coincidenza letterale con la parola chiave (exact matching).

Con questo tipo di approccio ogni parola è quindi diversa da tutte le altre, compresi i sinonimi, le forme di genere, il singolare o plurale. Ad esempio se si cerca "polizza per animali da compagnia" o se si cerca "polizza per animale domestico", il motore di ricerca per keyword restituirà elenchi di pagine differenti, in quanto cerca diverse parole, sebbene abbiamo il medesimo significato ("animale domestico" e "animali da compagnia").

La ricerca per keyword presenta inoltre altri limiti in fase di scrittura di query troppo lunghe (troppe parole da ricercare e spesso inappropriate) o che presentano errori di battitura (verrà cercata esattamente la parola scritta in forma erronea).

La ricerca semantica (o in linguaggio naturale)

Un altro tipo di ricerca, più efficace è la ricerca semantica o "semantic search". In questo caso le logiche del motore di ricerca non ragionano solo più sulla keyword letterale esatta ma prendono in considerazione anche il significato della parola. Ripercorrendo l'esempio fatto precedentemente quando l'utente digita una query fornisce al motore di ricerca una combinazione di parole chiave in input. Il motore effettua un'analisi sul valore semantico di ciascuna parola, cercando di individuare tutte le altre parole pertinenti con i termini richiesti. Così facendo, il motore di ricerca si accorge che le parole "animale domestico" e "animali da compagnia" nonostante il plurale/singolare e la diversa forma, sono la stessa cosa. Questo processo è denominato espansione del campo semantico.
Come fa a conoscerne il significato? Si avvale di una base di conoscenza (knowledge base), ossia un database in cui sono registrate tutte le parole, le relazioni delle parole e le entità ( concetti ).

E’ possibile scrivere "come fare" o "come realizzare", avendo comunque gli stessi risultati o, perlomeno, delle pagine dei risultati molto più simili tra loro. In alcuni casi potremmo persino avere delle risorse che non contengono al loro interno le parole chiave usate nella nostra query, ma altri termini pertinenti. La selezione della ricerca semantica è molto più ampia ed è molto più probabile trovare dei risultati di qualità, i quali ora appaiono su tutte le query simili, ed evitare lo spam.
Abbiamo riportato soltanto un esempio non esaustivo di come può funzionare la ricerca semantica. Nella realtà, i processi e gli aspetti tecnici della "Semantic Search" sono molto più articolati.

COME FUNZIONA E QUALI STRUMENTI USARE?

Motore di ricerca in linguaggio naturale: IBM Watson Discovery

QUALI BENEFICI ABILITA L'UTILIZZO DI UN MOTORE DI RICERCA?

  • RIDUZIONE DEI TEMPI (E COSTI) DI ACCESSO AI DATI

    Accesso diretto alle informazioni grazie alle funzioni di estrazione di dati, ricerca semantica, navigazione dei contenuti e categorizzazione automatica. Attraverso l'uso delle categorie e dei filtri, a livello aziendale, i tempi di reperimento delle informazioni diminuiscono.

  • VALORIZZAZIONE DEL PATRIMONIO INFORMATIVO

    Valorizzazione e condivisione del capitale intellettuale: i contenuti sono sempre disponibili ed accessibili con diversi livelli di visibilità. L'utente può visualizzare in forma organizzata tutti e soli i documenti che gli competono, secondo le policy di sicurezza aziendale.

  • ESPERIENZA UTENTE (UX) UNICA E SEMPLIFICATA

    L'utente di un'interfaccia unica, con un solo campo da inserire: la barra di ricerca. Il motore di ricerca viene utilizzato come unico punto di accesso a informazioni eterogenee (ticket, documenti, video, immagini, documenti scansionati,..).

  • COMPRENSIONE DEL LINGUAGGIO NATURALE

    Vengono identificati i risultati cercati più pertinenti nonostante l'utente non esprima la richiesta (query) nella forma più corretta o secondo lo "slang" aziendale. Questo porta ritorno in termini di immagine, retention rate e trust.

  • CONOSCENZA DELLE ESIGENZE DEGLI UTENTI

    Attraverso la barra di ricerca, l'utente scrive cosa sta cercando (query). Questo è un feedback prezioso. L'analisi delle query utente aiuta il business a fornire risposte sempre più soddisfacenti in relazione alle esigenze emerse.