All'interno dello scenario aziendale, molto spesso emerge nell'utente l'esigenza di trovare rapidamente le informazioni contenute in un documento di cui però non si conosce l'esatta posizione. E' un problema che chiaramente può essere indirizzato attraverso l'utilizzo di motore di ricerca. L'utente attraverso l'uso di una barra di ricerca scrive alcune parole correlate al contenuto che sta cercando ed il motore dopo averle analizzate restituisce i risultati più idonei in pagina.
Per quanto l'utilizzo di un motore di ricerca possa essere lato utente un'esperienza semplice e molto fruibile, la realizzazione e la manutenzione devono tenere conto di alcuni aspetti chiave, vediamone alcuni.
I documenti non sono dei semplici "contenitori" di testo ma presentano:
- Una struttura complessa (tabelle, parti discorsive, capitoli, paragrafi, immagini,..);
- Diversi formati come PDF, PDF scansionati, word, excel e molti altri;
- Un livello di visibilità, che va dal pubblico al privato secondo la definizione di specifiche Access Control List (ACL), qualora vengano definite.
Oltre agli elementi sopra il testo contenuto in un documento tipicamente è scritto in linguaggio naturale e come tale:
- Parole, discorsi, frasi, paragrafi, hanno loro significati ed esprimono atti linguistici come ad esempio opinioni, domande, descrizioni;
- Le parole e le espressioni sono correlate tra loro;
- Nomi e verbi sono importanti per la comprensione e non tutte le parole esprimono un contenuto, si penso alle preposizioni , pronomi o ai quantificatori;
- Il linguaggio è in continua evoluzione e ogni giorno nascono nuove parole o espressioni o cambiano gli usi linguistici. Questo è vero nei social come nella realtà aziendale.
Come realizzare un motore di ricerca efficace che tenga presente questi aspetti?