L'ORDINE E LA CONFUSIONE.

UN APPROFONDIMENTO SULLE DIRECTORIES

Francesca Turco*

 

Ho deciso di interrompere il percorso sui sistemi di ricerca descritto nella prima puntata di questa rubrica per fare un passo indietro. Ho recentemente approfondito, insieme a due colleghi, l'analisi delle directories già presentata su queste pagine e mi pare che i risultati emersi meritino di essere riproposti su CnS. Lo studio consiste in un'analisi critica dei cataloghi, limitata a quelli che catalogano (anche o solo) siti in lingua italiana. L'analisi è stata intrecciata ad uno studio degli accessi al sito http://www.minerva.unito.it , curato dalla Divisione di Didattica, per valutare anche quali siano le esigenze degli utenti della rete riguardo alla chimica e fare un confronto con l'offerta dei cataloghi.

Analisi critica dei cataloghi (offerta)

Come sempre quando si decide di effettuare una classificazione le difficoltà emergono dalla pretesa di costringere in categorie rigide un materiale plastico e continuo (nel senso di non discreto): dopo una mappatura iniziale dei sistemi di ricerca si è visto che quasi tutti i motori possono funzionare anche da cataloghi e viceversa, anche se raramente il gestore possiede entrambe le tecnologie necessarie e generalmente per quella "secondaria" si appoggia a un servizio di ricerca esterno (questo punto cruciale sarà approfondito più avanti). Visto che quasi tutti i sistemi di ricerca offrono in realtà il doppio servizio sono stati esaminati, fra quelli presenti nella classifica dei più utilizzati riportata da un sito specializzato, solo quelli che funzionano come catalogo all'apertura della home page, e quindi Libero, Virgilio, Msn, Yahoo.it e 100links, che è il funzionamento come catalogo di Supereva. A questi ne abbiamo aggiunto uno che non risulta nell'elenco: Open Directory Project (ODP), in seguito a due considerazioni. Innanzi tutto perché, come già riportato in una delle precedenti puntate, il suo sistema di selezione e recensione dei siti non è affidato come per gli altri cataloghi ad uno staff di dipendenti dell'azienda, ma a volontari scelti fra gli utenti della rete e quindi esperti dell'argomento che trattano e sicuramente motivati. In secondo luogo ODP, celeberrima nei paesi anglofoni, è in realtà molto utilizzata anche in Italia, pur non comparendo direttamente nella classifica dei siti più visitati, e anche se spesso i suoi stessi utenti non sanno di esserlo. Infatti numerosi servizi di ricerca di informazioni in rete si appoggiano ai dati di ODP quando vengono interrogati in modalità directory. Tralasciando i minori basta evidenziare che Google si comporta in questo modo per avere un'idea del numero di accessi indiretti ad ODP anche in Italia.

Dopo aver selezionato i cataloghi da interrogare abbiamo scelto le domande da rivolgere loro: un generico "chimica", più che altro per avere il numero totale di siti riguardanti la disciplina recensiti, “didattica chimica”, “storia chimica” ed “epistemologia chimica”, cioè gli argomenti portanti del sito Minerva, per avere un’idea di cosa sia presente su questi temi e per poter poi fare il confronto fra offerta e domanda; abbiamo infine inserito tre domande fra quelle digitate più di frequente dagli utenti di Minerva: “teoria atomica” (la più richiesta in luglio), “dizionario di chimica” (primo in classifica da quando è stato inserito nel sito) e "chimica industriale". I risultati sono piuttosto sconfortanti. Il dato più preoccupante è la scarsa pertinenza che i siti segnalati avevano in relazione alla domanda fatta, cosa che con un catalogo non dovrebbe proprio succedere. Con scarsa pertinenza si intende che quei siti non soddisfano le esigenze dell’utente, nonostante contengano, com’č ovvio, i termini richiesti. Per fare un esempio: con “didattica chimica” (ma non solo) si ottengono per la maggior parte siti di dipartimenti universitari che, nella quasi totalità dei casi, si riducono ad un elenco di orari ed indirizzi. Limitandoci ad un cenno sulla triste situazione della nostra disciplina se, chi ne ha i mezzi e l’interesse, non spende una parola per dipingerla in una luce diversa da quella in cui la colloca l'immaginario comune, è evidente che il navigante interessato alla didattica non avrà trovato quello che cercava. Fa eccezione ODP, che va un po' meglio. Un altro risultato allarmante emerso dall'analisi delle risposte è l'evidenza che molte di queste erano in realtà presentate da motori. Abbiamo dedotto che quando la richiesta fatta a un catalogo è troppo specialistica per essere soddisfatta dai siti da lui recensiti viene “richiamato” un motore e ne vengono presentate le risposte. L’aspetto grave di questo gioco di specchi è che alcuni non lo segnalano, come ad esempio Arianna, ci si quindi trova davanti ad un sito non recensito senza saperlo. Questo, insieme agli intricatissimi rapporti fra le aziende che forniscono sistemi di ricerca, è il punto che crea la maggiore quota della confusione segnalata nel titolo. Questo caos mette in allarme anche per quel che riguarda la questione del potere connesso alla selezione e gestione di informazioni. Non sarà il caso della didattica chimica, ma per argomenti a rischio di censura o di creazione di opinioni di parte, di monopoli o di idee portanti una comunità, è fondamentale sapere chi è che propone i dati.

Analisi statistica degli accessi a Minerva (domanda)

Da ripetuti controlli è emerso che la maggior parte egli utenti che giungono su Minerva è in cerca di informazioni molto specialistiche e molto circoscritte, esempi classici sono “cromatografia”, “cortisone”, “mendeleev”, “edta”, ecc. Una discreta quota (3-5 per mille) è invece in cerca di approfondimenti (“teoria atomica”, “didattica della chimica”). È chiaro che la valutazione della domande è viziata dai contenuti del nostro sito: non vediamo chi cerca termini che non compaiono in Minerva, ma l’impennata negli accessi a partire dal momento in cui è stato inserito il dizionario di chimica pare confermare le valutazioni precedenti: passare, nell’arco di due mesi, da una cinquantina di accessi al giorno agli oltre 250 attuali significa aver centrato le esigenze degli utenti.

Un altro dato interessante è la classifica degli accessi al sito in base al motore/catalogo utilizzato Questa classifica non coincide per nulla con quella dei siti più visitati che ho citato all’inizio, in quella i cataloghi occupavano le prime tre posizioni e Google si trovava solamente al settimo posto, in questa Google è clamorosamente al primo posto (con oltre 400 accessi su mille, contro il centinaio di Virgilio in seconda posizione e le briciole divise fra gli altri), e i cataloghi sono nettamente minoritari. Questo mostra come, evidentemente, gli utenti dei vari sistemi di ricerca non siano tutti uguali. In particolare sembra che gli utenti di Google siano le persone più interessate alla ricerca di informazioni specialistiche, mentre chi cerca i termini elencati nella tabella 1 si trova evidentemente benissimo con i vari Libero, Virgilio, ecc.

1

Sesso

2

Foto

3

Gratis

4

Suonerie

5

Gay

6

Mp3

7

Chat

8

Dragon Ball

9

Download

10

Halloween

Tabella 1: Classifica dei termini più ricercati. Fonte: lycos.it.

E allora?

I dati della nostra indagine sono senza dubbio piuttosto sconfortanti, ma con una piccola eccezione: ODP, che rappresenta, a nostro parere, l'unico argine attualmente opponibile al dilagare in rete di informazioni di pessima qualità. Quindi invitiamo tutti gli utenti del Web a provare a utilizzare per prima questa possibilità di ricerca, se qualcosa si trova generalmente è un sito di buona qualità. Sarebbe naturalmente auspicabile che il progetto fosse il più possibile conosciuto e coadiuvato, una possibilità è quella di suggerire agli studenti di diventare editori, magari per una delle categorie che possono interessare loro (musica, videogiochi). Questo nell'interesse non solo di ODP ma degli studenti stessi: impegnarsi in una selezione di siti della rete è un'ottima palestra per la formazione di naviganti critici.

 

Indice della rubrica