Pare che la discussione “natalizia” portata avanti da Tony Siino sulla non rappresentatività della mappa di BlogBabel, abbia prodotto nello stesso Tony l’interesse per cercare dei metodi di valutazione diversi e più idonei alla situazione rale.
In un suo post, Tony ribadisce il suo pensiero:
“Uno studio con un campione come quello della mappa esistente non è rigoroso (perchè non tiene conto della complessità e della varietà della realtà presa in esame), ma anche uno studio rigoroso potrebbe essere molto parziale: utilizzare tecniche che rilevino soltanto la parte più accessibile dell’universo di riferimento potrebbe portare a un campione tendenzialmente rappresentativo ma relativo a una parte non rappresentativa dell’intero universo, quindi eventuali generalizzazioni non sarebbero possibili.”
E propone un’alternativa: il respondent driven sampling (RDS), cioè un metodo che “parte da alcuni casi che ne indicano altri secondo dei criteri richiesti dal ricercatore e così via, con un modello matematico che pondera il campione per compensare le distorsioni date da una formazione non casuale (e non probabilistica) dello stesso.”
Come espresso già in precedenza mi trovo abbastanza in disaccordo con la politica di analisi portata avanti fin’ora da tutti. Tecnicamente è incompleta. Non credo che la blogosfera possa essere indicizzata e sorvegliata automaticamente per gli stessi motivi che ha portato alla luce Tony, ma anche perchè stilre classifiche basate sul concetto di link attuale è una stupidaggine. Questo per diversi motivi.
Primo: Il valore esclusivamente positivo che ha un link oggi non è per niente rappresentativo, tantomeno riesce a definire le diverse sfumature delle relazioni instaurate attraverso questo semplice tag html. Per non parlare del fatto che molti network hanno gradi diversi di indicizzazione sui motori e sui sistemi che poi fanno queste classifiche.
Secondo: Come fa notare Tony, non esiste un metodo che riesce a tenere traccia dei blog che non usano i feed, che non usano gli aggregatori, che usano piattaforme minoritarie, che non sono iscritti a directory come BlogItalia eppure sono letti, commentati, partecipano a cluster di discussione ecc.
Questa fetta di blog (di cui non conosciamo la dimensione) la perdiamo inevitabilmente, ma è da considerarsi a tutti gli effetti una parte della blogosfera da non sottovalutare.
Rispondendo al vecchio post di Tony dissi che avrebbe molto più senso una classifica stilata sulla base di un concetto di link che assume diversi valori relazionali, ma per come stanno le cose è impossibile perchè i link (che poi sono la parte fondamentale della creazione delle relazioni sociali online) non esprimono alcun tipo di sfumatura semantica. Oggi il suo valore è esclusivamente positivo.
Per questo, tempo fa, mi sono chiesto se parlare esclusivamente di contenuti all’interno dei dibattiti sul web semantico non fosse errato.
Non sarebbe più opportuno pensare di semantizzare non solo i contenuti, ma anche le relazioni permettendo un diverso tipo di approccio con le diverse tipologie di Persone che “incontriamo” in rete?
Sono sicuro che se questo accadesse sicuramente riusciremmo ad “emulare meglio” il rapporto sociale tra individui arricchendolo di sfumature, ma soprattutto dovremmo riconsiderare completamente le classificazioni attuali.
Ciò che non si coglie oggi quindi, è il valore semantico delle relazioni tra individui. Questo valore semantico permetterebbe di creare una mappa ben più grande di quella di BlogBabel, perchè indagando su di esso si riuscirebbe ad arrivare a quei blog “invisibili” di cui parla Tony, ma non solo. Si riuscirebbe a definire il tipo di rapporto tra gli individui alla stessa stregua dei rapporti sociali del mondo “analogico”.
In realtà ritengo ancora che un approccio come questo sia abbastanza adeguato, ma non c’è modo oggi, di poterlo mettere in pratica. La tecnologia non ce lo permette.
Ecco che l’approccio proposto da Tony entra in gioco. Egli vorrebbe mappare la blogosfera utilizzando si un approccio semantico tra le relazioni, ma senza far uso degli strumenti tecnici che abbiamo oggi a disposizione. Questi, per quanto sofisticati, inevitabilmente perdono qualcosa.
La soluzione? Lasciar perdere le tecnicaglie e usare i metodi “della nonna”.
“Il pregio di RDS sta qui: combina l’ampiezza di copertura del campione con la sua validità statistica. In sintesi, i partecipanti alla ricerca reclutano i propri pari e i ricercatori tengono traccia di chi ha reclutato chi e del numero di contatti sociali. Un modello matematico del processo di reclutamento (e un programma esistente) pondera infine il campione per compensare le distorsioni di percorsi di reclutamento non-casuali permettendo la stima delle caratteristiche del network che connette gli individui all’interno della popolazione e la stima delle proporzioni di alcuni gruppi sulla base della struttura del network stesso.”
Concludendo ritengo che questo sia il miglior approccio fin’ora proposto per monitorare una situazione complessa come quella della blogosfera italiana. Il problema sta nel fatto che ci si affida alle persone e alla loro sensibilità . Come ogni cosa “umana”, anche questa non è esente da errori e quindi da eventuali sfalsature dell’analisi. Ad ogni modo risulterebbe comunque molto più dettagliata che i frullati di dati fatti da qualcun’altro.





Nella mia ricerca su blog e politica ho usato un campione di oltre 1000 degli utenti di Splinder, Cannocchiale e Dada.net perche’ non ero interessato a fare un mappa ma ha compredere alcune delle modalita’ d’uso dei blog per discutere di politica.
Se alcune delle differenze o dei risultati erano statisticamente significativi, visto che si trattava di processi e non di mappe, hanno un buona affidabilita’.
interessante l’approccio proposto da Tony del RDS…in linea teorica potrebbe essere un buon punto di partenza anche se temo sia un approccio non facile da implementare nella pratica in quanto, come si sa, la blogosfera italiana è ancora fatta di tanti piccoli gruppi chiusi di persone che tendono ad isolarsi un pò e temo quindi che il recruting “peer to peer” potrebbe non essere cosi efficace.