BayesFor.eu

beta

Bayesian web spidering

Traduzioni di questa pagina?:

Menu

Associazione

Progetti

Pagine personali

Traccia: » intro
::

Cos'è Bayes-Swarm?

Bayes-Swarm è un progetto di ricerca che si propone di analizzare il contenuto delle fonti di informazione sul web. Il testo contenuto nelle fonti viene organizzato in un enorme databse (l'ordine di grandezza è di alcune centinaia di migliaia di parole a l giorno). Il database è poi analizzato utilizzando tecniche statistiche tradizionali e tecniche di data mining.

Il nome swarm, che in inglese sta per sciame, vuole richiamare il significato più profondo del progetto: la possibilità di estrarre dei significati da un aggregato di elementi che separatamente non sembrano avere alcun significato (nel nastro caso singole parole). In modo del tutto simile si muove lo sciame; anche se i singoli insetti si sembrano descrivere delle traiettorie caotiche, l'intero sciame procede con una logica ben precisa.

Il progetto è stato avviata nel Settembre del 2007. IN questi mesi Bayes-swarm ha già prodotto alcuni risultati di interesse e ha mostrato le sue notevoli potenzialità di sviluppo. Un esempio è l'articolo sulla visibilità dei candidati alle elezioni primarie del Partito Democratico svoltesi nell'Ottobre del 2007. Nell'articolo (Il Politico, N. 218, 2008) si mostra come il comportamento di voto e la visibilità sulla rete dei candidati si mostranino fortemente legati.

Al momento il progetto si sta sviluppando in due principali linee di ricerca:

L'analisi statistica delle informazioni in rete che sta portando avanti un'analisi approfondita dei contenuti del dataset che si accresce ogni giorno. Il progetto sta facendo luce su alcuni aspetti interessanti riguardo a come le notizie vengono editate sulla rete, a come i flussi di informazioni possano essere normalizzati per ottenere “indici di concentrazione” di una certa parola, a come le notizie tendano a propagarsi nella rete.

La grande forza di Bayes-swarm sta nella sua capacità di poter misurare le notizie e quindi di rendere possibile l'utilizzo di tecniche che difficilmente si possono applicare su informazioni qualitative.

Bayes-Swarm è sviluppato e programmato utilizzndo Ruby, mysql e Python.

torna alla documentazione

Torna su :: bayes-swarm/intro.txt · Ultima modifica: 2012/02/28 23:48 da matteo.zandi
Mostra sorgente Revisioni precedenti Ultime modifiche Indice