BayesFor.eu

beta

Bayesian web spidering

Traduzioni di questa pagina?:

Menu

Associazione

Progetti

Pagine personali

Traccia: » database
::

Il database

Bayes-Swarm è un progetto di ricerca, il cui obiettivo è costruire un motore in grado di estrarre informazioni da risorse internet (portali di notizie, siti web di quotidiani e agenzie di stampa, blogs, etc). Ad oggi, vengono quotidianamente visitate 30 fonti nazionali e internazionali a cui corrispondono circa 70 pagine (principalmente pagine iniziali, pagine economiche, politiche, etc). Ciascuna pagina passa attraver- so un processo di lavorazione, i cui passaggi principali consistono in: eliminazione dei tag di formattazione e della punteggiatura, rimozione delle congiunzioni e ar- ticoli, estrazione delle radici delle parole. Successivamente vengono contate le occorrenze di ciascuna parola e salvate in un database.

Il nostro database ci fornisce quindi, per ogni candidato, la frequenza media delle apparizioni nelle nostre fonti. Da queste vere e proprie ‘serie temporali’ di visibilit`a sulla rete si possono costruire grafici di andamento, correlazioni e collegare gli andamenti a specifici avvenimenti.

Bayes-Swarm è un progetto open-source, attivamente sviluppato dalla Asso- ciazione BayesFor. Sul sito http://www.bayes-swarm.com è possibile consultare online le serie temporali di apparizione di numerosi termini italiani e inglesi. Nel caso delle campagne elettorali, questo strumento permette di monitorare la visibilità dei candidati sui media. Questo monitoraggio non è nuovo alla letteratura massmediologa italiana , tuttavia, fino a pochi anni risultava proibitivo in termini di costi.

Usa Bayes-Swarm

torna alla documentazione

Torna su :: bayes-swarm/database.txt · Ultima modifica: 2008/05/13 15:01 (modifica esterna)
Mostra sorgente Revisioni precedenti Ultime modifiche Indice