domenica 7 marzo 2010

Siti anti-Google o “ricerche verticali”?


Sono le ricerche più approfondite e molto più precise. Ci sono nella rete una miriade di siti con migliaia di miliardi di informazioni che il più famoso motore di ricerca “Google” organizza detenendo più del 60% del mercato dei searcher.Poi abbiamo Yahoo, Bing, Aol e Ask. Ma vicino a questi mostri della ricerca ci sono altri usati per scovare informazioni particolari. Quindi il mercato dei motori si sta indirizzando sempre più verso le ricerche verticali per dire approfondite legate ad un settore prescelto e non solo orizzontali o meglio superficiali.
Per esempio c’è Legal Crawler che è un motore di ricerca molto popolare in America per i professionisti del diritto. In sostanza da la possibilità di scandagliare le leggi dei vari Stati, ordinanze, sentenze usando la semantica ossia la scienza del linguaggio. Quindi gli algoritmi di ricerca di affinano e si fanno sempre più sofisticati. Tra i metacrawler ci sono quelli anche con taglio tipicamente giornalistico. E’ il caso di Rocketnews.con che ha un focus sui titoli di tutti i giornali e articoli, e About.com che cerca informazioni in quattro materie specifiche: riparazioni domestiche, meteo, bambini e orari dei treni. Molto in voga è anche Suite101.com che comprende solo notizie freepress o scrittori liberi professionisti.
Per una vasta copertura abbiamo Vivissimo.com che fa hunthing delle parole chiave degli altri motori di ricerca riuscendo a trovare molte più informazioni ed anche velocemente. Tra i tanti cito DogPile, Hotbot, Nothernlight.com.
Tra i tanti perché non citare Cuil.com che è stato fondato da alcuni ex dipendenti di Google ma il lancio del sito ha generato un effetto imprevisto per i suoi fondatori: pochi istanti dopo la sua nascita, il motore è caduto a causa dell'alto numero di connessioni. Un messaggio di scuse e la promessa di un pronto ritorno hanno salutato i curiosi per alcune ore. Non proprio un lancio trionfale.
Poi sono nati motori con specifiche particolari come quella di affidare agli utenti di raccogliere, gestire e condividere i siti web pertinenti alle proprie aree di interesse: Twine.com. Wolframalpha.com è un motore computazionale ossia non ricaviamo una lista di siti ma già la risposta attraverso la parola chiave, utilizzato prevalentemente sulle conoscenze tecniche.
Da approfondire sono Searchme.com che restituisce risultati sotto forma di immagini tipo screenshot, Kosmix.com che indicizza le pagine non in base alla keywords ma per argomenti. Ancora per ricerche sempre più verticale abbiamo Isohunt.com per catalogare tutti i video e le immagini più cliccate o scaricate dalla rete. Per l’e-commerce c’è A9.com per i prodotti e Adsonar.con per la ricerca di spazi pubblicitari.
Infine lascio a voi che leggete ogni considerazione sulla materia religiosa c’è Cathhoogle.com che sfruttando un filtro di Google elimina in modo automatico contenuti sessualmente espliciti ma dall’altra parte abbiamo ImHalal.com. Anche con questo motore se si digita parole come "sex” il motore risponde con un Ops e se si scrive in inglese versetti satanici ci avvisa che la ricerca non è conforme alla fede cristiana. Quindi per finire abbiamo ricerche per tutti i gusti.
raffaele.primavera@gmail.com

mercoledì 30 dicembre 2009

Google Social Search

Google Social Search disponibile in Google labs.

E’ il nuovo servizio lanciato dai Google labs e che promette di aiutare a trovare i contatti resi pubblici sul web nell’ambito della propria sfera sociale, all’interno delle ricerche.

Google Social Search è un complemento alle ricerche condotte su web che evidenzia la rete di relazioni sociali che ognuno di noi ha modellato nel web: post su blogs, aggiornamenti di profili, tweets.

Finora tutte queste relazioni erano sparse nei vari siti web e non esisteva un collettore unico capace di dire, quando si fa una ricerca su Roma, quali sono i contatti che si hanno in quella città e i rispettivi profili presenti nei social network a cui si è iscritti.

Quindi effettuando una ricerca su Roma, non avremo come risultati di ricerca solo i siti istituzionali ma in fondo si troveranno anche gli amici e conoscenti appartenenti alla propria sfera sociale, che hanno qualche attinenza con Roma.

Il presupposto fondamentale di Social Search è che ciascun utente abbia un account attivato su Google Profile, caso contrario è molto più difficile tenere traccia del proprio network di relazioni sociali.

Di fatto il primo luogo dove andare a cercare le info è sul profilo di Google, il profilo personale in cui ciascuno può pubblicare le informazioni relative ai propri contatti su Friendfeed e su Twitter. Se si utilizza Gmail vengono riportati tutti i risultati dei propri contatti di chat ( non i contenuti) e da Google Reader avremo i siti a cui si è iscritti come un componente del vostro network di relazioni sociali.

Attualmente il servizio non permette di accedere ai vari aggiornamenti di stato pubblicati su Facebook, mentre è possibile per quelli di Twitter. Infatti dopo aver annunciato pochi mesi fa l’integrazione di Twitter nell’indice del proprio motore, Google ha presentato questo servizio sperimentale, che già raccoglie i frutti di questa integrazione.

Ora per provare il servizio è necessario accedere alla “sezione sperimentale” di Google Labs e attivare Social Search cliccando sul pulsante “Join this experiment”. Attualmente il servizio è disponibile solo nella versione inglese (www.google.com) del motore di ricerca. Una volta attivato, basta impostare una query, cliccare su “Show options” e selezionare la voce “Social”. Ora Google ci tiene a precisare che tutte le info di cui si tiene traccia in Social Search sono dati pubblici già presenti in rete, che l’utente può modificare in qualsiasi momento, e che quindi il servizio non comporta alcuna violazione della privacy dei singoli utenti, ma la sensazione da “Osservati” che incombe è un po’ difficile da cacciare via.

(fonte: http://www.motoricerca.net e http://www.pcprofessionale.it/ )

raffaele.primavera@gmail.com

giovedì 17 dicembre 2009


Come si fa a trovare un immagine o video su Internet o su YouTube senza una descrizione testuale?

Il motore di ricerca più popolare è indubbiamente Google, il primo a comparire sulla scena e tuttora ai primi posti tra i siti web più visitati, in eterna competizione con Yahoo! Più giovane ma sempre pronto ad innovare, Google si è velocemente affermato, a scapito di altri motori con più esperienza. Indubbiamente, Yahoo! non è un vero e proprio motore di ricerca, bensì una directory, ossia un elenco di siti web (e quindi non di singole pagine) suddiviso per argomento e quindi catalogati. Differente è invece il funzionamento che sta alla base degli altri motori di ricerca: questi censiscono i siti Web in base alla presenza delle parole contenute in ogni pagina del sito, evidenziando quelle riportate più spesso, che si presume rappresentino l'argomento principale della pagina stessa. Per fare questo, oltre ad inserire i siti segnalati dagli utenti, scandagliano continuamente l'intero Web attraverso degli specifici software (i cosiddetti spider o crawler), acquisendo tutte le pagine non ancora presenti nei loro archivi. Tra i primi ad applicare questa tecnica e tuttora tra i più utilizzati , è senza dubbio Google, infatti è ritenuto quello con la miglior base tecnologica anche oggi. Partendo da questa premessa e tenendo presente che una ricerca oggi è di tipo “testuale”, al momento, le immagini e i video sono rintracciabili solo se a questi viene aggiunto del testo descrittivo, o se viene assegnato loro un nome abbastanza esplicativo da essere poi confrontato con le parole chiave presenti nella query di ricerca. Un team di ricercatori dell'Università di Amsterdam ha proposto un “software”, che ha vinto il primo premio in una competizione internazionale come miglior programma di ricerca, in grado di rintracciare degli oggetti o delle descrizioni all'interno di immagini o video, in modo del tutto autonomo ed efficiente. L'algoritmo si basa su una tecnica di riconoscimento intelligente delle immagini, unita a un ottimo modello di ricerca e catalogazione degli elementi, che soddisfano determinati criteri. Il numero elevato di calcoli necessari a completare le ricerche con questo metodo richiede l'utilizzo di appositi supercomputer allo scopo di velocizzare le operazioni. Il crescente numero di file video significa che vi è un crescente bisogno di motori di ricerca che facilitano la ricerca di immagini e frammenti di video. L’ identificazione degli oggetti computerizzata rende più facile, per esempio, la ricerca all’interno di database di grandi dimensioni come YouTube, Flickr e Facebook per caratteristiche non incluse nel testo. Il fatto di rendere più facilmente reperibili contenuti non identificabili, insieme alla possibilità di rintracciare determinati oggetti all'interno di immagini e video renderà sicuramente più accurati i risultati delle ricerche e permetterà anche alle aziende, che si occupano di pubblicità e di analisi dei contenuti, di aumentare e rendere automatica e indipendente la ricerca e la catalogazione degli elementi di interesse. (fonte: http://www.resourceshelf.com)

raffaele.primavera@gmail.com