Egy korábbi bejegyzésünkben már szó volt arról, hogy a Google hogyan vizsgálja a valós idejű adatokat. Amit Singhal a Google valós idejű keresések fejlesztésének vezetője nemrég árulta el, hogy milyen módszereket használnak a Twitter-es tartalmak szűrésére.
1. Twitter PageRank
Van egyfajta külön PageRank rendszer külön a Twitter-es tartalmaknak.A hagyományos PR-el szemben azonban a Twitter esetében nem a tweet-re mutató linkek számát méri, hanem a tweet szerzőjének követő számát. Az ugyanazon kulcsszavakat tartalmazó tweet-ek közül az fog először megjelenni, amely szerzőjét több ember követi.
2. #hashtag
A kettőskereszt használatával a Twitter-en különböző témákhoz kapcsolhatjuk az írásunkat. (Pl. #földrengés #bkv stb.) Ha az éppen keresett szó kettőskeresztel szerepel a tweet-ünkben, akkor az nagyobb valószínűséggel fog megjelenni a valós idejű találatok között.
3. Spam
Bár Amit részletesen nem árulta el, de van egy módszerük amellyel szűrik azokat a spam tweet-eket, amelyek a fentebb említett kettőskeresztes módszerrel próbálnak minél több felhasználóhoz eljuttatni.
4. Signal in the noise
Rengeteg tweet szólhat egy bizonyos témáról. Ahhoz, hogy a legrelevánsabbakat válassza ki a Google, ki kell szűrniük azokat, amelyek kevésbé vágnak az éppen aktuális témába. Ha pl. az "Obama" szóra keresünk rá, rengetek tweet-et kapunk eredményként. A Google úgy szűri ezeket a találatokat, hogy megvizsgálja, melyek azok a szavak amelyek az "Obama" szó környezetében szerepelnek és a leggyorsabban növekednek a tweet-ek közül. Ha pl. Obama Washingtonban tart egy beszédet, azok a tweet-ek, amelyek az "Obama" és a "Washington" szavakat tartalmazzák a valós eredmények között fognak megjelenni.
Ajánlott bejegyzések:
A bejegyzés trackback címe:
Kommentek:
A hozzászólások a vonatkozó jogszabályok értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a Felhasználási feltételekben és az adatvédelmi tájékoztatóban.