據(jù)報(bào)道,新浪微博正在小范圍測試網(wǎng)頁搜索,部分用戶可以在“微博搜索”結(jié)果中看到相應(yīng)關(guān)鍵字的網(wǎng)頁搜索結(jié)果。據(jù)截圖顯示,網(wǎng)頁搜索位于在新浪微博的搜索頁面下方,微博搜索結(jié)果之后,每個(gè)搜索結(jié)果后都有一個(gè)“網(wǎng)頁”字樣標(biāo)簽。網(wǎng)頁搜索結(jié)果提供了網(wǎng)頁標(biāo)題、網(wǎng)頁地址、內(nèi)容摘要、分享時(shí)間、分享人及分享次數(shù)。點(diǎn)擊分享次數(shù)可以進(jìn)行再次分享。
微博搜索的用戶需求
微博搜索是一個(gè)特定領(lǐng)域的搜索,是垂直搜索的一種。微博搜索在突發(fā)事件的進(jìn)展跟蹤、熱門事件的大眾評論(輿情監(jiān)測)上,都能夠有非常良好的表現(xiàn),而微博的屬性在于實(shí)時(shí),“實(shí)時(shí)搜索”強(qiáng)調(diào)的是“速度”,對于傳統(tǒng)搜索引擎而言,要足夠快的發(fā)現(xiàn)信息源進(jìn)行抓取收錄,才能被用戶檢索到,而這一切都是基于整個(gè)互聯(lián)網(wǎng)內(nèi)容平臺。
而微博作為一個(gè)獨(dú)立的信息源,本身具備媒體屬性,是一個(gè)內(nèi)容的直接產(chǎn)生平臺(自媒體),在信息更新方面具有傳統(tǒng)搜索引擎無法比擬的優(yōu)勢,就時(shí)間節(jié)點(diǎn)上來說,新浪微博信息內(nèi)容已經(jīng)可以做到快速響應(yīng)。而在內(nèi)容方面,也比傳統(tǒng)媒體更適合閱讀和傳播(謠言產(chǎn)生機(jī)制)。
微博的數(shù)據(jù)優(yōu)勢
1:互聯(lián)網(wǎng)內(nèi)容的二次過濾
新浪微博有強(qiáng)大的內(nèi)容運(yùn)營能力,能夠引導(dǎo)用戶進(jìn)行熱度話題的內(nèi)容討論和分享,而在新浪微博的開放平臺運(yùn)營之后,新浪微博和各種應(yīng)用進(jìn)行接入合作,就有源源不斷的互聯(lián)網(wǎng)內(nèi)容被用戶分享到新浪微博這個(gè)平臺。而微博的分享機(jī)制決定了其對互聯(lián)網(wǎng)內(nèi)容的過濾作用,用戶在瀏覽海量的互聯(lián)網(wǎng)資訊的時(shí)候發(fā)現(xiàn)優(yōu)質(zhì)內(nèi)容通過微博分享插件將其分享至新浪微博,在這個(gè)過程中無形的對互聯(lián)網(wǎng)的內(nèi)容進(jìn)行了一次篩選和傳播,篩選出了相對優(yōu)質(zhì)的內(nèi)容,在微博這個(gè)大社區(qū)進(jìn)行分享。
2:社會化搜索引擎的形態(tài)延續(xù)
在傳統(tǒng)搜索引擎在社會化關(guān)系上深度挖掘的時(shí)候,如Google+1,百度的 like,傳統(tǒng)的搜索引擎除了自身的排序算法之外,會根據(jù)用戶行為進(jìn)行搜索結(jié)果排序,都是通過用戶的喜好點(diǎn)擊進(jìn)行統(tǒng)計(jì)和分析推薦。而微博這個(gè)大社區(qū)在內(nèi)容傳播機(jī)制上已經(jīng)進(jìn)行過統(tǒng)計(jì)和分析:從微博的轉(zhuǎn)發(fā)和評論數(shù)可以對內(nèi)容傳播的關(guān)鍵字進(jìn)行統(tǒng)計(jì),對來自互聯(lián)網(wǎng)的所有網(wǎng)址的 URL 在新浪微博上的點(diǎn)擊、分享等行為進(jìn)行統(tǒng)計(jì)。通過以上統(tǒng)計(jì)可以通過算法得出推薦機(jī)制。
3:大數(shù)據(jù)的出口
新浪微博掌握了大量的用戶微博內(nèi)容分享和傳播數(shù)據(jù),并且在數(shù)據(jù)量足夠大的時(shí)候已經(jīng)能對傳統(tǒng)搜索引擎的排序和算法產(chǎn)生影響,傳統(tǒng)的互聯(lián)網(wǎng)搜索引擎可以通過新浪微博的接口,獲取互聯(lián)網(wǎng)上的某個(gè)網(wǎng)址的URL 在新浪微博中的轉(zhuǎn)發(fā)和點(diǎn)擊量等數(shù)據(jù),這會有助于搜索引擎調(diào)整自身搜索結(jié)果排序,為用戶提供更智能的搜索結(jié)果。
微博搜索的問題
1:遺傳病--信息過剩
微博本身的自媒體屬性是強(qiáng)大的信息來源,而多樣化的信息來源也產(chǎn)生可不可避免的問題:信息過剩。據(jù)統(tǒng)計(jì),新浪微博每天有近一億的內(nèi)容產(chǎn)生,每時(shí)每刻,微博可能都在產(chǎn)生大量沒有被搜索意義的信息和數(shù)據(jù),在實(shí)時(shí)性這個(gè)邏輯下“時(shí)間”有很強(qiáng)的決定性,時(shí)間流呈現(xiàn)的結(jié)果就是帶來大量對于普通用戶無意義的信息(不排除商業(yè)推廣),雖然在微博搜索里引入了熱門信息的標(biāo)簽,用“熱門”這個(gè)標(biāo)簽將信息按照質(zhì)量進(jìn)行排序,但在如此龐大的信息流面前,顯得有些脆弱。
2:硬傷--內(nèi)容特性導(dǎo)致的關(guān)鍵詞判斷
微博的內(nèi)容限制在 140 字以內(nèi),相對與傳統(tǒng)的網(wǎng)頁內(nèi)容來說 140 字還是太短了,這導(dǎo)致搜索引擎很難從文本角度或語義角度找到真正的“關(guān)鍵詞”.更多的只是出現(xiàn)搜索詞,但用戶使用搜索并不只是需要搜索詞,搜索詞還會導(dǎo)致搜索目標(biāo)相差很遠(yuǎn)的信息也可以被搜索到,甚至有可能被一些垃圾信息惡意添加熱門標(biāo)簽。
3:五官不全--信息的組織形式
目前微博搜索結(jié)果的呈現(xiàn)方式仍是傳統(tǒng)搜索引擎的展現(xiàn)方式,將搜索結(jié)果簡單的排列展示出來。而對于微博這樣的新平臺,與傳統(tǒng)搜索引擎抓取互聯(lián)網(wǎng)海量信息的方式不同的是數(shù)據(jù)都是來源于自身,就數(shù)據(jù)本身來說是可掌控的,微博完全可以做一些不同于傳統(tǒng)搜索的方式,將信息進(jìn)行重組,就如百度百科那樣的信息整理,將微博的碎片化數(shù)據(jù)重新歸類組織,這樣帶來的直接好處是用戶通過搜索微博本身的碎片化數(shù)據(jù)得到的是一個(gè)立體的信息展現(xiàn)方式,這才是用戶的真正需求。
4:發(fā)育不良--個(gè)性化搜索
如極客公園之前的文章提到的那樣(詳見:Baidu+1--搜索社交化),傳統(tǒng)的搜索引擎都在謀求社會化個(gè)性化的搜索展現(xiàn)和內(nèi)容挖掘,但微博本身的數(shù)據(jù)特性就基于社會化和個(gè)性化,但這一點(diǎn)在微博搜索上沒有任何體現(xiàn),簡單粗暴的信息羅列與傳統(tǒng)的搜索引擎并無太大區(qū)別,用戶還需要花時(shí)間和精力去進(jìn)行信息篩選,就這一點(diǎn)來說,掌握龐大數(shù)據(jù)的新浪微博完全可以在此處深度挖掘,連QQ的關(guān)系鏈都能挖出QQ圈子(詳見:QQ圈子:實(shí)名社交的潘多拉魔盒),微博搜索為什么不在這一步上多做改進(jìn)呢?
鑒于新浪微博的盈利問題一直是個(gè)大?。ㄔ斠姡盒吕宋⒉┑纳虡I(yè)化之困),不得不讓人將微博搜索朝商業(yè)化的角度去聯(lián)想,畢竟在傳統(tǒng)搜索引擎上有很多的商業(yè)模式在微博搜索里都是可以直接借鑒并利用的,至于能不能在滿足用戶需求的前提下能成功實(shí)現(xiàn)商業(yè)化,這個(gè)就不得而知了,總之掌握如此龐大的用戶數(shù)據(jù)的微博搜索,還有很多可以深挖的地方。
微博的憂傷:度娘的競價(jià)排名,總是學(xué)不會……
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 新能源車技術(shù)升級搶先看,ChatGPT崩了引熱議:未來科技如何破局?
- 自動駕駛行業(yè)大洗牌即將結(jié)束,小馬智行引領(lǐng)千臺車隊(duì)新篇章
- 微軟反壟斷風(fēng)暴:Office捆綁銷售引質(zhì)疑,云服務(wù)策略遭調(diào)查,巨頭陷困境
- 顯卡漲價(jià)風(fēng)暴來襲!NVIDIA/AMD緊急應(yīng)對,全力加速生產(chǎn)運(yùn)回本土
- 微軟新目標(biāo):用1000億美元打造實(shí)用通用AI,未來可期但需謹(jǐn)慎
- 亞馬遜云科技陳曉建預(yù)測:未來三年內(nèi),生成式AI將引發(fā)云市場新革命
- 林肯中國辟謠:財(cái)務(wù)調(diào)整非合并,業(yè)務(wù)不變穩(wěn)如泰山
- 字節(jié)跳動研發(fā)大手筆:2024年投入接近BAT之和,能否引領(lǐng)中國OpenAI新潮流?
- 跨境匯款平臺新舉措:螞蟻集團(tuán)開發(fā)者服務(wù)限每日10萬美元,助力全球交易更便捷
- 我國充電樁建設(shè)提速,50%增長背后的高速服務(wù)區(qū)充電新篇章
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。