和其他互聯(lián)網(wǎng)企業(yè)一樣,Blued 也開始通過時下最熱門的技術(shù)——人工智能,應(yīng)用于產(chǎn)品日常運營中,以應(yīng)對越來越多涌入的新用戶,以此改善體驗。
面對數(shù)量巨大的用戶和社交網(wǎng)絡(luò)數(shù)據(jù)信息,如何為每個人找到身邊的好友并根據(jù)用戶興趣進(jìn)行匹配,成為 Blued 算法工程師面臨的極大挑戰(zhàn)。圖像、視頻、動態(tài)圖片對于社交網(wǎng)站的重要性不言而喻,算法工程師很大一部分工作就是處理與視覺信息相關(guān)的數(shù)據(jù),AI 成為他們解決問題的最佳利器。
圖像社交業(yè)務(wù)
據(jù) Blued AI 算法部數(shù)據(jù)科學(xué)家王英杰的介紹,Blued在平臺的圖像社交業(yè)務(wù)中已經(jīng)廣泛采用 AI 技術(shù)。
他們從 LGBT人群的陌生人社交切入市場,逐漸轉(zhuǎn)向興趣社交和泛娛樂化平臺,拓展出了很多使用場景。在這些使用場景下,用戶可以在 Blued 上發(fā)布人臉頭像、相冊、圖片動態(tài)、小視頻、直播等。鑒于視覺信息在社交產(chǎn)品的重要地位,用戶期望瀏覽興趣標(biāo)簽下的高顏值照片,用小視頻快速了解真實的對方,觀看推薦的主播直播。Blued 上社交、內(nèi)容、商業(yè)化模塊都已有落地的應(yīng)用在深度使用 AI 圖像技術(shù)。
在社交產(chǎn)品上,使用人臉檢測的技術(shù)篩選頭像照片中含人臉的照片,并對得到的人臉特征做相似性分析;對含人圖片進(jìn)行體型胖瘦的分類,通過檢測模型提取了一些身材和服飾上的標(biāo)簽,這些特征對于構(gòu)建社交推薦產(chǎn)品的模型是非常重要的特征;使用圖像分類的技術(shù)剔除掉不含人的小視頻;以及使用圖像檢測結(jié)合圖像分類的技術(shù)提取主播推薦的特征值等。
在變現(xiàn)業(yè)務(wù)方面,Blued基于圖像和短視頻的內(nèi)容feed流推薦產(chǎn)品,已經(jīng)推出了商業(yè)化廣告模塊;圖像算法在頭像認(rèn)證、隱私保護(hù)上的應(yīng)用也是會員和增值服務(wù)等變現(xiàn)業(yè)務(wù)的重要組成部分。
具體到AI圖像技術(shù)解決方案和應(yīng)用算法的內(nèi)部機(jī)制,王英杰解釋道,Blued的AI圖像技術(shù)方案根據(jù)產(chǎn)品需求,首先拆解出幾個核心的圖像任務(wù),選取適合的網(wǎng)絡(luò)模型,如人臉檢測模型、人臉識別模型、圖像標(biāo)簽檢測模型、圖像分類模型等;之后利用平臺上生產(chǎn)的大量圖片做訓(xùn)練和微調(diào),不斷迭代完些基礎(chǔ)模型;最后在不同的業(yè)務(wù)場景上,組合使用這些模型,并在使用的過程中根據(jù)測試結(jié)果隨時調(diào)整模型輸出閾值參數(shù)。從算法機(jī)制上講,模型的迭代,數(shù)據(jù)的累積,參數(shù)的調(diào)整,形成三個并行的演進(jìn)過程。同時,數(shù)據(jù)的累積促成模型的迭代,模型迭代后參數(shù)不斷優(yōu)化調(diào)整,參數(shù)優(yōu)化調(diào)整后獲得質(zhì)量更好的數(shù)據(jù)積累,從而推動()整個系統(tǒng)進(jìn)化。
通過這套在Blued內(nèi)部運行了半年的技術(shù)解決方案,Blued解決了以前靠人工審核、人工運營、產(chǎn)品規(guī)則解決不了的問題和實現(xiàn)不了的效果。比如在一些應(yīng)用了AI技術(shù)的產(chǎn)品模塊上,有超過30%的UV增長,人均PV有超過60%的增長,推薦成功率比人工精選提高2倍以上?,F(xiàn)在,Blued的算法模型基本上每個月都有大的迭代更新,但在與內(nèi)容生產(chǎn)環(huán)節(jié)的配合上,和內(nèi)容消費的社交轉(zhuǎn)化傾向性上,還有很多需要不斷完善算法、優(yōu)化目標(biāo)的地方。
為了體驗這款產(chǎn)品的性能如何,AI前線對該產(chǎn)品進(jìn)行了體驗測試。在注冊Blued賬號后,系統(tǒng)會通過用戶選擇的興趣標(biāo)簽進(jìn)行推薦。那么,Blued的推薦排序機(jī)制是怎樣運作的呢?
AI前線了解到,Blued數(shù)據(jù)平臺會收集用戶注冊填寫的基本資料信息,并結(jié)合用戶在平臺的內(nèi)容瀏覽行為產(chǎn)生興趣標(biāo)簽,Blued會進(jìn)一步探索用戶的社交關(guān)系鏈,并將這些數(shù)據(jù)導(dǎo)入推薦系統(tǒng)。另外,在推薦算法的基礎(chǔ)上,Blued還會考慮用戶定義的過濾和篩選條件進(jìn)行排序,但主要還是以登陸時間和距離遠(yuǎn)近為原則。
不尋常的技術(shù)挑戰(zhàn)
Blued用戶是相對特殊的群體,因此具有一些不同于普通網(wǎng)站的特點,并因此讓工程師們面臨“不同尋常”的挑戰(zhàn)。Blued的AI之路走得并非一帆風(fēng)順,很多時候,工程師們面臨著應(yīng)接不暇的挑戰(zhàn)。
王英杰向AI前線坦承,目前,Blued最大的技術(shù)瓶頸,是云端大規(guī)模數(shù)據(jù)并行運算,以及移動端模型運算效率問題。前者的難點在于模型計算平臺和數(shù)據(jù)存儲平臺目前還沒有打通,這一問題云計算服務(wù)已經(jīng)在著手解決了。后者的難點在于目前的方案在效率和性能上還沒有達(dá)到很好的平衡點,因為在移動端對算力和功耗要求較高。但王英杰相信,隨著移動端技術(shù)的快速發(fā)展,這個瓶頸很快就能突破。
Blued用戶也有不同的特點,包括興趣標(biāo)簽細(xì)分程度更大,用戶資料真實性的甄別難度更高,用戶反饋行為的分布上更不均衡,用戶的頻繁訪問次數(shù)更多等。這些都給算法的數(shù)據(jù)和算力提出更多挑戰(zhàn)。
而這些難題并非無解。在數(shù)據(jù)問題上的挑戰(zhàn),Blued通過提取更多特征,嘗試各種聚類和分類算法,特別是對數(shù)據(jù)缺失不敏感的模型,以及不依賴用戶反饋行為的模型等來解決。在算力問題上,則把計算壓力分配在離線計算、近線計算和在線計算上,根據(jù)數(shù)據(jù)隨時調(diào)整各個部分的計算頻次和計算量。
另外,社交網(wǎng)站往往是色情信息的“重災(zāi)區(qū)”,作為主要為LGBT人群提供服務(wù)的應(yīng)用,Blued還承擔(dān)著向用戶科普、宣傳艾滋病等疾病防治方面的任務(wù)。Blued同樣在面臨著這樣的挑戰(zhàn),具體體現(xiàn)在色情圖像、文字、低俗內(nèi)容識別等任務(wù)上。
對此,Blued在社區(qū)管理中通過人工審核團(tuán)隊制定嚴(yán)格規(guī)范的識別標(biāo)準(zhǔn),在模型的訓(xùn)練和推理過程中考慮到不同分類檢測類別在準(zhǔn)確率和召回率上的不同要求,比如色情內(nèi)容的檢測需要更高的準(zhǔn)確率,性感內(nèi)容的檢測需要更高的召回率,這反過來提高了人工審核團(tuán)隊的復(fù)審效率。Blued告訴AI前線,他們在低俗內(nèi)容的識別上面臨的挑戰(zhàn)更大一些,具體體現(xiàn)在 1. 判斷標(biāo)準(zhǔn)隨時間會發(fā)生較大的變化,而且變化較快,需要不斷增減需要檢測的類別;2. 樣本準(zhǔn)確標(biāo)記難度大,模型的準(zhǔn)確率和召回率也都比較難保證。目前,Blued還在采取諸如嘗試不斷完善這個模型動態(tài)更新的流程,加大人工審核的力度,增加用戶舉報反饋的入口等措施來解決這個問題。
未來的技術(shù)規(guī)劃與探索
利用AI技術(shù)在產(chǎn)品和服務(wù)中的布局已經(jīng)鋪展開來,未來在技術(shù)上還會進(jìn)行更多的探索。
Blued的技術(shù)規(guī)劃是AI優(yōu)先,強調(diào)對于細(xì)分人群的個性化運營,把興趣社交知識數(shù)據(jù)化、模型化。基于不同類型細(xì)分人群的社交需求,設(shè)計合理的產(chǎn)品場景,找到合適的特征,選擇匹配的模型,設(shè)計如何選取正負(fù)樣本和細(xì)化的優(yōu)化目標(biāo)函數(shù)。在這個過程中,新的產(chǎn)品想法成為可能,產(chǎn)品和運營的經(jīng)驗知識也在模型的訓(xùn)練過程中被數(shù)據(jù)化。
未來AI技術(shù)一定會在Blued產(chǎn)品上越來越多的體現(xiàn)出來,不只是興趣社交領(lǐng)域,Blued還表示將探索新的商業(yè)化機(jī)會,比如新社交和新電商的結(jié)合等。
- 特斯拉Model Y新版預(yù)售,iPhone 18 Pro系列升級,汽車界與科技界碰撞新火花
- 小鵬汽車何小鵬回應(yīng)特斯拉 Model Y 撞臉風(fēng)波:設(shè)計碰撞,靈感碰撞,究竟誰更勝一籌?
- 日本車商2024年新車銷量下滑,本田跌至近10年最低位,中國市場面臨挑戰(zhàn)?
- 英偉達(dá)批評美政府AI芯片出口限制:限制不利己,全球轉(zhuǎn)向替代技術(shù)之風(fēng)
- 特斯拉煥新Model Y難敵華為問界R7,智能科技誰領(lǐng)風(fēng)騷?
- 開源巨頭聯(lián)手打造Chromium聯(lián)盟,推動Linux生態(tài)創(chuàng)新發(fā)展
- 曹德旺巨資辦校,福耀科技大學(xué)引領(lǐng)行業(yè)新風(fēng)向,培養(yǎng)未來之星
- 愛馳汽車陷股權(quán)凍結(jié)風(fēng)波,能否順利復(fù)工復(fù)產(chǎn)引關(guān)注
- 小鵬汽車CEO何小鵬:雷軍不僅直言不諱,還勸我多做營銷,不失為良師益友
- 馬斯克大膽計劃:未來十年內(nèi)特斯拉機(jī)器人產(chǎn)能提升10倍,300億機(jī)器人將顛覆各行各業(yè)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。