AI助紂為虐 內容農場卷土重來

TechWeb 文/席安如

萬物皆有鄙視鏈。

據(jù)說在有些互聯(lián)網(wǎng)公司面試的時候,面試官都喜歡問候選人一個問題,“你平時活躍在哪個技術社區(qū)”?如果答案是GitHub或者StackOverflow,那就是一個加分項;如果答案是CSDN,那么很可能成為減分項,甚至是不被錄用的判斷依據(jù)之一。

CSDN是中國最大的程序員社區(qū)。在其2023年發(fā)布的新聞稿中,它聲稱自己“擁有超過4500萬注冊用戶”和“6000多萬篇文章”。

讓CSDN在一些面試官眼中成為減分項的關鍵,正是來自這6000多萬篇文章——它們構成了中文互聯(lián)網(wǎng)上極為龐大的內容農場之一,更關鍵的是,它帶了一個很不好的頭,稀土掘金、簡書等內容平臺也開始主動或被動效仿。

電影院里,一旦前排的人站起來了,后面的觀眾就不得不跟著站起來,才能看得見屏幕。

CSDN就是那個第一個站起來的。

第一代內容農場:自己做內容,外面找流量

內容農場并非新生事物,而是伴隨著搜索引擎的發(fā)展而出現(xiàn)的“寄生物”。

早在2009年,美國一家名叫Demand Media的內容農場公司老板就對《連線》雜志(Wired)放出豪言,聲稱要“每個月產(chǎn)出100萬篇文章,相當于每年制造四個維基百科”。第二年,也就是2010年,雅虎斥資9000萬美元(約合人民幣6億)收購了另一家同類公司 Associated Content。

要知道,同年美團剛從紅杉拿到了1200萬美元的A輪融資,而當時如日中天的百度2009年的營收也不足45億元人民幣。內容農場受“資本家”的青睞程度由此可見一斑。

原因非常簡單,內容農場同時滿足了“開源”和“節(jié)流”的需求。一方面,從搜索引擎帶來的滾滾流量,為這些網(wǎng)站產(chǎn)生了不少的廣告收入,這也是互聯(lián)網(wǎng)公司最主要的收入來源之一;另一方面,據(jù)說當時內容農場為每篇文章開出的稿費僅為3.5美元,遠低于付給人工撰寫稿件的20美元左右的稿費標準。

與這些美國公司不同的是,CSDN成為內容農場或許并非有意為之,而是歷史發(fā)展之巧合。

海量內容只是內容農場成功的必要條件之一,基本上花錢和堆人頭就能辦到,但是另一個必要條件——獲取流量的門檻就要高許多。在那個年代,人們搜索互聯(lián)網(wǎng)上的內容主要依賴的還是搜索引擎。通過技術手段,讓搜索引擎抓取到頁面,并且將它盡量排到搜索結果列表的前面,這個技術叫做“搜索引擎優(yōu)化”,簡稱為SEO。

作為一個技術社區(qū),CSDN的SEO技術顯然是足夠強的。至于內容的來源,它并沒有像美國人那樣發(fā)稿費雇人來寫。當時,很多國內的技術牛人喜歡在CSDN博客上發(fā)布文章來分享經(jīng)驗和技術,這些文章增加了CSDN的權重;與此同時,越來越多的后來者和新手也開通了CSDN博客,但是他們更習慣將它作為學習筆記來使用,于是產(chǎn)生了大量的內容類似甚至完全相同的文章。

當文章數(shù)量達到某個級別并突破閾值后,搜索引擎終于被攻占了。

十幾年來,搜索引擎對內容農場的態(tài)度基本上是持否定的,畢竟類似上圖這樣的搜索結果非常影響用戶體驗。不過從實際情況來看,自從2010年百度最大的競爭對手退出中國市場之后,穩(wěn)坐國內搜索引擎頭把交椅的百度,并沒有從根本上——也就是從技術和規(guī)則上去解決這個問題,相反的,一大批類似的網(wǎng)站如雨后春筍般出現(xiàn)。

現(xiàn)在,你在百度搜索技術問題的話,除了CSDN之外,首屏出現(xiàn)的大概率還會有博客園、稀土掘金、簡書……以及耳熟能詳?shù)哪菐准以朴嬎銖S商的“技術社區(qū)”,他們將大量過期的、重復的技術文檔復制來復制去,一邊浪費著自己的服務器和帶寬,一邊浪費著用戶的時間。

面對這個局面,大部分程序員還是選擇了接受,否則CSDN也不會有4500萬用戶了。

第二代內容農場:搬別人的內容,養(yǎng)自己的流量

當智能手機開始普及,手機流量開始管飽,人們使用互聯(lián)網(wǎng)的方式變了。買東西會在電商APP中搜索,看視頻會在視頻APP中搜索,看小說會在閱讀APP中搜索……瀏覽器和搜索引擎不再成為必經(jīng)之路。

那些新入行的程序員們,也不再是看著CSDN們的博客學習,B站成了它們的新歡。雖然依然有很多程序員在把博客當筆記,但是從搜索到的內容來看,明顯是比之前少了。

在這種流量池各自為政的情況之下,新的內容農場出現(xiàn)了。不過這一次,他們不再自己生產(chǎn)內容,而是通過技術手段,將別人創(chuàng)作的內容進行二次加工來產(chǎn)生大量內容,然后再以此獲得更多的平臺推薦。到了短視頻全面普及之后,這種跡象更加明顯。

與前一個時代不同的是,這種形式的內容農場,不但更容易得到平臺的支持,用戶對之也更容易接受,因為省去了自己搜索的麻煩。所以,除了部分原創(chuàng)作者的吐槽之外,倒是鮮見有用戶對此有怨言。

AIGC時代:自己編內容,自己有流量

OpenAI一聲炮響,拉著全球網(wǎng)民進入了AIGC新時代。

前面說過,形成內容農場有兩個必要條件:一是內容,二是流量。到了AIGC時代,一分鐘內可以生成數(shù)篇內容類似但又不完全相同的文章,內容的數(shù)量和質量都遠超之前。這些AI生成的內容迅速出現(xiàn)在微信公眾號、小紅書、知乎之類的內容平臺,不過此時仍然處于上一個時代的范疇,AI只負責生產(chǎn)內容。

直到今年五月,有用戶在使用字節(jié)跳動旗下對話式AI產(chǎn)品“豆包”時發(fā)現(xiàn),其答案的參考來源竟然來自豆包自身生成的內容,至此,AI時代的內容農場初具雛形。

也就是說,如果你日常將對話式AI當作與互聯(lián)網(wǎng)交互的入口的話,那么看到的答案完全有可能也是來自AI自身,而這些AI生成的答案中,本身又可能存在不準確甚至荒謬之處,比如之前廣為流傳的“小帥與小美”(很多電影解說短視頻給男女主角取的名字)就曾被AI當作參考答案。

雖然此次“事故”被迅速修復,但是幾乎所有對話式AI都具備這個能力,而且此次被用戶發(fā)現(xiàn),是因為“豆包”使用自有的域名(doubao.com)來生成靜態(tài)頁面,如果使用的是一個看起來和字節(jié)跳動沒有任何關系的域名的話,那么很可能永遠都不會被用戶發(fā)現(xiàn)。

立法層面,目前的相關的法律法規(guī)主要針對的是“有害內容”,對于這種低質但無害的內容并沒有明確約束,所以似乎只能靠廠商的自我約束了。

廠商的確在行動,不過這些行動更多的是在“交互入口”處建立壁壘。比如百度的搜索引擎,將自己的AI“文心一言”生成的答案排在了最上面,這屬于“用魔法打敗魔法”;知乎的AI“知乎直答”也是給自己的數(shù)據(jù)更高權重。

唯一值得慶幸的是,當下對話式AI還沒有成為人們與互聯(lián)網(wǎng)交互的主流,人們還有時間來完善這個體系,避免AI內容農場的大規(guī)模出現(xiàn)。

我們可以怎么辦?

第一代內容農場時代,程序員們尚且可以通過各種技術手段——比如使用瀏覽器插件uBlacklist在搜索結果中排除指定的網(wǎng)站——來規(guī)避內容農場出現(xiàn)在搜索引擎的結果中,或者干脆使用工具來阻斷對這些網(wǎng)站的訪問,但是普通人無能為力。

第二代內容農場時代,只有少部分人會選擇去屏蔽那些搬運者,大部分人都選擇了接受投喂。

面對即將到來的AI內容農場,人們可以怎么辦?你又會怎么辦?(席安如)

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2024-07-18
AI助紂為虐 內容農場卷土重來
面對即將到來的AI內容農場,人們可以怎么辦?你又會怎么辦?

長按掃碼 閱讀全文