文|三易生活
幾年前,“打開App、閱讀全文”堪稱是大家上網(wǎng)時(shí)一個(gè)幾乎無法逃脫的“毒瘤”,稍有不慎就會(huì)被強(qiáng)制跳轉(zhuǎn)到應(yīng)用商店下載App。以至于在2022年春季,工信部發(fā)文督促相關(guān)互聯(lián)網(wǎng)企業(yè)整改、不得要求用戶不下載App就不給看全文,并不得自動(dòng)或強(qiáng)制下載應(yīng)用。然而近日有網(wǎng)友爆料稱,知乎網(wǎng)頁(yè)端又開始出現(xiàn)了非登錄用戶無法查看全文的情況。
根據(jù)我們的實(shí)測(cè),非登錄用戶如果點(diǎn)擊“展開閱讀全文”,知乎確實(shí)會(huì)自動(dòng)彈出登錄窗口。不過讓人意外的的是,在WAP端以非登錄狀態(tài)查看知乎的網(wǎng)頁(yè)仍可以完整查看內(nèi)容。這也就意味著,知乎似乎沒有走上當(dāng)年一眾資訊類App的老路,即完整內(nèi)容只對(duì)登錄用戶開放、非登錄用戶只能看到片段。但就像目前一眾頭部電商網(wǎng)站的網(wǎng)頁(yè)版必須完成驗(yàn)證才能使用完整功能一樣, 背后其實(shí)都有商業(yè)方面的考量。
自進(jìn)入大數(shù)據(jù)時(shí)代以來,用戶數(shù)據(jù)的價(jià)值就陸續(xù)被充分挖掘,互聯(lián)網(wǎng)廠商也發(fā)現(xiàn)通過分析用戶的行為,進(jìn)而可以總結(jié)出某一類用戶群體的偏好,因此也就有了所謂的用戶畫像。而借助用戶畫像,互聯(lián)網(wǎng)廠商可以知道每一位用戶是什么的年齡、性別、購(gòu)物偏好,由此數(shù)字廣告行業(yè)也就有了完成精準(zhǔn)投放的可能。
但用戶畫像的完善和更新都依賴用戶登錄,如果用戶“退化”為訪客,這一切就變成了空中樓閣,互聯(lián)網(wǎng)廠商也就無法知道你的行為了。但廣告無疑都是大量互聯(lián)網(wǎng)廠商最重要的業(yè)務(wù),所以為了自家的錢袋子,這些廠商當(dāng)然就有強(qiáng)烈的動(dòng)力去“督促”用戶登錄自己的賬號(hào)。
為了給非登錄用戶“添堵”,長(zhǎng)期以來知乎其實(shí)對(duì)于未登錄用戶都不那么友好,只要打開子頁(yè)面就會(huì)一直使用彈窗要求用戶登錄。在有了彈窗喚醒用戶登錄的操作在前,進(jìn)一步強(qiáng)制要求用戶必須登錄才能查看完整內(nèi)容的也就不那么令人感到意外了。
更何況,與之前用戶可以通過油猴腳本等方式屏蔽知乎的登錄彈窗不同,這一次知乎做得“更絕”。打開F12查看網(wǎng)頁(yè)的源代碼就會(huì)發(fā)現(xiàn),在沒有登錄的情況下,知乎壓根就沒有傳輸回答的完整數(shù)據(jù)。換而言之,就算通過技術(shù)手段屏蔽登錄彈窗,用戶也不能在非登錄狀態(tài)下查看完整的知乎回答。
那么知乎為什么要這樣做呢?如果再結(jié)合近期知乎修改robots.txt文件,答案也就呼之欲出了。
robots.txt是一種存放于網(wǎng)站根目錄下的ASCII編碼的文本文件,是控制網(wǎng)站被搜索內(nèi)容的一種策略,它的唯一作用就是告訴搜索引擎的user-agent(網(wǎng)絡(luò)爬蟲),網(wǎng)站中的哪些內(nèi)容是不對(duì)搜索引擎開放、哪些內(nèi)容又可以被爬取。
在這一次robots.txt的修改之后,知乎方面已經(jīng)只允許百度和搜狗這兩個(gè)搜索引擎抓取內(nèi)容,此前的谷歌和Bing則被從名單上移除,這也就意味著用戶在知乎發(fā)布的任何新內(nèi)容都不會(huì)被谷歌和Bing收錄。為何只有搜狗和百度例外,當(dāng)然是兩者與和知乎有著緊密的關(guān)系。根據(jù)知乎回港上市時(shí)披露的信息顯示,搜狗背后的騰訊是知乎的大股東,百度也在2019年聯(lián)合快手對(duì)知乎進(jìn)行了4.5億美元的戰(zhàn)略投資。
先是不再向未登錄用戶傳輸完整的回答數(shù)據(jù),再是修改robots.txt、屏蔽谷歌和Bing,知乎的這一套組合拳指向性其實(shí)已經(jīng)非常明確,為的就是不讓谷歌和Bing再繼續(xù)爬取自己的內(nèi)容。
事實(shí)上,目前內(nèi)容平臺(tái)向AI廠商賣數(shù)據(jù)已經(jīng)成為常態(tài),并且不同于網(wǎng)絡(luò)巨魔頻出的Reddit,作為問答社區(qū)的知乎在內(nèi)容質(zhì)量上是更有保障的。當(dāng)初微軟的New Bing搞AI搜索時(shí),就把知乎的回答作為了重要的參考文獻(xiàn)。
知乎創(chuàng)始人周源在一年前發(fā)布“知海圖AI”中文大模型的時(shí)候就曾強(qiáng)調(diào),知乎擁有中文互聯(lián)網(wǎng)大量高質(zhì)量?jī)?nèi)容,這正是其研發(fā)大語言模型的優(yōu)勢(shì)所在。到了2024知乎發(fā)現(xiàn)大會(huì),周源更是表示,專業(yè)、真實(shí)的真人分享,認(rèn)真、友善的人際交流,和透明、高效的信息機(jī)制,讓知乎可以成為AI時(shí)代的可信賴社區(qū)。由此可見,知乎管理層對(duì)于平臺(tái)內(nèi)容在AI領(lǐng)域的價(jià)值是有清晰認(rèn)知的。
既然如此,無論是強(qiáng)制登錄、還是禁止搜索引擎抓取,都是知乎為了避免自家內(nèi)容被某些AI廠商抓取、成為訓(xùn)練AI大模型的語料,所做出的防御性措施。既然百度和騰訊是知乎的股東、是重要的合作伙伴,向其開放數(shù)據(jù)就是應(yīng)有之義,而在業(yè)務(wù)上沒有聯(lián)系的微軟和谷歌,自然是不可能繼續(xù)免費(fèi)獲取數(shù)據(jù)了。但如果將知乎的這一操作視為是向谷歌和微軟詢價(jià),似乎也不是不可以。
只可惜在這一過程中,知乎方面似乎沒有把用戶體驗(yàn)當(dāng)回事。