文|腦極體
“您認(rèn)為AI公司在昆明,跟北上廣相比有什么優(yōu)勢(shì)?”
“我覺得昆明就是中國(guó)的硅谷,氣候特別好?!?/p>
這段對(duì)話,是在一次人工智能主題座談會(huì)上真實(shí)發(fā)生的。
經(jīng)常參加這類交流活動(dòng)的朋友可能會(huì)懂,這類問(wèn)題一般在“遞話”,給受訪人一個(gè)“安利”自家的產(chǎn)品、技術(shù)、差異化價(jià)值的由頭。所以當(dāng)現(xiàn)場(chǎng)有人拋出這個(gè)問(wèn)題時(shí),我也做好了聽到一堆PR公關(guān)辭令的準(zhǔn)備。
沒想到,這位昆明某AI服務(wù)商、數(shù)據(jù)科技公司的技術(shù)負(fù)責(zé)人,給出的答案是大家都沒有設(shè)想過(guò)的。但這種“意料之外”,展現(xiàn)出在“北上廣”這類大城市少見到的“地氣”。
活動(dòng)結(jié)束后,我和這位技術(shù)負(fù)責(zé)人單獨(dú)聊了聊,又發(fā)現(xiàn)了一種“意料之外”。
他們公司也在做大模型,用的是開源Llama架構(gòu)+國(guó)產(chǎn)算力,經(jīng)由私有數(shù)據(jù)微調(diào),為云南游客提供線上問(wèn)答服務(wù)。
你可能會(huì)問(wèn),AI模型都不是自己從底層代碼寫上來(lái)的,有什么差異化競(jìng)爭(zhēng)力?實(shí)際上并不是大家想的那么簡(jiǎn)單,只要調(diào)用API再用數(shù)據(jù)跑一遍就行了,他們?cè)谀P椭庾龅墓ぷ鞣浅6嗲以鷮?shí)。
比如,他們服務(wù)的一些云南本地企業(yè),可能連數(shù)據(jù)標(biāo)注、數(shù)據(jù)治理、數(shù)據(jù)工具鏈等基礎(chǔ)概念都不知道,高質(zhì)量數(shù)據(jù)集、文檔也沒有,想要訓(xùn)練專有AI模型,就得從自己組建“標(biāo)注組”開始。因?yàn)榭蛻舳己茉谝鈹?shù)據(jù)隱私,所以一個(gè)組的項(xiàng)目做完就要解散,標(biāo)注人才就流失了,下次再重新建組。今天的AI落地,依然高度依賴“有多少人工就有多少智能”。
當(dāng)我們走到三、四線城市,發(fā)現(xiàn)這里的AI公司和開發(fā)者,對(duì)AI的認(rèn)知和做法,都有很大的不同。
用這些“意料之外”,我們可以大概拼出一張拼圖,上面寫著:在小城市做AI,究竟是一種什么體驗(yàn)。
小城做AI,如同養(yǎng)“中華田園貓”
雄踞全球科技資本和人才的硅谷,是OpenAI、DeepMind等頂級(jí)AI機(jī)構(gòu)生長(zhǎng)的土壤。那么,中國(guó)三、四線小城市的一方水土,會(huì)孕育出怎樣的AI呢?
在云南,我見到了兩個(gè)AI服務(wù)商,以及不少開發(fā)了行業(yè)AI應(yīng)用的實(shí)體企業(yè),他們的AI模型有一個(gè)共同點(diǎn):都使用通用大模型作為基座。比如基于開源Llama 2架構(gòu),加上自有數(shù)據(jù)、客戶數(shù)據(jù)進(jìn)行精調(diào),底層代碼都不是自己從頭寫上來(lái)的。
站在巨人的肩膀上,是目前在小城市做AI的最優(yōu)解。
當(dāng)?shù)氐腁I開發(fā)者告訴我,首先,他們測(cè)試了市面上主流的開源大模型和閉源大模型,最終選擇了Llama,原因是模型在業(yè)務(wù)場(chǎng)景下的表現(xiàn)好,而且生態(tài)夠豐富,社區(qū)資源多,配套工具成熟,這給他們的后續(xù)訓(xùn)練和開發(fā)減少了很多難度。
此外,身在三、四線城市的AI公司,往往并沒有足夠的預(yù)算、算力、工程人才去從頭訓(xùn)練一個(gè)新的大模型,加入開源社區(qū)或閉源生態(tài)是最現(xiàn)實(shí)的選擇。一位技術(shù)負(fù)責(zé)人說(shuō),他們沒法像大廠那樣囤上幾千幾萬(wàn)張英偉達(dá)算力卡,加上N卡價(jià)格瘋漲,所以用的是國(guó)產(chǎn)算力,雖然需要解決跟CUDA的兼容性問(wèn)題,但能滿足他們的需求,是目前比較有性價(jià)比的選擇。
另外,他們?cè)诒镜卮诡愘惖?,?shù)據(jù)和工程是核心競(jìng)爭(zhēng)力。這些三、四線城市的AI公司,沒有股價(jià)壓力,也不需要給投資人PR,專注于某一個(gè)非常小的垂類場(chǎng)景,一般也是大廠看不上、不會(huì)去碰的小市場(chǎng),依靠私有數(shù)據(jù)積累和工程化交付的能力,就能建立起商業(yè)模式。
因?yàn)楹芏嗦涞貓?chǎng)景,只有在當(dāng)?shù)厣钊肓私庑袠I(yè)才能發(fā)現(xiàn)。
比如一個(gè)AI公司,基于開源大模型+自有旅游數(shù)據(jù)開發(fā)的民宿大模型,已經(jīng)在云南大理的民宿落地了。而將大模型的對(duì)話能力,打造成“24小時(shí)AI管家”,這個(gè)靈感來(lái)自民宿會(huì)遇到社恐的游客,或者不希望暴露隱私,不想因?yàn)閃iFi密碼等小事麻煩服務(wù)人員,管家的介入很難做到恰到好處,讓游客住的不夠舒適自在。而大模型出來(lái)之后,就在旅客和管家之間,多了一個(gè)AI交互的緩沖地帶,一些小問(wèn)題通過(guò)AI管家就能解決,需要人工服務(wù)時(shí)隨叫隨到,這樣就很好地解決了旅客的顧慮。
目前,該公司的AI大模型服務(wù),主打的就是可落地、支持私有化,目前覆蓋了文旅、工業(yè)、政務(wù)等場(chǎng)景,業(yè)務(wù)營(yíng)收有70%以上來(lái)自大型企業(yè)的數(shù)智化。
實(shí)話說(shuō),很多一線城市的AI創(chuàng)業(yè)公司、高??蒲性核蛟斓拇竽P停嘉幢啬墚a(chǎn)生這樣的落地能力和經(jīng)濟(jì)價(jià)值。
總的來(lái)說(shuō),我的感受是,三、四線城市的技術(shù)從業(yè)者,上來(lái)就是從場(chǎng)景里找機(jī)會(huì),找跟AI的結(jié)合點(diǎn),反而更容易出效果。
一位開發(fā)者朋友是這樣說(shuō)的,“搞AI就像養(yǎng)貓,科學(xué)家們和企業(yè)會(huì)養(yǎng)聰明的品種貓,這跟我沒什么關(guān)系,我喜歡養(yǎng)小貓串串,把AI領(lǐng)域跟人文藝術(shù)領(lǐng)域結(jié)合起來(lái),這個(gè)品種你沒見過(guò)吧”。
將通用大模型的“品種貓”跟本地場(chǎng)景、本土需求相結(jié)合,進(jìn)行“雜交”,養(yǎng)出一只只“混血小貓”,這些垂類AI應(yīng)用,就像中華田園貓,可能是大廠和科技媒體人不太關(guān)注的,卻沐浴著云南得天獨(dú)厚的陽(yáng)光,真實(shí)而有生命力地成長(zhǎng)著。
在小城市做AI的可能性
在交流活動(dòng)中,有好幾個(gè)媒體人都詢問(wèn),在云南做AI有哪些阻礙和挑戰(zhàn)。真正的問(wèn)題,似乎在意料之外,又在情理之中。
所謂意料之外,是很多問(wèn)題已經(jīng)在被積極解決了。
比如基礎(chǔ)設(shè)施,在大家的印象中,三、四線城市的數(shù)字基礎(chǔ)設(shè)施發(fā)展比較晚,發(fā)展AI的資源稟賦比較薄弱。實(shí)際上,基礎(chǔ)設(shè)施在當(dāng)?shù)卦絹?lái)越不成為問(wèn)題。
拿算力來(lái)說(shuō),云南的算力資源已經(jīng)可以滿足當(dāng)?shù)谹I的開發(fā)需求。當(dāng)?shù)毓ぷ魅藛T告訴我們,由于電價(jià)便宜,氣候條件好,所以云南很適合發(fā)展AI人工智能數(shù)據(jù)中心,前文提到的民宿大模型,就是在昆明人工智能計(jì)算中心上進(jìn)行訓(xùn)練的,采用的國(guó)產(chǎn)算力。當(dāng)?shù)亟煌I(lǐng)域的數(shù)據(jù)中心工作人員也提到,該行業(yè)數(shù)據(jù)中心已經(jīng)完成了60%的國(guó)產(chǎn)替代率。
至于數(shù)據(jù),參加交流活動(dòng)的兩家AI服務(wù)商,此前都是數(shù)據(jù)服務(wù)提供商。其中一個(gè)成立于2018年,在2020年的時(shí)候就形成了第一版數(shù)據(jù)解決方案,和一、二線的大廠簽訂了合作關(guān)系,積累了大量的數(shù)據(jù)資源和工程經(jīng)驗(yàn)。而算法,如前所說(shuō),依托全球領(lǐng)先的開源模型和社區(qū),當(dāng)?shù)谹I公司也可以快速上手開發(fā)。
那么,當(dāng)?shù)谹I發(fā)展的真正約束條件是什么呢?
一是遠(yuǎn)離產(chǎn)業(yè)帶。行業(yè)AI解決方案包含了多個(gè)環(huán)節(jié)和生產(chǎn)鏈條,很多小城市還沒有建立起產(chǎn)業(yè)集聚優(yōu)勢(shì),導(dǎo)致生產(chǎn)環(huán)節(jié)中存在斷點(diǎn)。一位昆明當(dāng)?shù)氐腁I服務(wù)商提到,客戶的私有化部署,往往需要單獨(dú)成立標(biāo)注組,項(xiàng)目完成就解散了,人才就要流失。而他們跟省外的標(biāo)注公司合作,有的要收取加盟費(fèi),有的對(duì)團(tuán)隊(duì)規(guī)模有要求,必須達(dá)到100人以上,這就給他們的項(xiàng)目增加了不少成本。
二是缺人。既然到外省找人很麻煩,那么找本地人才呢?答案就是當(dāng)?shù)貨]有那么多AI人才。那一場(chǎng)交流活動(dòng)中,也有云南當(dāng)?shù)氐腁I產(chǎn)業(yè)學(xué)院老師參加,對(duì)方提到,該學(xué)院今年招收了200名人工智能專業(yè)的本科生?,F(xiàn)場(chǎng)一家AI公司表示:“200個(gè)?根本不夠用啊?!?/p>
除了人數(shù)少,由于人工智能是一個(gè)新興專業(yè),當(dāng)?shù)匾策€在探索培養(yǎng)方案,有老師提到,目前AI教學(xué)還存在跟應(yīng)用領(lǐng)域不夠貼近的問(wèn)題,企業(yè)提供的AI實(shí)訓(xùn)平臺(tái)不符合教學(xué)、科研的需求,學(xué)校只能自己開發(fā)。
如何解決上述困境?我也在當(dāng)?shù)乜吹搅艘环N跟開源文化有點(diǎn)類似的產(chǎn)業(yè)集群創(chuàng)新模式,那就是“抱團(tuán)取暖”。
一家本地的數(shù)據(jù)服務(wù)公司,將自己打造的數(shù)據(jù)標(biāo)注、數(shù)據(jù)治理、數(shù)據(jù)探源等工具鏈,開源出來(lái),豐富區(qū)域內(nèi)的數(shù)據(jù)資源。此外,依托昆明人工智能計(jì)算中心,當(dāng)?shù)匾苍陉懤m(xù)開展師資培訓(xùn)、工程師培訓(xùn)等人才培養(yǎng)項(xiàng)目,打通“學(xué)練訓(xùn)賽業(yè)”,推動(dòng)產(chǎn)學(xué)研用的融合。
遠(yuǎn)離了“北上廣”和“龍頭企業(yè)”的三、四線城市,由于AI產(chǎn)業(yè)鏈的零星聚集,反而跟彼此產(chǎn)生了格外強(qiáng)的引力,特別積極地希望貢獻(xiàn)出自己的一份力量。
產(chǎn)業(yè)AI的“面子”和“里子”
說(shuō)到這里,你可能會(huì)問(wèn),那三、四線城市的AI落地情況究竟怎么樣?跟當(dāng)?shù)禺a(chǎn)業(yè)相結(jié)合的廣度和深度如何呢?
我可以分享兩個(gè)真實(shí)的見聞故事:
一個(gè)是“面子”。在中國(guó)-老撾的邊境城市,當(dāng)?shù)毓ぷ魅藛T帶我們參觀了位于火車站附近的“智慧展示中心”。我們發(fā)現(xiàn),這個(gè)展示中心的作用,確實(shí)是“展示”,我們到大屏幕前觀看完兩部宣傳片,就沒能再深入了。
另一個(gè)是“里子”。當(dāng)我們走到日常運(yùn)行的貨車檢查站,一個(gè)工作人員對(duì)著鏡頭侃侃而談,告訴我們5G+AI的應(yīng)用如何落地,讓貨車一站式通關(guān),避免了層層卡驗(yàn),將每輛車的平均通關(guān)時(shí)間從8分鐘縮短到4分鐘。從技術(shù)規(guī)劃到落地效果,講的非常清晰,帶著一種很了解一線實(shí)際情況才有的揮灑自如。
對(duì)此,不同的人可能會(huì)有不同的解讀角度。
AI應(yīng)該樂(lè)觀嗎?好像是的,它已經(jīng)抵達(dá)了最遙遠(yuǎn)的邊境線,在n線城市落地。AI應(yīng)該悲觀嗎?也有點(diǎn)道理,有效的AI應(yīng)用似乎就那么多,作為“典型案例”存在,而如果沒有AI場(chǎng)景的遍地開花,那么建好的AI基礎(chǔ)設(shè)施發(fā)揮的作用,確實(shí)就是擺在那里,作為“展示”。
今天,三、四線城市的AI探索,處于一個(gè)智能化需求特別多、特別分散的階段,只能一個(gè)場(chǎng)景一個(gè)場(chǎng)景地滲透。而這也是本地AI企業(yè)和開發(fā)者的機(jī)會(huì),也有越來(lái)越多的人看到了這些地方存在的無(wú)數(shù)個(gè)被AI改變的可能性。
在當(dāng)?shù)刈咴L時(shí),本地AI企業(yè)提到一句話:通過(guò)一個(gè)場(chǎng)景,探索出一些模式,應(yīng)用到整個(gè)行業(yè),一個(gè)個(gè)場(chǎng)景的智能化,拼起來(lái)就是整個(gè)行業(yè)的智能化。
他們確實(shí)也是這樣做的。
這些微小而分散的需求,是AI大廠和巨頭不愿意觸碰,做了也投入回報(bào)比很低的場(chǎng)景,被當(dāng)?shù)仄髽I(yè)一個(gè)接一個(gè)地解決著。
比如云南開發(fā)出的越南語(yǔ)、老撾語(yǔ)、緬甸語(yǔ)、柬埔寨語(yǔ)、泰語(yǔ)等南亞?wèn)|南亞語(yǔ)言的掃描筆、AI翻譯機(jī);幫助企業(yè)無(wú)需寫字段調(diào)用API,就能根據(jù)不同的使用場(chǎng)景,比如經(jīng)營(yíng)分析會(huì)、領(lǐng)導(dǎo)參觀匯報(bào)、財(cái)務(wù)數(shù)據(jù)上報(bào)等,實(shí)時(shí)生成任意需求BI的垂類大模型;為麻醉科提供高效智能排班服務(wù)的大模型等。
大模型狂奔這一年,已經(jīng)從價(jià)值炒作階段進(jìn)入到價(jià)值沉淀階段,有大模型廠商提出了“不作詩(shī)、只做事”的理念。那么,誰(shuí)來(lái)做事呢?
這些在小城市做AI的人,用一個(gè)個(gè)場(chǎng)景的拼圖,拼出了大模型“有用”的答案。而AI的小城故事,還會(huì)在這片土地一直講下去。