正在閱讀:

供需錯(cuò)位的大模型

掃一掃下載界面新聞APP

供需錯(cuò)位的大模型

大模型的價(jià)值釋放有多大想象力,大模型賽道的玩家對(duì)落地就有多焦慮。

文|光子星球 吳坤諺

編輯|吳先之

征途是星辰大海,投入是無(wú)底洞窟,如果落地的產(chǎn)出缺了或是慢了,風(fēng)口過(guò)后的可持續(xù)發(fā)展和迭代都是空談。

細(xì)數(shù)一下比較成功的落地案例:前有妙鴨相機(jī)靠9.9一組寫真點(diǎn)燃朋友圈,可寫真這個(gè)需求太小、不太可持續(xù);后有360半年報(bào)披露其大模型業(yè)務(wù)創(chuàng)收2000萬(wàn)元,盡管與15.6億元的研發(fā)投入相比只是滄海一粟,但好歹見到了現(xiàn)金流,算得上是一個(gè)積極信號(hào)。

一個(gè)清晰的事實(shí)是,目前大模型的落地途徑比較單一,比較可靠的商業(yè)模式只有to B方向的大模型部署以及模型使用、訓(xùn)練的算力需求兩種,其價(jià)值釋放的緩慢可想而知。

即使是這兩種花了大半年時(shí)間摸清楚的邏輯,在智能化這樣的買方市場(chǎng)中,還有不少需要技術(shù)服務(wù)商突破的隔閡,例如怎么打開中小企業(yè)市場(chǎng)、減少定制化導(dǎo)致的高人力成本等。

進(jìn)一步說(shuō),各行各業(yè)迫切需要看到可靠的落地案例與方向,打消他們的顧慮,一起掏錢幫助大模型賽道的玩家們走上可持續(xù)的正軌。

我們對(duì)話了多家行業(yè)企業(yè),試圖管中窺豹,為大模型的價(jià)值釋放“摸底”。我們了解到的情況是,服務(wù)商“鞭長(zhǎng)莫及”的中小企業(yè)市場(chǎng)中,相當(dāng)一部分以調(diào)用開源模型來(lái)先吃螃蟹的企業(yè)已經(jīng)收獲了不小的效率躍升。而目前服務(wù)商們一致發(fā)力的,以制造業(yè)為主的KA市場(chǎng)卻對(duì)大模型相當(dāng)不感冒。

這對(duì)國(guó)內(nèi)大模型玩家而言不算是個(gè)好消息。

最大挑戰(zhàn):幻覺(jué)

美國(guó)社會(huì)學(xué)家Marc Prensky曾于2001年提出“數(shù)字原住民”的概念,泛指在21世紀(jì)的數(shù)字時(shí)代中成長(zhǎng)起來(lái)的年輕人。而在大模型的沖擊下,2023年進(jìn)入社會(huì)的年輕人或許將成為首批“AI原住民”。

就像7月初入職某家SaaS企業(yè)銷售崗的小張,因如今互聯(lián)網(wǎng)語(yǔ)境中充斥著的“萬(wàn)辭王”、“不打800個(gè)電話不能走”等段子而忐忑不安時(shí),大模型幫助他在人生第一份工作中穩(wěn)定下來(lái)。

小張入職第一天,他預(yù)想中“一位老銷售帶人熟悉業(yè)務(wù)”的流程并未出現(xiàn),而是領(lǐng)導(dǎo)簡(jiǎn)單介紹了一下工作強(qiáng)度、時(shí)間安排等情況后,就扔給他一個(gè)網(wǎng)址和一個(gè)文檔,讓他“看文檔熟悉業(yè)務(wù),有不懂的在網(wǎng)址里提問(wèn)”。

小張的第一份工作就這么開始了。據(jù)他所說(shuō),除了入職的頭兩天去了公司坐班,往后將近兩個(gè)月時(shí)間都在外跑業(yè)務(wù),只有團(tuán)隊(duì)開會(huì)的時(shí)候會(huì)回公司述職。而工作中遇到的疑問(wèn)如HR SaaS的客戶案例、銷售話術(shù)、市場(chǎng)價(jià)格比對(duì)等,他都可以在網(wǎng)址中提問(wèn)從而獲取答案。

“我找陽(yáng)哥(領(lǐng)導(dǎo))的次數(shù)估計(jì)連我提問(wèn)次數(shù)的一半都不到”,小張說(shuō),所謂網(wǎng)址便是大模型的交互頁(yè)面,該公司將大模型能力應(yīng)用在了新人銷售的培訓(xùn)和業(yè)務(wù)展開上。

據(jù)了解,該公司采用的第三方AI服務(wù)商的產(chǎn)品,模型能力來(lái)源于ChatGPT。他們將此前已成文檔的市場(chǎng)價(jià)格走向、公司業(yè)務(wù)流程、常見客戶QA等信息交由大模型整合為數(shù)據(jù)集,并提供快速檢索能力。據(jù)公司領(lǐng)導(dǎo)林陽(yáng)介紹,大模型目前已經(jīng)做到為新人銷售培訓(xùn)平均節(jié)約5天時(shí)間,這還是在尚未計(jì)入老銷售的時(shí)間成本的前提下。

此外,大模型還進(jìn)入他們多個(gè)崗位的工作流,如研發(fā)部門的初級(jí)代碼編寫、人力部門的JD編寫以及運(yùn)營(yíng)部門的客戶報(bào)告等。

只是林陽(yáng)還告訴光子星球,大模型能力只在銷售環(huán)節(jié)“效果拔群”,其余部門在使用上卻不盡如人意,主要起輔助作用。比如代碼生成大多局限于前端,而且生成內(nèi)容必須經(jīng)由人工校對(duì)。

人工校對(duì)必要性的背后是大模型難以避免的幻覺(jué)現(xiàn)象,簡(jiǎn)單來(lái)說(shuō)就是“一本正經(jīng)地胡說(shuō)八道”。其成因在于訓(xùn)練數(shù)據(jù)存在偏差以及訓(xùn)練方法NTP(預(yù)測(cè)文本)等。一個(gè)典型的例子是,我們讓某多模態(tài)模型生成一張“松鼠鱖魚”的圖片,生成結(jié)果與這道徽菜實(shí)際的樣子八竿子打不著。

顯而易見,幻覺(jué)是大模型落地嚴(yán)肅商業(yè)場(chǎng)景的最大挑戰(zhàn)之一,尤其是工業(yè)、金融等對(duì)精確度要求極致的場(chǎng)景。事實(shí)上,早在大模型之前,工業(yè)機(jī)器人與智能投研等AI應(yīng)用就試圖在工業(yè)、金融領(lǐng)域找到戰(zhàn)場(chǎng)。在部分業(yè)內(nèi)人士看來(lái),這些嘗試都免不了“形而上學(xué)”的意味。

老陳是南方頭部流體控制企業(yè)的高級(jí)工程師,浸淫流體控制設(shè)備十?dāng)?shù)年,甚至曾帶領(lǐng)團(tuán)隊(duì)參與核級(jí)流體控制設(shè)備的生產(chǎn)。作為典型的工廠老人,他對(duì)AI在工業(yè)流程中的應(yīng)用嗤之以鼻。

“工業(yè)生產(chǎn)第一要的是穩(wěn)定安全,只要‘幻覺(jué)’問(wèn)題存在,對(duì)穩(wěn)定安全就是一種威脅”,老陳說(shuō),“我看到的所謂工業(yè)機(jī)器人,宣傳了也有小十年的,到現(xiàn)在還只能做一些焊接、碼垛之類的簡(jiǎn)單活兒。”

老陳所言雖有些過(guò)激,卻不無(wú)道理,畢竟連創(chuàng)造GPT的OpenAI早在2021年便放棄了機(jī)器人業(yè)務(wù)。至于近來(lái)全球頂級(jí)公司開始關(guān)注的人形機(jī)器人賽道才剛剛開始,更別提應(yīng)用了。

老陳所見所思的工業(yè)數(shù)智化,更多在于避免工人的重復(fù)勞動(dòng)以提高效率。例如與供應(yīng)鏈上下游共同采買的云端系統(tǒng),讓產(chǎn)業(yè)鏈的各環(huán)節(jié)可以實(shí)時(shí)上傳生產(chǎn)進(jìn)度、器胚良品率等數(shù)據(jù),協(xié)調(diào)生產(chǎn)節(jié)奏與訂單交付時(shí)間,避免返工的情況。

老陳還向我們分享了一件趣事,曾經(jīng)他們公司接觸過(guò)一家主要提供CV領(lǐng)域產(chǎn)品檢驗(yàn)服務(wù)的第三方AI服務(wù)提供商,他也受邀參加了服務(wù)體驗(yàn)?!八麄兊哪P托枰蟾?0秒來(lái)判斷一個(gè)設(shè)備是否達(dá)到出廠需求,我們高級(jí)技工只需要目檢8秒,那我還不如花錢多雇點(diǎn)技工呢?!?/p>

更進(jìn)一步說(shuō),大模型應(yīng)用嚴(yán)肅場(chǎng)景,需要突破的關(guān)鍵一點(diǎn)還在于成本問(wèn)題。

舉個(gè)例子,工業(yè)生產(chǎn)中最常見的儀器之一是讀取環(huán)境溫度、濕度等參數(shù)的傳感器,一旦傳感器讀數(shù)高于或低于某一閾值,便需要機(jī)器執(zhí)行不同指令,如減緩來(lái)料速度、加入冷卻液等。這不需要應(yīng)用成本高昂的模型,只需要在傳感器所涉及的小系統(tǒng)內(nèi)設(shè)置一個(gè)既定的“規(guī)則”即可。

結(jié)合工業(yè)場(chǎng)景需求,我們不難理解工業(yè)界相對(duì)模型會(huì)更偏向于規(guī)則的做法。但不可否認(rèn)的是,許多制造業(yè)公司早在大模型前便已引入機(jī)器學(xué)習(xí)模型迭代業(yè)務(wù),尤其是在一些數(shù)據(jù)量巨大、人工設(shè)計(jì)規(guī)則難以窮舉的場(chǎng)景。

這或許也是工業(yè)方向大模型服務(wù)的發(fā)力點(diǎn)所在。而大模型目前展現(xiàn)的簡(jiǎn)單內(nèi)容生成能力與高昂的部署成本完全是對(duì)工業(yè)場(chǎng)景的一種錯(cuò)配。

“多快好省,越簡(jiǎn)單越好”是老陳視角下,工業(yè)界對(duì)新興技術(shù)應(yīng)用的需求。目前看來(lái),大模型似乎與之并不沾邊,更多的應(yīng)用會(huì)集中在非業(yè)務(wù)核心板塊上。

數(shù)據(jù)之海中掘金

AGI是終極命題,我們對(duì)大模型的期待自然不能止步于幻覺(jué)。以大模型為代表的AI能力也并非無(wú)法在所有嚴(yán)肅場(chǎng)景應(yīng)用,而是需要準(zhǔn)確認(rèn)知大模型的能力邊界所在。

細(xì)想一下,上文提到的案例企業(yè)之所以會(huì)認(rèn)為大模型的價(jià)值有限,主要是因?yàn)榛糜X(jué)問(wèn)題導(dǎo)致生成內(nèi)容的不可解釋、不可追溯。那么,我們能否跳出為ChatGPT所錨定的AIGC范式,以其他方式推動(dòng)大模型釋放價(jià)值呢?

只需簡(jiǎn)單轉(zhuǎn)變思路,我們即使在以嚴(yán)謹(jǐn)著稱的金融行業(yè),也能尋到了大模型釋放正向價(jià)值的案例。

通常,傳統(tǒng)金融體系中的數(shù)據(jù)映射基本圍繞上市公司股票代碼做映射即可,而ESG領(lǐng)域中存在大量“另類數(shù)據(jù)”,如專利、行政處罰、新聞報(bào)道等,這些數(shù)據(jù)要素所關(guān)聯(lián)的主體的稱呼、層級(jí)各異,存在職員、工作室、部門、子公司等不同維度的數(shù)據(jù)信息,映射難度非常大,“就像就上百萬(wàn)家公司一個(gè)一個(gè)做天眼查的查詢”。

作為嘗到大模型甜頭的少數(shù)企業(yè)之一,秩鼎對(duì)大模型價(jià)值釋放的前景卻格外審慎。王彬?qū)o B應(yīng)用簡(jiǎn)單分為三層,從低到高分別是數(shù)據(jù)層、工具層與決策層。在他看來(lái),而大模型的價(jià)值釋放主要集中在數(shù)據(jù)層,工具層的應(yīng)用“基本上幫不上忙”,至于決策層則是大模型“可望不可即”的領(lǐng)域。

“打個(gè)比方,海量數(shù)據(jù)其實(shí)就是一個(gè)大金礦,工具是自然用以探金、掘金,大模型目前完全可以勝任前期的探索工作??梢坏┥钊霐?shù)據(jù)的應(yīng)用,就會(huì)卡在確定性、可靠性之前,更高層的決策就別提了”,王彬說(shuō)。

限于金融視域,王彬?qū)Υ竽P偷膽?yīng)用場(chǎng)景可能略有局限,但我們仔細(xì)梳理當(dāng)下大模型應(yīng)用,不難發(fā)現(xiàn)其以數(shù)據(jù)為核心來(lái)釋放價(jià)值的底層邏輯。

例如上文所提到的企服企業(yè),其嵌入大模型的代碼編寫、客戶報(bào)告、培訓(xùn)資料等工作流環(huán)節(jié)雖是以內(nèi)容生成的方式呈現(xiàn),但本質(zhì)上也不過(guò)是對(duì)粗放數(shù)據(jù)的初步處理,在一定程度上保障精確性的同時(shí)極大壓縮了信息密度,以提高職員的工作效率。

即使是最簡(jiǎn)單的銷售話術(shù),銷售小張也需要在大模型生成答案之后再經(jīng)過(guò)自己的一些加工美化方能發(fā)給客戶。這其實(shí)進(jìn)一步佐證了大模型在工作流中的地位——局限于初步處理環(huán)節(jié),而且大多無(wú)法脫離人的把關(guān)。

更進(jìn)一步說(shuō),把關(guān)的必要性來(lái)自于模型無(wú)法根除的幻覺(jué)問(wèn)題,那么在業(yè)務(wù)落地上,這一問(wèn)題能否在未來(lái)尋到解法?

這個(gè)問(wèn)題的答案可以自大模型風(fēng)起前的深度學(xué)習(xí)方案中窺得一二。

實(shí)際上,早在大模型之前的機(jī)器學(xué)習(xí)就已經(jīng)遭遇了“幻覺(jué)”的前身——過(guò)擬合。即機(jī)器學(xué)習(xí)過(guò)程中會(huì)發(fā)生的“強(qiáng)行”總結(jié)共性和規(guī)律的情況。好比我國(guó)歷史上家喻戶曉的司馬遷、蔡倫與鄭和,他們的共同身份是太監(jiān),而機(jī)器很可能會(huì)由此得出“太監(jiān)是成功的必要條件”這樣令人哭笑不得的結(jié)論。

這是由機(jī)器學(xué)習(xí)的方法所決定的,就像大模型的幻覺(jué)來(lái)源于Transformer框架,這意味著類似問(wèn)題基本上沒(méi)有一勞永逸的解法。

如果說(shuō)各行各業(yè)積累的大量數(shù)據(jù)是金礦,那么大模型就是我們?cè)噲D挖掘數(shù)據(jù)價(jià)值的探頭,它能幫助我們找到金礦中的金子,甚至進(jìn)行初步的攫取,但要用來(lái)挖礦甚至判斷什么是金礦,那還是差了些意思。

釋放價(jià)值的正確姿勢(shì)

大模型釋放價(jià)值是一個(gè)比較大的命題,但我們將他拆解一下,實(shí)際上也就是大模型用來(lái)做什么,以及該怎么用。而大模型服務(wù)商們似乎過(guò)于追求參數(shù)、能力等硬核指標(biāo),反而在解決實(shí)際問(wèn)題上顯得有些“畏首畏尾”,比較典型的是至今尚處于場(chǎng)景探索階段的金融大模型。

顯然,服務(wù)商們對(duì)大模型進(jìn)入千行百業(yè)的暢想難免給人一種“好高騖遠(yuǎn)”的印象。畢竟智能化的供需雙方很多時(shí)候根本處在兩套話語(yǔ)體系,互聯(lián)網(wǎng)外的行業(yè)采購(gòu)代表很多都不知道大模型是什么,如果再不“約束”一下大模型的能力邊界,反而容易適得其反,進(jìn)入各說(shuō)各話的怪圈。

那么大模型的價(jià)值釋放會(huì)給我們什么感覺(jué)?

十?dāng)?shù)年前,上班打卡要么在小本本上親筆簽名,好點(diǎn)的則是伸出大拇指按一下指紋打卡機(jī)。當(dāng)下,我們上班打卡只需要在靠近公司的時(shí)候掏出手機(jī)。這一前一后的變化,在于以在線OA為基礎(chǔ)的協(xié)同辦公應(yīng)用的出現(xiàn)。作為企業(yè)級(jí)應(yīng)用,協(xié)同辦公讓“打卡”這一環(huán)節(jié)愈發(fā)簡(jiǎn)單、省時(shí),讓使用者足以養(yǎng)成使用習(xí)慣。

更進(jìn)一步,習(xí)慣的養(yǎng)成會(huì)模糊我們對(duì)事物的感覺(jué),下意識(shí)認(rèn)為“本應(yīng)如此”,類似的場(chǎng)景還有站街邊揮手招車與當(dāng)下在電梯里便會(huì)打開的網(wǎng)約車。這種“無(wú)感沉浸”的感覺(jué)既是消費(fèi)市場(chǎng)的追求,也是企業(yè)市場(chǎng)的需求。大模型如果希望能在千行百業(yè)釋放價(jià)值,“無(wú)感”同樣是重要指標(biāo)。

"大模型被我們集成進(jìn)數(shù)據(jù)中臺(tái)了,相比以往,除了數(shù)據(jù)處理的效率提升外,幾乎沒(méi)什么感覺(jué),也沒(méi)有對(duì)工作流程有什么其他的明顯影響",王彬說(shuō)。

在他看來(lái),即使大模型成本再高、技術(shù)創(chuàng)新再多,只要大模型不是類似“圣杯”定位的萬(wàn)金油方案,那么其價(jià)值釋放也只限于工作流中的某個(gè)或某些環(huán)節(jié)。

更值一提的是,王彬還特別強(qiáng)調(diào)了現(xiàn)階段的大模型應(yīng)用還需其他技術(shù)做輔助,例如PDF識(shí)別這項(xiàng)數(shù)據(jù)處理業(yè)務(wù)。如果簡(jiǎn)單將PDF丟給大模型的話,文字識(shí)別與文字整理將耗費(fèi)大量算力與時(shí)間。而我們僅需在將PDF丟給大模型處理前,用低成本的OCR方案給出文字,那么大模型的處理效率將會(huì)成倍提升,成本降低自不必說(shuō)。

工作流這一概念誕生于上世紀(jì)IT爆發(fā)所帶動(dòng)的辦公自動(dòng)化風(fēng)潮,如果我們將IT概念從中抽離,工作流所包含的人與機(jī)器交互、標(biāo)準(zhǔn)化、高效率等邏輯實(shí)際上與福特發(fā)明的“流水線”有異曲同工之處。大模型好比是流水線中的高精刻刀,在該環(huán)節(jié)能帶來(lái)效率的顯著提升,但并非放之四海而皆準(zhǔn),而且需要精確的使用方法。

只不過(guò),王彬與其團(tuán)隊(duì)對(duì)大模型的應(yīng)用建立在其對(duì)深度學(xué)習(xí)和數(shù)據(jù)中臺(tái)的認(rèn)知基礎(chǔ)之上,作為應(yīng)用經(jīng)驗(yàn),難以“推己及人”至更廣泛的非IT企業(yè),我們不能要求每一個(gè)希望獲得大模型能力的企業(yè)都得自備一個(gè)帶有AI背景的工程師團(tuán)隊(duì)。

因此在明確應(yīng)用邊界與方向后,大模型進(jìn)一步要做的是向協(xié)同辦公靠攏,提供低成本可復(fù)制的解決方案。而行業(yè)當(dāng)下普遍展開的定制化合作與之背道而馳,這會(huì)讓客戶群體局限于資源更多的大客戶。依靠工程師力大飛磚跑出來(lái)的個(gè)案即使宣傳再多,也入不了中小企業(yè)的法眼。

山不來(lái)就我,我便去就山。大模型扎根行業(yè)需要的是用標(biāo)準(zhǔn)化、低成本的封裝,代替高度定制化的成本敘事,此外,還需要服務(wù)商將注意力從“煉丹”之上挪開少許,拿出做SaaS的精神。在一個(gè)買方市場(chǎng)中堅(jiān)持用戶本位的思想,再正常不過(guò)了。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

供需錯(cuò)位的大模型

大模型的價(jià)值釋放有多大想象力,大模型賽道的玩家對(duì)落地就有多焦慮。

文|光子星球 吳坤諺

編輯|吳先之

征途是星辰大海,投入是無(wú)底洞窟,如果落地的產(chǎn)出缺了或是慢了,風(fēng)口過(guò)后的可持續(xù)發(fā)展和迭代都是空談。

細(xì)數(shù)一下比較成功的落地案例:前有妙鴨相機(jī)靠9.9一組寫真點(diǎn)燃朋友圈,可寫真這個(gè)需求太小、不太可持續(xù);后有360半年報(bào)披露其大模型業(yè)務(wù)創(chuàng)收2000萬(wàn)元,盡管與15.6億元的研發(fā)投入相比只是滄海一粟,但好歹見到了現(xiàn)金流,算得上是一個(gè)積極信號(hào)。

一個(gè)清晰的事實(shí)是,目前大模型的落地途徑比較單一,比較可靠的商業(yè)模式只有to B方向的大模型部署以及模型使用、訓(xùn)練的算力需求兩種,其價(jià)值釋放的緩慢可想而知。

即使是這兩種花了大半年時(shí)間摸清楚的邏輯,在智能化這樣的買方市場(chǎng)中,還有不少需要技術(shù)服務(wù)商突破的隔閡,例如怎么打開中小企業(yè)市場(chǎng)、減少定制化導(dǎo)致的高人力成本等。

進(jìn)一步說(shuō),各行各業(yè)迫切需要看到可靠的落地案例與方向,打消他們的顧慮,一起掏錢幫助大模型賽道的玩家們走上可持續(xù)的正軌。

我們對(duì)話了多家行業(yè)企業(yè),試圖管中窺豹,為大模型的價(jià)值釋放“摸底”。我們了解到的情況是,服務(wù)商“鞭長(zhǎng)莫及”的中小企業(yè)市場(chǎng)中,相當(dāng)一部分以調(diào)用開源模型來(lái)先吃螃蟹的企業(yè)已經(jīng)收獲了不小的效率躍升。而目前服務(wù)商們一致發(fā)力的,以制造業(yè)為主的KA市場(chǎng)卻對(duì)大模型相當(dāng)不感冒。

這對(duì)國(guó)內(nèi)大模型玩家而言不算是個(gè)好消息。

最大挑戰(zhàn):幻覺(jué)

美國(guó)社會(huì)學(xué)家Marc Prensky曾于2001年提出“數(shù)字原住民”的概念,泛指在21世紀(jì)的數(shù)字時(shí)代中成長(zhǎng)起來(lái)的年輕人。而在大模型的沖擊下,2023年進(jìn)入社會(huì)的年輕人或許將成為首批“AI原住民”。

就像7月初入職某家SaaS企業(yè)銷售崗的小張,因如今互聯(lián)網(wǎng)語(yǔ)境中充斥著的“萬(wàn)辭王”、“不打800個(gè)電話不能走”等段子而忐忑不安時(shí),大模型幫助他在人生第一份工作中穩(wěn)定下來(lái)。

小張入職第一天,他預(yù)想中“一位老銷售帶人熟悉業(yè)務(wù)”的流程并未出現(xiàn),而是領(lǐng)導(dǎo)簡(jiǎn)單介紹了一下工作強(qiáng)度、時(shí)間安排等情況后,就扔給他一個(gè)網(wǎng)址和一個(gè)文檔,讓他“看文檔熟悉業(yè)務(wù),有不懂的在網(wǎng)址里提問(wèn)”。

小張的第一份工作就這么開始了。據(jù)他所說(shuō),除了入職的頭兩天去了公司坐班,往后將近兩個(gè)月時(shí)間都在外跑業(yè)務(wù),只有團(tuán)隊(duì)開會(huì)的時(shí)候會(huì)回公司述職。而工作中遇到的疑問(wèn)如HR SaaS的客戶案例、銷售話術(shù)、市場(chǎng)價(jià)格比對(duì)等,他都可以在網(wǎng)址中提問(wèn)從而獲取答案。

“我找陽(yáng)哥(領(lǐng)導(dǎo))的次數(shù)估計(jì)連我提問(wèn)次數(shù)的一半都不到”,小張說(shuō),所謂網(wǎng)址便是大模型的交互頁(yè)面,該公司將大模型能力應(yīng)用在了新人銷售的培訓(xùn)和業(yè)務(wù)展開上。

據(jù)了解,該公司采用的第三方AI服務(wù)商的產(chǎn)品,模型能力來(lái)源于ChatGPT。他們將此前已成文檔的市場(chǎng)價(jià)格走向、公司業(yè)務(wù)流程、常見客戶QA等信息交由大模型整合為數(shù)據(jù)集,并提供快速檢索能力。據(jù)公司領(lǐng)導(dǎo)林陽(yáng)介紹,大模型目前已經(jīng)做到為新人銷售培訓(xùn)平均節(jié)約5天時(shí)間,這還是在尚未計(jì)入老銷售的時(shí)間成本的前提下。

此外,大模型還進(jìn)入他們多個(gè)崗位的工作流,如研發(fā)部門的初級(jí)代碼編寫、人力部門的JD編寫以及運(yùn)營(yíng)部門的客戶報(bào)告等。

只是林陽(yáng)還告訴光子星球,大模型能力只在銷售環(huán)節(jié)“效果拔群”,其余部門在使用上卻不盡如人意,主要起輔助作用。比如代碼生成大多局限于前端,而且生成內(nèi)容必須經(jīng)由人工校對(duì)。

人工校對(duì)必要性的背后是大模型難以避免的幻覺(jué)現(xiàn)象,簡(jiǎn)單來(lái)說(shuō)就是“一本正經(jīng)地胡說(shuō)八道”。其成因在于訓(xùn)練數(shù)據(jù)存在偏差以及訓(xùn)練方法NTP(預(yù)測(cè)文本)等。一個(gè)典型的例子是,我們讓某多模態(tài)模型生成一張“松鼠鱖魚”的圖片,生成結(jié)果與這道徽菜實(shí)際的樣子八竿子打不著。

顯而易見,幻覺(jué)是大模型落地嚴(yán)肅商業(yè)場(chǎng)景的最大挑戰(zhàn)之一,尤其是工業(yè)、金融等對(duì)精確度要求極致的場(chǎng)景。事實(shí)上,早在大模型之前,工業(yè)機(jī)器人與智能投研等AI應(yīng)用就試圖在工業(yè)、金融領(lǐng)域找到戰(zhàn)場(chǎng)。在部分業(yè)內(nèi)人士看來(lái),這些嘗試都免不了“形而上學(xué)”的意味。

老陳是南方頭部流體控制企業(yè)的高級(jí)工程師,浸淫流體控制設(shè)備十?dāng)?shù)年,甚至曾帶領(lǐng)團(tuán)隊(duì)參與核級(jí)流體控制設(shè)備的生產(chǎn)。作為典型的工廠老人,他對(duì)AI在工業(yè)流程中的應(yīng)用嗤之以鼻。

“工業(yè)生產(chǎn)第一要的是穩(wěn)定安全,只要‘幻覺(jué)’問(wèn)題存在,對(duì)穩(wěn)定安全就是一種威脅”,老陳說(shuō),“我看到的所謂工業(yè)機(jī)器人,宣傳了也有小十年的,到現(xiàn)在還只能做一些焊接、碼垛之類的簡(jiǎn)單活兒?!?/p>

老陳所言雖有些過(guò)激,卻不無(wú)道理,畢竟連創(chuàng)造GPT的OpenAI早在2021年便放棄了機(jī)器人業(yè)務(wù)。至于近來(lái)全球頂級(jí)公司開始關(guān)注的人形機(jī)器人賽道才剛剛開始,更別提應(yīng)用了。

老陳所見所思的工業(yè)數(shù)智化,更多在于避免工人的重復(fù)勞動(dòng)以提高效率。例如與供應(yīng)鏈上下游共同采買的云端系統(tǒng),讓產(chǎn)業(yè)鏈的各環(huán)節(jié)可以實(shí)時(shí)上傳生產(chǎn)進(jìn)度、器胚良品率等數(shù)據(jù),協(xié)調(diào)生產(chǎn)節(jié)奏與訂單交付時(shí)間,避免返工的情況。

老陳還向我們分享了一件趣事,曾經(jīng)他們公司接觸過(guò)一家主要提供CV領(lǐng)域產(chǎn)品檢驗(yàn)服務(wù)的第三方AI服務(wù)提供商,他也受邀參加了服務(wù)體驗(yàn)。“他們的模型需要大概20秒來(lái)判斷一個(gè)設(shè)備是否達(dá)到出廠需求,我們高級(jí)技工只需要目檢8秒,那我還不如花錢多雇點(diǎn)技工呢。”

更進(jìn)一步說(shuō),大模型應(yīng)用嚴(yán)肅場(chǎng)景,需要突破的關(guān)鍵一點(diǎn)還在于成本問(wèn)題。

舉個(gè)例子,工業(yè)生產(chǎn)中最常見的儀器之一是讀取環(huán)境溫度、濕度等參數(shù)的傳感器,一旦傳感器讀數(shù)高于或低于某一閾值,便需要機(jī)器執(zhí)行不同指令,如減緩來(lái)料速度、加入冷卻液等。這不需要應(yīng)用成本高昂的模型,只需要在傳感器所涉及的小系統(tǒng)內(nèi)設(shè)置一個(gè)既定的“規(guī)則”即可。

結(jié)合工業(yè)場(chǎng)景需求,我們不難理解工業(yè)界相對(duì)模型會(huì)更偏向于規(guī)則的做法。但不可否認(rèn)的是,許多制造業(yè)公司早在大模型前便已引入機(jī)器學(xué)習(xí)模型迭代業(yè)務(wù),尤其是在一些數(shù)據(jù)量巨大、人工設(shè)計(jì)規(guī)則難以窮舉的場(chǎng)景。

這或許也是工業(yè)方向大模型服務(wù)的發(fā)力點(diǎn)所在。而大模型目前展現(xiàn)的簡(jiǎn)單內(nèi)容生成能力與高昂的部署成本完全是對(duì)工業(yè)場(chǎng)景的一種錯(cuò)配。

“多快好省,越簡(jiǎn)單越好”是老陳視角下,工業(yè)界對(duì)新興技術(shù)應(yīng)用的需求。目前看來(lái),大模型似乎與之并不沾邊,更多的應(yīng)用會(huì)集中在非業(yè)務(wù)核心板塊上。

數(shù)據(jù)之海中掘金

AGI是終極命題,我們對(duì)大模型的期待自然不能止步于幻覺(jué)。以大模型為代表的AI能力也并非無(wú)法在所有嚴(yán)肅場(chǎng)景應(yīng)用,而是需要準(zhǔn)確認(rèn)知大模型的能力邊界所在。

細(xì)想一下,上文提到的案例企業(yè)之所以會(huì)認(rèn)為大模型的價(jià)值有限,主要是因?yàn)榛糜X(jué)問(wèn)題導(dǎo)致生成內(nèi)容的不可解釋、不可追溯。那么,我們能否跳出為ChatGPT所錨定的AIGC范式,以其他方式推動(dòng)大模型釋放價(jià)值呢?

只需簡(jiǎn)單轉(zhuǎn)變思路,我們即使在以嚴(yán)謹(jǐn)著稱的金融行業(yè),也能尋到了大模型釋放正向價(jià)值的案例。

通常,傳統(tǒng)金融體系中的數(shù)據(jù)映射基本圍繞上市公司股票代碼做映射即可,而ESG領(lǐng)域中存在大量“另類數(shù)據(jù)”,如專利、行政處罰、新聞報(bào)道等,這些數(shù)據(jù)要素所關(guān)聯(lián)的主體的稱呼、層級(jí)各異,存在職員、工作室、部門、子公司等不同維度的數(shù)據(jù)信息,映射難度非常大,“就像就上百萬(wàn)家公司一個(gè)一個(gè)做天眼查的查詢”。

作為嘗到大模型甜頭的少數(shù)企業(yè)之一,秩鼎對(duì)大模型價(jià)值釋放的前景卻格外審慎。王彬?qū)o B應(yīng)用簡(jiǎn)單分為三層,從低到高分別是數(shù)據(jù)層、工具層與決策層。在他看來(lái),而大模型的價(jià)值釋放主要集中在數(shù)據(jù)層,工具層的應(yīng)用“基本上幫不上忙”,至于決策層則是大模型“可望不可即”的領(lǐng)域。

“打個(gè)比方,海量數(shù)據(jù)其實(shí)就是一個(gè)大金礦,工具是自然用以探金、掘金,大模型目前完全可以勝任前期的探索工作??梢坏┥钊霐?shù)據(jù)的應(yīng)用,就會(huì)卡在確定性、可靠性之前,更高層的決策就別提了”,王彬說(shuō)。

限于金融視域,王彬?qū)Υ竽P偷膽?yīng)用場(chǎng)景可能略有局限,但我們仔細(xì)梳理當(dāng)下大模型應(yīng)用,不難發(fā)現(xiàn)其以數(shù)據(jù)為核心來(lái)釋放價(jià)值的底層邏輯。

例如上文所提到的企服企業(yè),其嵌入大模型的代碼編寫、客戶報(bào)告、培訓(xùn)資料等工作流環(huán)節(jié)雖是以內(nèi)容生成的方式呈現(xiàn),但本質(zhì)上也不過(guò)是對(duì)粗放數(shù)據(jù)的初步處理,在一定程度上保障精確性的同時(shí)極大壓縮了信息密度,以提高職員的工作效率。

即使是最簡(jiǎn)單的銷售話術(shù),銷售小張也需要在大模型生成答案之后再經(jīng)過(guò)自己的一些加工美化方能發(fā)給客戶。這其實(shí)進(jìn)一步佐證了大模型在工作流中的地位——局限于初步處理環(huán)節(jié),而且大多無(wú)法脫離人的把關(guān)。

更進(jìn)一步說(shuō),把關(guān)的必要性來(lái)自于模型無(wú)法根除的幻覺(jué)問(wèn)題,那么在業(yè)務(wù)落地上,這一問(wèn)題能否在未來(lái)尋到解法?

這個(gè)問(wèn)題的答案可以自大模型風(fēng)起前的深度學(xué)習(xí)方案中窺得一二。

實(shí)際上,早在大模型之前的機(jī)器學(xué)習(xí)就已經(jīng)遭遇了“幻覺(jué)”的前身——過(guò)擬合。即機(jī)器學(xué)習(xí)過(guò)程中會(huì)發(fā)生的“強(qiáng)行”總結(jié)共性和規(guī)律的情況。好比我國(guó)歷史上家喻戶曉的司馬遷、蔡倫與鄭和,他們的共同身份是太監(jiān),而機(jī)器很可能會(huì)由此得出“太監(jiān)是成功的必要條件”這樣令人哭笑不得的結(jié)論。

這是由機(jī)器學(xué)習(xí)的方法所決定的,就像大模型的幻覺(jué)來(lái)源于Transformer框架,這意味著類似問(wèn)題基本上沒(méi)有一勞永逸的解法。

如果說(shuō)各行各業(yè)積累的大量數(shù)據(jù)是金礦,那么大模型就是我們?cè)噲D挖掘數(shù)據(jù)價(jià)值的探頭,它能幫助我們找到金礦中的金子,甚至進(jìn)行初步的攫取,但要用來(lái)挖礦甚至判斷什么是金礦,那還是差了些意思。

釋放價(jià)值的正確姿勢(shì)

大模型釋放價(jià)值是一個(gè)比較大的命題,但我們將他拆解一下,實(shí)際上也就是大模型用來(lái)做什么,以及該怎么用。而大模型服務(wù)商們似乎過(guò)于追求參數(shù)、能力等硬核指標(biāo),反而在解決實(shí)際問(wèn)題上顯得有些“畏首畏尾”,比較典型的是至今尚處于場(chǎng)景探索階段的金融大模型。

顯然,服務(wù)商們對(duì)大模型進(jìn)入千行百業(yè)的暢想難免給人一種“好高騖遠(yuǎn)”的印象。畢竟智能化的供需雙方很多時(shí)候根本處在兩套話語(yǔ)體系,互聯(lián)網(wǎng)外的行業(yè)采購(gòu)代表很多都不知道大模型是什么,如果再不“約束”一下大模型的能力邊界,反而容易適得其反,進(jìn)入各說(shuō)各話的怪圈。

那么大模型的價(jià)值釋放會(huì)給我們什么感覺(jué)?

十?dāng)?shù)年前,上班打卡要么在小本本上親筆簽名,好點(diǎn)的則是伸出大拇指按一下指紋打卡機(jī)。當(dāng)下,我們上班打卡只需要在靠近公司的時(shí)候掏出手機(jī)。這一前一后的變化,在于以在線OA為基礎(chǔ)的協(xié)同辦公應(yīng)用的出現(xiàn)。作為企業(yè)級(jí)應(yīng)用,協(xié)同辦公讓“打卡”這一環(huán)節(jié)愈發(fā)簡(jiǎn)單、省時(shí),讓使用者足以養(yǎng)成使用習(xí)慣。

更進(jìn)一步,習(xí)慣的養(yǎng)成會(huì)模糊我們對(duì)事物的感覺(jué),下意識(shí)認(rèn)為“本應(yīng)如此”,類似的場(chǎng)景還有站街邊揮手招車與當(dāng)下在電梯里便會(huì)打開的網(wǎng)約車。這種“無(wú)感沉浸”的感覺(jué)既是消費(fèi)市場(chǎng)的追求,也是企業(yè)市場(chǎng)的需求。大模型如果希望能在千行百業(yè)釋放價(jià)值,“無(wú)感”同樣是重要指標(biāo)。

"大模型被我們集成進(jìn)數(shù)據(jù)中臺(tái)了,相比以往,除了數(shù)據(jù)處理的效率提升外,幾乎沒(méi)什么感覺(jué),也沒(méi)有對(duì)工作流程有什么其他的明顯影響",王彬說(shuō)。

在他看來(lái),即使大模型成本再高、技術(shù)創(chuàng)新再多,只要大模型不是類似“圣杯”定位的萬(wàn)金油方案,那么其價(jià)值釋放也只限于工作流中的某個(gè)或某些環(huán)節(jié)。

更值一提的是,王彬還特別強(qiáng)調(diào)了現(xiàn)階段的大模型應(yīng)用還需其他技術(shù)做輔助,例如PDF識(shí)別這項(xiàng)數(shù)據(jù)處理業(yè)務(wù)。如果簡(jiǎn)單將PDF丟給大模型的話,文字識(shí)別與文字整理將耗費(fèi)大量算力與時(shí)間。而我們僅需在將PDF丟給大模型處理前,用低成本的OCR方案給出文字,那么大模型的處理效率將會(huì)成倍提升,成本降低自不必說(shuō)。

工作流這一概念誕生于上世紀(jì)IT爆發(fā)所帶動(dòng)的辦公自動(dòng)化風(fēng)潮,如果我們將IT概念從中抽離,工作流所包含的人與機(jī)器交互、標(biāo)準(zhǔn)化、高效率等邏輯實(shí)際上與福特發(fā)明的“流水線”有異曲同工之處。大模型好比是流水線中的高精刻刀,在該環(huán)節(jié)能帶來(lái)效率的顯著提升,但并非放之四海而皆準(zhǔn),而且需要精確的使用方法。

只不過(guò),王彬與其團(tuán)隊(duì)對(duì)大模型的應(yīng)用建立在其對(duì)深度學(xué)習(xí)和數(shù)據(jù)中臺(tái)的認(rèn)知基礎(chǔ)之上,作為應(yīng)用經(jīng)驗(yàn),難以“推己及人”至更廣泛的非IT企業(yè),我們不能要求每一個(gè)希望獲得大模型能力的企業(yè)都得自備一個(gè)帶有AI背景的工程師團(tuán)隊(duì)。

因此在明確應(yīng)用邊界與方向后,大模型進(jìn)一步要做的是向協(xié)同辦公靠攏,提供低成本可復(fù)制的解決方案。而行業(yè)當(dāng)下普遍展開的定制化合作與之背道而馳,這會(huì)讓客戶群體局限于資源更多的大客戶。依靠工程師力大飛磚跑出來(lái)的個(gè)案即使宣傳再多,也入不了中小企業(yè)的法眼。

山不來(lái)就我,我便去就山。大模型扎根行業(yè)需要的是用標(biāo)準(zhǔn)化、低成本的封裝,代替高度定制化的成本敘事,此外,還需要服務(wù)商將注意力從“煉丹”之上挪開少許,拿出做SaaS的精神。在一個(gè)買方市場(chǎng)中堅(jiān)持用戶本位的思想,再正常不過(guò)了。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。