正在閱讀:

海天瑞聲(688787.SH):大模型強(qiáng)化學(xué)習(xí)環(huán)節(jié)的整體數(shù)據(jù)需求在逐漸攀升,逐漸向更多垂類拓展

掃一掃下載界面新聞APP

海天瑞聲(688787.SH):大模型強(qiáng)化學(xué)習(xí)環(huán)節(jié)的整體數(shù)據(jù)需求在逐漸攀升,逐漸向更多垂類拓展

2024年6月6日海天瑞聲接受華夏基金等機(jī)構(gòu)調(diào)研,證券事務(wù)代表:張哲參與接待,并回答了調(diào)研機(jī)構(gòu)提出的問題。

圖片來源: 圖蟲創(chuàng)意

海天瑞聲(688787.SH)2024年6月11日發(fā)布消息稱,2024年6月6日海天瑞聲接受華夏基金等機(jī)構(gòu)調(diào)研,證券事務(wù)代表:張哲參與接待,并回答了調(diào)研機(jī)構(gòu)提出的問題。

調(diào)研機(jī)構(gòu)詳情如下:

賈靜雯/華夏基金;白海波/樂正資本;張宸/銀河證券;王霆/國(guó)華興盛資產(chǎn);楊子平/川流資本;范明/國(guó)泰君安證券資產(chǎn)管理;許斐/霽峰資本;錢小英/上海鍇量。

調(diào)研主要內(nèi)容:

1、請(qǐng)問公司2023年收入下滑的原因是什么?

2023年,公司營(yíng)業(yè)收入為1.70億元,較去年同期下降35.33%,主要系受境外部分客戶進(jìn)行階段性裁員、業(yè)務(wù)方向及研發(fā)節(jié)奏周期性調(diào)整等影響,部分客戶2023年預(yù)算釋放進(jìn)度放緩,同時(shí)疊加2023年上半年數(shù)據(jù)出境相關(guān)法規(guī)落地實(shí)施的階段性影響,公司境外收入同比大幅下滑。境內(nèi)業(yè)務(wù)方面,雖然宏觀穩(wěn)經(jīng)濟(jì)政策已初見成效,但國(guó)內(nèi)仍面臨復(fù)雜嚴(yán)峻的內(nèi)外部環(huán)境考驗(yàn),部分境內(nèi)客戶對(duì)集中性研發(fā)投入仍持謹(jǐn)慎態(tài)度,基礎(chǔ)數(shù)據(jù)服務(wù)領(lǐng)域客戶預(yù)算及需求釋放出現(xiàn)階段性減緩,疊加行業(yè)內(nèi)競(jìng)爭(zhēng)加劇,綜合導(dǎo)致境內(nèi)收入同比下滑。

2、公司2024年第一季度收入同比增長(zhǎng)的原因是什么?

公司2024年第一季度收入增長(zhǎng)主要系在大模型技術(shù)的逐步發(fā)展和應(yīng)用領(lǐng)域不斷拓展的帶動(dòng)下,全球各類型科技公司對(duì)人工智能領(lǐng)域的研發(fā)投入呈現(xiàn)出復(fù)蘇并增長(zhǎng)的趨勢(shì),帶動(dòng)以多語言智能語音、文本為代表的數(shù)據(jù)需求快速增加,整體拉動(dòng)公司第一季度營(yíng)業(yè)收入同比大幅提升。

3、公司政企類項(xiàng)目目前有哪些進(jìn)展?

目前,公司正在與北京、安徽、山東、河北等地進(jìn)行對(duì)接。若相關(guān)合作達(dá)到信息披露要求,公司將及時(shí)履行信息披露義務(wù)。

4、大模型范式下的預(yù)訓(xùn)練階段數(shù)據(jù)需求和傳統(tǒng)的數(shù)據(jù)需求有什么區(qū)別?

大模型預(yù)訓(xùn)練階段的數(shù)據(jù)需求和深度學(xué)習(xí)技術(shù)路線下的傳統(tǒng)訓(xùn)練數(shù)據(jù)需求,兩者在形態(tài)上基本一致,都是文本、語音和圖像,但在數(shù)據(jù)規(guī)模、質(zhì)量、來源等方面,預(yù)訓(xùn)練數(shù)據(jù)較傳統(tǒng)訓(xùn)練數(shù)據(jù)會(huì)存在一定差異。例如,規(guī)模上,預(yù)訓(xùn)練數(shù)據(jù)的token量普遍在萬億量級(jí),而傳統(tǒng)模型數(shù)量則大約在10億量級(jí)。從數(shù)據(jù)來源的角度看,由于大模型所需數(shù)據(jù)規(guī)模遠(yuǎn)超傳統(tǒng)模型,因此其數(shù)據(jù)來源將更加豐富以滿足規(guī)?;⒍嘣瘮?shù)據(jù)需求。具體來說,大模型數(shù)據(jù)來源除了來自傳統(tǒng)的定向采集外,還將涉及版權(quán)數(shù)據(jù)、公共數(shù)據(jù)等新型海量高質(zhì)量數(shù)據(jù)來源。

此外,數(shù)據(jù)處理的核心技術(shù)也存在一定差異。例如,由于大模型預(yù)訓(xùn)練階段的原料數(shù)據(jù)規(guī)模更大,因此大模型預(yù)訓(xùn)練數(shù)據(jù)更加注重?cái)?shù)據(jù)清洗的工程化能力,在預(yù)訓(xùn)練階段需要結(jié)合原料數(shù)據(jù)特點(diǎn)以及所涉及的主題、領(lǐng)域等,對(duì)海量數(shù)據(jù)完成高質(zhì)量清洗,這對(duì)數(shù)據(jù)服務(wù)商的工程化數(shù)據(jù)處理能力以及過往服務(wù)經(jīng)驗(yàn)的積累都提出了更高要求。

5、目前已經(jīng)有很多大模型陸續(xù)發(fā)布,未來數(shù)據(jù)需求是會(huì)持續(xù)增長(zhǎng)還是下降?原因是什么?

隨著更多大模型產(chǎn)品面向公眾推出上線、以及不斷進(jìn)行版本迭代,未來的大模型相關(guān)數(shù)據(jù)需求會(huì)持續(xù)、顯著增長(zhǎng),這符合當(dāng)AI進(jìn)行應(yīng)用側(cè)后,對(duì)數(shù)據(jù)的需求才會(huì)規(guī)模性增長(zhǎng)的規(guī)律。預(yù)期該類增長(zhǎng)將主要體現(xiàn)在預(yù)訓(xùn)練階段對(duì)高質(zhì)量、大規(guī)模的版權(quán)數(shù)據(jù)、公共數(shù)據(jù)、多模態(tài)數(shù)據(jù)、垂直領(lǐng)域的實(shí)際場(chǎng)景數(shù)據(jù)等方面的需求,以及不斷提升其交互精準(zhǔn)度的強(qiáng)化學(xué)習(xí)階段各類數(shù)據(jù)需求等。例如,若某大模型應(yīng)用領(lǐng)域?yàn)槲膶W(xué)創(chuàng)作,就會(huì)需要來自版權(quán)方的散文、小說、詩(shī)詞等數(shù)據(jù)進(jìn)行創(chuàng)作能力訓(xùn)練;若某大模型擬提升其在民生政務(wù)領(lǐng)域的客服能力,則來自民生政務(wù)服務(wù)平臺(tái)的此類對(duì)話數(shù)據(jù)將產(chǎn)生重要價(jià)值。未來,隨著大模型向更高級(jí)、更多維、更廣泛垂向拓展,大模型數(shù)據(jù)需求將呈現(xiàn)快速增長(zhǎng)趨勢(shì)。

6、強(qiáng)化學(xué)習(xí)階段的數(shù)據(jù)服務(wù),今年有何進(jìn)展或者變化?

目前來看,隨著各大模型的陸續(xù)上線,強(qiáng)化學(xué)習(xí)環(huán)節(jié)的整體數(shù)據(jù)需求在逐漸攀升,并在具體標(biāo)注任務(wù)上呈現(xiàn)如下趨勢(shì):

(1)逐漸向更多垂類拓展(例如,法律、金融、醫(yī)療);(2)強(qiáng)化學(xué)習(xí)標(biāo)注的評(píng)價(jià)/評(píng)分指標(biāo)變得更為豐富,會(huì)要求標(biāo)注人員從更多維度對(duì)模型的問答進(jìn)行評(píng)判和打分;(3)由單模態(tài)向多模態(tài)轉(zhuǎn)變:23年主要的標(biāo)注需求集中在文本類標(biāo)注,今年開始逐步向多模態(tài)拓展(例如,文本-視頻、文本-圖像等)。


未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。如需轉(zhuǎn)載請(qǐng)聯(lián)系:youlianyunpindao@163.com
以上內(nèi)容與數(shù)據(jù)僅供參考,與界面有連云頻道立場(chǎng)無關(guān),不構(gòu)成投資建議,使用前請(qǐng)核實(shí)。據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

海天瑞聲

184
  • 抖音豆包概念股午后持續(xù)走低,海天瑞聲跌逾10%
  • AI應(yīng)用方向集體調(diào)整,海天瑞聲等多股跌超5%

華夏基金

2.7k
  • 為什么A500等指數(shù)產(chǎn)品會(huì)被納入個(gè)人養(yǎng)老金投資范疇?
  • 4556億減到8億,華夏“ETF一哥”張弘弢一口氣卸任7只產(chǎn)品

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

海天瑞聲(688787.SH):大模型強(qiáng)化學(xué)習(xí)環(huán)節(jié)的整體數(shù)據(jù)需求在逐漸攀升,逐漸向更多垂類拓展

2024年6月6日海天瑞聲接受華夏基金等機(jī)構(gòu)調(diào)研,證券事務(wù)代表:張哲參與接待,并回答了調(diào)研機(jī)構(gòu)提出的問題。

圖片來源: 圖蟲創(chuàng)意

海天瑞聲(688787.SH)2024年6月11日發(fā)布消息稱,2024年6月6日海天瑞聲接受華夏基金等機(jī)構(gòu)調(diào)研,證券事務(wù)代表:張哲參與接待,并回答了調(diào)研機(jī)構(gòu)提出的問題。

調(diào)研機(jī)構(gòu)詳情如下:

賈靜雯/華夏基金;白海波/樂正資本;張宸/銀河證券;王霆/國(guó)華興盛資產(chǎn);楊子平/川流資本;范明/國(guó)泰君安證券資產(chǎn)管理;許斐/霽峰資本;錢小英/上海鍇量。

調(diào)研主要內(nèi)容:

1、請(qǐng)問公司2023年收入下滑的原因是什么?

2023年,公司營(yíng)業(yè)收入為1.70億元,較去年同期下降35.33%,主要系受境外部分客戶進(jìn)行階段性裁員、業(yè)務(wù)方向及研發(fā)節(jié)奏周期性調(diào)整等影響,部分客戶2023年預(yù)算釋放進(jìn)度放緩,同時(shí)疊加2023年上半年數(shù)據(jù)出境相關(guān)法規(guī)落地實(shí)施的階段性影響,公司境外收入同比大幅下滑。境內(nèi)業(yè)務(wù)方面,雖然宏觀穩(wěn)經(jīng)濟(jì)政策已初見成效,但國(guó)內(nèi)仍面臨復(fù)雜嚴(yán)峻的內(nèi)外部環(huán)境考驗(yàn),部分境內(nèi)客戶對(duì)集中性研發(fā)投入仍持謹(jǐn)慎態(tài)度,基礎(chǔ)數(shù)據(jù)服務(wù)領(lǐng)域客戶預(yù)算及需求釋放出現(xiàn)階段性減緩,疊加行業(yè)內(nèi)競(jìng)爭(zhēng)加劇,綜合導(dǎo)致境內(nèi)收入同比下滑。

2、公司2024年第一季度收入同比增長(zhǎng)的原因是什么?

公司2024年第一季度收入增長(zhǎng)主要系在大模型技術(shù)的逐步發(fā)展和應(yīng)用領(lǐng)域不斷拓展的帶動(dòng)下,全球各類型科技公司對(duì)人工智能領(lǐng)域的研發(fā)投入呈現(xiàn)出復(fù)蘇并增長(zhǎng)的趨勢(shì),帶動(dòng)以多語言智能語音、文本為代表的數(shù)據(jù)需求快速增加,整體拉動(dòng)公司第一季度營(yíng)業(yè)收入同比大幅提升。

3、公司政企類項(xiàng)目目前有哪些進(jìn)展?

目前,公司正在與北京、安徽、山東、河北等地進(jìn)行對(duì)接。若相關(guān)合作達(dá)到信息披露要求,公司將及時(shí)履行信息披露義務(wù)。

4、大模型范式下的預(yù)訓(xùn)練階段數(shù)據(jù)需求和傳統(tǒng)的數(shù)據(jù)需求有什么區(qū)別?

大模型預(yù)訓(xùn)練階段的數(shù)據(jù)需求和深度學(xué)習(xí)技術(shù)路線下的傳統(tǒng)訓(xùn)練數(shù)據(jù)需求,兩者在形態(tài)上基本一致,都是文本、語音和圖像,但在數(shù)據(jù)規(guī)模、質(zhì)量、來源等方面,預(yù)訓(xùn)練數(shù)據(jù)較傳統(tǒng)訓(xùn)練數(shù)據(jù)會(huì)存在一定差異。例如,規(guī)模上,預(yù)訓(xùn)練數(shù)據(jù)的token量普遍在萬億量級(jí),而傳統(tǒng)模型數(shù)量則大約在10億量級(jí)。從數(shù)據(jù)來源的角度看,由于大模型所需數(shù)據(jù)規(guī)模遠(yuǎn)超傳統(tǒng)模型,因此其數(shù)據(jù)來源將更加豐富以滿足規(guī)?;⒍嘣瘮?shù)據(jù)需求。具體來說,大模型數(shù)據(jù)來源除了來自傳統(tǒng)的定向采集外,還將涉及版權(quán)數(shù)據(jù)、公共數(shù)據(jù)等新型海量高質(zhì)量數(shù)據(jù)來源。

此外,數(shù)據(jù)處理的核心技術(shù)也存在一定差異。例如,由于大模型預(yù)訓(xùn)練階段的原料數(shù)據(jù)規(guī)模更大,因此大模型預(yù)訓(xùn)練數(shù)據(jù)更加注重?cái)?shù)據(jù)清洗的工程化能力,在預(yù)訓(xùn)練階段需要結(jié)合原料數(shù)據(jù)特點(diǎn)以及所涉及的主題、領(lǐng)域等,對(duì)海量數(shù)據(jù)完成高質(zhì)量清洗,這對(duì)數(shù)據(jù)服務(wù)商的工程化數(shù)據(jù)處理能力以及過往服務(wù)經(jīng)驗(yàn)的積累都提出了更高要求。

5、目前已經(jīng)有很多大模型陸續(xù)發(fā)布,未來數(shù)據(jù)需求是會(huì)持續(xù)增長(zhǎng)還是下降?原因是什么?

隨著更多大模型產(chǎn)品面向公眾推出上線、以及不斷進(jìn)行版本迭代,未來的大模型相關(guān)數(shù)據(jù)需求會(huì)持續(xù)、顯著增長(zhǎng),這符合當(dāng)AI進(jìn)行應(yīng)用側(cè)后,對(duì)數(shù)據(jù)的需求才會(huì)規(guī)模性增長(zhǎng)的規(guī)律。預(yù)期該類增長(zhǎng)將主要體現(xiàn)在預(yù)訓(xùn)練階段對(duì)高質(zhì)量、大規(guī)模的版權(quán)數(shù)據(jù)、公共數(shù)據(jù)、多模態(tài)數(shù)據(jù)、垂直領(lǐng)域的實(shí)際場(chǎng)景數(shù)據(jù)等方面的需求,以及不斷提升其交互精準(zhǔn)度的強(qiáng)化學(xué)習(xí)階段各類數(shù)據(jù)需求等。例如,若某大模型應(yīng)用領(lǐng)域?yàn)槲膶W(xué)創(chuàng)作,就會(huì)需要來自版權(quán)方的散文、小說、詩(shī)詞等數(shù)據(jù)進(jìn)行創(chuàng)作能力訓(xùn)練;若某大模型擬提升其在民生政務(wù)領(lǐng)域的客服能力,則來自民生政務(wù)服務(wù)平臺(tái)的此類對(duì)話數(shù)據(jù)將產(chǎn)生重要價(jià)值。未來,隨著大模型向更高級(jí)、更多維、更廣泛垂向拓展,大模型數(shù)據(jù)需求將呈現(xiàn)快速增長(zhǎng)趨勢(shì)。

6、強(qiáng)化學(xué)習(xí)階段的數(shù)據(jù)服務(wù),今年有何進(jìn)展或者變化?

目前來看,隨著各大模型的陸續(xù)上線,強(qiáng)化學(xué)習(xí)環(huán)節(jié)的整體數(shù)據(jù)需求在逐漸攀升,并在具體標(biāo)注任務(wù)上呈現(xiàn)如下趨勢(shì):

(1)逐漸向更多垂類拓展(例如,法律、金融、醫(yī)療);(2)強(qiáng)化學(xué)習(xí)標(biāo)注的評(píng)價(jià)/評(píng)分指標(biāo)變得更為豐富,會(huì)要求標(biāo)注人員從更多維度對(duì)模型的問答進(jìn)行評(píng)判和打分;(3)由單模態(tài)向多模態(tài)轉(zhuǎn)變:23年主要的標(biāo)注需求集中在文本類標(biāo)注,今年開始逐步向多模態(tài)拓展(例如,文本-視頻、文本-圖像等)。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。