正在閱讀:

看完大模型們作答的高考作文,對(duì)AI的鼓吹與恐懼皆可緩一緩了

掃一掃下載界面新聞APP

看完大模型們作答的高考作文,對(duì)AI的鼓吹與恐懼皆可緩一緩了

以一顆平常心去對(duì)待技術(shù)的發(fā)展更迭,或許會(huì)更好。?

文|鄰章 

一直以來(lái),用AI工具進(jìn)行文學(xué)創(chuàng)作都是科技公司們樂于嘗試的事情,特別是在如“高考”這種全民關(guān)注的特殊時(shí)間節(jié)點(diǎn),用AI撰寫高考作文等就更被科技公司追捧。 

今年,明爭(zhēng)暗斗或更勝以往。 

核心原因當(dāng)然是自去年Open AI以生成式AI應(yīng)用ChatGPT以近乎于質(zhì)變的能力,引發(fā)全球生成式AI大模型狂熱,讓大家公認(rèn)AI技術(shù)來(lái)到了“iPhone”時(shí)刻。? 

國(guó)內(nèi)科技互聯(lián)網(wǎng)公司們也紛紛跟進(jìn)并在今年拿出了自家的生成式AI大模型產(chǎn)品—— 據(jù)不完全統(tǒng)計(jì):從今年二月至今,國(guó)內(nèi)AI大模型發(fā)布會(huì)就開了接近20場(chǎng),諸如百度文心一言、阿里巴巴通義千問、科大訊飛星火大模型等,并都幾乎對(duì)外宣稱 自家產(chǎn)品技術(shù)具備領(lǐng)先性。 

在此,“高考作文”這一綜合考驗(yàn)考生材料理解能力、文字功底、思辨能力、文字創(chuàng)新能力的綜合考題,無(wú)疑也是檢驗(yàn)各家大模型技術(shù)創(chuàng)造能力的試金石。 

也正是基于此,投身于生成式AI大模型的廠商們,也是摩拳擦掌,準(zhǔn)備一展自家生成式AI大模型的文學(xué)創(chuàng)作能力。 

諸如周鴻祎在微博就分享了一篇由360智腦創(chuàng)作的今年全國(guó)甲卷高考作文。 

但從最終結(jié)果來(lái)看,其表現(xiàn)是基本功不錯(cuò)但在思辨性層面則不足,也較難拿到高分。 

語(yǔ)文特級(jí)教師王大績(jī)?cè)谖⒉┲袑?duì)360智腦生成的這篇AI作文點(diǎn)評(píng)稱:“作文語(yǔ)言曉暢,層次清晰,寫作基本功很好,在基礎(chǔ)等級(jí)的層面,表現(xiàn)不錯(cuò)。作文也談到了高科技,但是對(duì)科技發(fā)展條件下,本應(yīng)成為時(shí)間的主人,何以卻成為時(shí)間的仆人,未能抓住關(guān)鍵,思考不夠透徹,因此未形成鞭辟入里的辨析,題目所要求的時(shí)代感比較淡泊,在發(fā)展等級(jí)方面,表現(xiàn)一般。” 

事實(shí)上,這種在文學(xué)創(chuàng)作層面思辨性不足的現(xiàn)實(shí),不止是360智腦一家,其實(shí)幾乎是當(dāng)前生成式AI大模型的“通病”。 

在搜狐科技以高考作文全國(guó)卷(甲)為題,對(duì) 百度文心一言、阿里通義千問、科大訊飛星火認(rèn)知大模型、360智腦、ChatGPT五款主流大語(yǔ)言模型產(chǎn)品進(jìn)行同題測(cè)試,并邀請(qǐng)到五位語(yǔ)文名師進(jìn)行點(diǎn)評(píng)各模型生成作文水平的活動(dòng)中,就不難發(fā)現(xiàn):五款大模型基本都理解到了高考作文全國(guó)卷(甲)的作文立意,沒有出現(xiàn)偏題、跑題現(xiàn)象,也都能在短時(shí)間內(nèi)生成相應(yīng)文章。 

但同時(shí)大模型們也存在著對(duì)作文具體要求理解不清(諸如創(chuàng)作的文章字?jǐn)?shù)未達(dá)到不少于800字的要求)、行文死板、割裂感明顯、語(yǔ)言空洞、“理工味”明顯;并且更為重要的是它們創(chuàng)作的文章,都普遍存在著論點(diǎn)論據(jù)不足、觀點(diǎn)不新穎等在文學(xué)創(chuàng)作上最為致命的問題,這也導(dǎo)致這五款大模型創(chuàng)作的高考作文,綜合得分最高的ChatGPT,也只拿到了48分。 

坦率來(lái)講,ChatGPT的48分和百度文心一言的46.5分,在高考作文得分中,其實(shí)也不算低,甚至可能會(huì)超過許多考生的作文得分,但也與優(yōu)秀作文沒有沾不上邊,只能說是較為普通的水準(zhǔn)。 

而這些大模型在文學(xué)創(chuàng)作上暴露出的這些問題,也讓我們看到當(dāng)前生成式AI技術(shù)的不足,甚至可以說,那些叫囂著現(xiàn)在ChatGPT等生成式AI技術(shù)就能進(jìn)行文學(xué)創(chuàng)作,取代創(chuàng)意人員的話語(yǔ),著實(shí)有些夸大其辭乃至危言聳聽了。 

當(dāng)然,我們也不否認(rèn)ChatGPT等生成式AI技術(shù)在持續(xù)養(yǎng)料喂養(yǎng)下,能夠迅速成長(zhǎng)的潛力,但要擺脫當(dāng)前大模型在文學(xué)創(chuàng)作中存在的創(chuàng)造性不足問題 ,可能也并不是大模型們一朝一夕就能搞定的事情,其可能還需要較長(zhǎng)的時(shí)間。 

在此,幾乎可以說:在看過用生成式AI作答的高考作文后,我認(rèn)為對(duì)AI取代文學(xué)創(chuàng)作的鼓吹也好,恐懼也罷,其實(shí)都可以暫時(shí)先緩一緩了。 

寫在最后: 

ChatGPT等大模型技術(shù)所具備的郵件&新聞&論文撰寫、視頻腳本、文案、翻譯、代碼編寫等能力,讓生成式AI技術(shù)在很大程度上超越了過往這類AI應(yīng)用偏娛樂的屬性,進(jìn)入了真正的生產(chǎn)力乃至是創(chuàng)造性階段。 

由此 也有不少業(yè)內(nèi)驚呼 : 創(chuàng)造性工作機(jī)會(huì),可能會(huì)被GPT們率先取代了,開始陷入悲觀預(yù)期。 

事實(shí)上,對(duì)于生成式AI技術(shù)展現(xiàn)出的實(shí)力,我一直以來(lái)的觀點(diǎn)都是:既沒必要過度鼓吹,同時(shí)也沒必要過度恐懼,以一顆平常心去對(duì)待技術(shù)的發(fā)展更迭,或許會(huì)更好。 

站在技術(shù)浪潮面前,我們更應(yīng)該做的事情是,及早的學(xué)會(huì)善用這些技術(shù),以助力我們工作效率與生活質(zhì)量的提升。 

鄰章微信:ZLxgic,公眾號(hào):TMT317

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

看完大模型們作答的高考作文,對(duì)AI的鼓吹與恐懼皆可緩一緩了

以一顆平常心去對(duì)待技術(shù)的發(fā)展更迭,或許會(huì)更好。?

文|鄰章 

一直以來(lái),用AI工具進(jìn)行文學(xué)創(chuàng)作都是科技公司們樂于嘗試的事情,特別是在如“高考”這種全民關(guān)注的特殊時(shí)間節(jié)點(diǎn),用AI撰寫高考作文等就更被科技公司追捧。 

今年,明爭(zhēng)暗斗或更勝以往。 

核心原因當(dāng)然是自去年Open AI以生成式AI應(yīng)用ChatGPT以近乎于質(zhì)變的能力,引發(fā)全球生成式AI大模型狂熱,讓大家公認(rèn)AI技術(shù)來(lái)到了“iPhone”時(shí)刻。? 

國(guó)內(nèi)科技互聯(lián)網(wǎng)公司們也紛紛跟進(jìn)并在今年拿出了自家的生成式AI大模型產(chǎn)品—— 據(jù)不完全統(tǒng)計(jì):從今年二月至今,國(guó)內(nèi)AI大模型發(fā)布會(huì)就開了接近20場(chǎng),諸如百度文心一言、阿里巴巴通義千問、科大訊飛星火大模型等,并都幾乎對(duì)外宣稱 自家產(chǎn)品技術(shù)具備領(lǐng)先性。 

在此,“高考作文”這一綜合考驗(yàn)考生材料理解能力、文字功底、思辨能力、文字創(chuàng)新能力的綜合考題,無(wú)疑也是檢驗(yàn)各家大模型技術(shù)創(chuàng)造能力的試金石。 

也正是基于此,投身于生成式AI大模型的廠商們,也是摩拳擦掌,準(zhǔn)備一展自家生成式AI大模型的文學(xué)創(chuàng)作能力。 

諸如周鴻祎在微博就分享了一篇由360智腦創(chuàng)作的今年全國(guó)甲卷高考作文。 

但從最終結(jié)果來(lái)看,其表現(xiàn)是基本功不錯(cuò)但在思辨性層面則不足,也較難拿到高分。 

語(yǔ)文特級(jí)教師王大績(jī)?cè)谖⒉┲袑?duì)360智腦生成的這篇AI作文點(diǎn)評(píng)稱:“作文語(yǔ)言曉暢,層次清晰,寫作基本功很好,在基礎(chǔ)等級(jí)的層面,表現(xiàn)不錯(cuò)。作文也談到了高科技,但是對(duì)科技發(fā)展條件下,本應(yīng)成為時(shí)間的主人,何以卻成為時(shí)間的仆人,未能抓住關(guān)鍵,思考不夠透徹,因此未形成鞭辟入里的辨析,題目所要求的時(shí)代感比較淡泊,在發(fā)展等級(jí)方面,表現(xiàn)一般?!?nbsp;

事實(shí)上,這種在文學(xué)創(chuàng)作層面思辨性不足的現(xiàn)實(shí),不止是360智腦一家,其實(shí)幾乎是當(dāng)前生成式AI大模型的“通病”。 

在搜狐科技以高考作文全國(guó)卷(甲)為題,對(duì) 百度文心一言、阿里通義千問、科大訊飛星火認(rèn)知大模型、360智腦、ChatGPT五款主流大語(yǔ)言模型產(chǎn)品進(jìn)行同題測(cè)試,并邀請(qǐng)到五位語(yǔ)文名師進(jìn)行點(diǎn)評(píng)各模型生成作文水平的活動(dòng)中,就不難發(fā)現(xiàn):五款大模型基本都理解到了高考作文全國(guó)卷(甲)的作文立意,沒有出現(xiàn)偏題、跑題現(xiàn)象,也都能在短時(shí)間內(nèi)生成相應(yīng)文章。 

但同時(shí)大模型們也存在著對(duì)作文具體要求理解不清(諸如創(chuàng)作的文章字?jǐn)?shù)未達(dá)到不少于800字的要求)、行文死板、割裂感明顯、語(yǔ)言空洞、“理工味”明顯;并且更為重要的是它們創(chuàng)作的文章,都普遍存在著論點(diǎn)論據(jù)不足、觀點(diǎn)不新穎等在文學(xué)創(chuàng)作上最為致命的問題,這也導(dǎo)致這五款大模型創(chuàng)作的高考作文,綜合得分最高的ChatGPT,也只拿到了48分。 

坦率來(lái)講,ChatGPT的48分和百度文心一言的46.5分,在高考作文得分中,其實(shí)也不算低,甚至可能會(huì)超過許多考生的作文得分,但也與優(yōu)秀作文沒有沾不上邊,只能說是較為普通的水準(zhǔn)。 

而這些大模型在文學(xué)創(chuàng)作上暴露出的這些問題,也讓我們看到當(dāng)前生成式AI技術(shù)的不足,甚至可以說,那些叫囂著現(xiàn)在ChatGPT等生成式AI技術(shù)就能進(jìn)行文學(xué)創(chuàng)作,取代創(chuàng)意人員的話語(yǔ),著實(shí)有些夸大其辭乃至危言聳聽了。 

當(dāng)然,我們也不否認(rèn)ChatGPT等生成式AI技術(shù)在持續(xù)養(yǎng)料喂養(yǎng)下,能夠迅速成長(zhǎng)的潛力,但要擺脫當(dāng)前大模型在文學(xué)創(chuàng)作中存在的創(chuàng)造性不足問題 ,可能也并不是大模型們一朝一夕就能搞定的事情,其可能還需要較長(zhǎng)的時(shí)間。 

在此,幾乎可以說:在看過用生成式AI作答的高考作文后,我認(rèn)為對(duì)AI取代文學(xué)創(chuàng)作的鼓吹也好,恐懼也罷,其實(shí)都可以暫時(shí)先緩一緩了。 

寫在最后: 

ChatGPT等大模型技術(shù)所具備的郵件&新聞&論文撰寫、視頻腳本、文案、翻譯、代碼編寫等能力,讓生成式AI技術(shù)在很大程度上超越了過往這類AI應(yīng)用偏娛樂的屬性,進(jìn)入了真正的生產(chǎn)力乃至是創(chuàng)造性階段。 

由此 也有不少業(yè)內(nèi)驚呼 : 創(chuàng)造性工作機(jī)會(huì),可能會(huì)被GPT們率先取代了,開始陷入悲觀預(yù)期。 

事實(shí)上,對(duì)于生成式AI技術(shù)展現(xiàn)出的實(shí)力,我一直以來(lái)的觀點(diǎn)都是:既沒必要過度鼓吹,同時(shí)也沒必要過度恐懼,以一顆平常心去對(duì)待技術(shù)的發(fā)展更迭,或許會(huì)更好。 

站在技術(shù)浪潮面前,我們更應(yīng)該做的事情是,及早的學(xué)會(huì)善用這些技術(shù),以助力我們工作效率與生活質(zhì)量的提升。 

鄰章微信:ZLxgic,公眾號(hào):TMT317

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。