中英文口語(yǔ)、作文評(píng)分……網(wǎng)易有道、科大訊飛加入ChatGPT混戰(zhàn)
在科技圈掀起大浪潮的ChatGPT,最近也被教育公司盯上了。
日前,網(wǎng)易有道(NYSE:DAO)被傳其AI技術(shù)團(tuán)隊(duì)已投入到ChatGPT同源技術(shù)AIGC(AI Generated Content人工智能自動(dòng)生成內(nèi)容)在教育場(chǎng)景的落地研發(fā)中。
2月9日,網(wǎng)易有道向界面教育證實(shí)了上述消息,并表示近年來(lái)一直在AIGC上有持續(xù)性投入。去年底嘗試AIGC在教育場(chǎng)景中的落地應(yīng)用,包括但不限于AI口語(yǔ)老師、中文作文打分和評(píng)價(jià)等。
“產(chǎn)品的最終形態(tài)團(tuán)隊(duì)還在討論中,需要匹配用戶需求來(lái)決定,智能硬件、在線課程都可能是考慮落地的場(chǎng)景?!本W(wǎng)易有道稱。
AIGC被視為繼專業(yè)生產(chǎn)內(nèi)容(PGC)、用戶生產(chǎn)內(nèi)容(UGC)之后的新型內(nèi)容創(chuàng)作方式,目前AIGC已經(jīng)從早期的輔助人類實(shí)現(xiàn)內(nèi)容創(chuàng)造,發(fā)展到如今的獨(dú)立完成內(nèi)容創(chuàng)作的新階段。如前段時(shí)間AI繪畫就成為AIGC第一個(gè)破圈的落地應(yīng)用。

網(wǎng)易有道還表示,其在學(xué)習(xí)和翻譯場(chǎng)景下積累了豐富的多模態(tài)數(shù)據(jù)和相關(guān)語(yǔ)料,一直通過(guò)有道智云平臺(tái)向外輸出。
同日,界面教育自作業(yè)幫媒體交流會(huì)上獲悉,關(guān)于ChatGPT在教育領(lǐng)域的應(yīng)用,該公司已經(jīng)在做一些小樣測(cè)試,主要還是在原來(lái)作業(yè)幫的產(chǎn)品上,等產(chǎn)品成熟度較高后,會(huì)在聰明學(xué)系統(tǒng)里進(jìn)行應(yīng)用。
作業(yè)幫表示,多年來(lái)其在預(yù)訓(xùn)練語(yǔ)言模型中有持續(xù)投入,在教育相關(guān)場(chǎng)景下的多個(gè)垂類應(yīng)用都有落地,包括題意理解、知識(shí)點(diǎn)分類、作文批改、智能質(zhì)檢等。
“比如,行業(yè)之前做考試批閱的普遍做法是圍繞圖像比對(duì)來(lái)進(jìn)行,現(xiàn)在我們已經(jīng)能對(duì)一些數(shù)學(xué)題本身進(jìn)行測(cè)算和深度理解、處理,這其實(shí)是相似的技術(shù)。”作業(yè)幫執(zhí)行總裁蘇靜表示。
中公教育(002607.SZ)也來(lái)蹭了一波熱度,2月9日其在投資者關(guān)系平臺(tái)上稱,將根據(jù)ChatGPT發(fā)展帶動(dòng)的崗位需求來(lái)增設(shè)相關(guān)的培訓(xùn)課程。
相比上述公司的發(fā)聲,科大訊飛(002230.SZ)則直接披露產(chǎn)品的官宣日期。
該公司表示,已于2022年12月進(jìn)一步啟動(dòng)生成式預(yù)訓(xùn)練大模型任務(wù)攻關(guān)。2023年5月6日,將進(jìn)行產(chǎn)品級(jí)發(fā)布,AI學(xué)習(xí)機(jī)將成為該項(xiàng)技術(shù)率先落地的產(chǎn)品。其技術(shù)突破將在中英文作文輔導(dǎo)、中英文口語(yǔ)學(xué)習(xí)等方面帶來(lái)顯著提升。
上述消息的釋出,讓這些公司的股價(jià)在二級(jí)市場(chǎng)上掀起了一波小高潮。科大訊飛股價(jià)一度上漲30%,網(wǎng)易有道一度漲超18%。截至美東時(shí)間2月9日收盤,網(wǎng)易有道股價(jià)回落。2月10日午盤,科大訊飛上漲4.66%。
從目前披露的信息看來(lái),ChatGPT等相關(guān)技術(shù)在教育領(lǐng)域的應(yīng)用,主要集中在中英語(yǔ)口語(yǔ)和作文輔導(dǎo)上。這與ChatGPT背后基于海量數(shù)據(jù)生成的AI大模型息息相關(guān)。
它把能獲取的人類書籍、學(xué)術(shù)論文、新聞、高質(zhì)量的各種信息作為學(xué)習(xí)內(nèi)容,并根據(jù)人類反饋強(qiáng)化學(xué)習(xí)。該技術(shù)的突破也使得ChatGPT的對(duì)話更貼近人類,語(yǔ)段間邏輯關(guān)聯(lián)度顯著提升。
以早年間的人工智能作為對(duì)比,就能看出明顯差異。
在2016年高考結(jié)束、滿分作文尚未出爐之際,人工智能小冰的兩篇命題作文被曝光。與之同臺(tái)比拼的還有80后作家安意如、專欄作家潘采夫、詩(shī)人廖偉棠等,按要求在規(guī)定時(shí)間內(nèi)完成當(dāng)年的高考作文。
最后的結(jié)果顯示,小冰的作文能力與不少網(wǎng)民想象中的人工智能存在不少差距,小冰的文字雖然不乏文藝氣息,但最為集中的槽點(diǎn)是:字?jǐn)?shù)不夠,竟然沒(méi)到規(guī)定字?jǐn)?shù)800字的一半,多少有點(diǎn)不合常理。
從底層邏輯來(lái)看,當(dāng)時(shí)的小冰擁有一個(gè)基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)模型,這個(gè)模型以段為基本單位,逐句閱讀文章,學(xué)習(xí)基于上文生成下文的語(yǔ)義規(guī)律,從而在給出題目后并由人工寫出每一個(gè)段落的首句后,模型自動(dòng)生成剩余的句子。
這意味小冰是個(gè)“半自動(dòng)”的選手,一篇文章的好壞、文風(fēng),很大程度上還依賴寫首句的人。
“以前的機(jī)器學(xué)習(xí)更多屬于自動(dòng)化的范疇,人工智能模型根據(jù)輸入的內(nèi)容,可以去完成同樣的任務(wù)。而現(xiàn)在的大規(guī)模語(yǔ)言模型改變了這種模式。好比教一個(gè)孩子游泳,結(jié)果發(fā)現(xiàn)他會(huì)爬樹、踢足球,打乒乓……它有了自主學(xué)習(xí)的能力,或者說(shuō)它從之前的語(yǔ)料學(xué)習(xí)過(guò)程中,獲得了承擔(dān)新任務(wù)的能力?!本W(wǎng)易有道首席科學(xué)家段亦濤在近日的直播中稱。
段亦濤認(rèn)為,和之前能夠交互的模型非常不一樣,ChatGPT更像人了。這種技術(shù)突破是非常大的進(jìn)展,“在這個(gè)技術(shù)成熟之前,我們都談不上人工智能,它出現(xiàn)之后,我們才摸到了人工智能的門檻?!?/p>
當(dāng)人們驚嘆于ChatGPT“上知天文、下知地理”的聰明時(shí),也難以忽略它的昂貴。
據(jù)21財(cái)經(jīng)援引業(yè)內(nèi)人士消息,擁有1750億個(gè)參數(shù)的GPT-3因其巨大的每秒浮點(diǎn)計(jì)算量,單次訓(xùn)練成本達(dá)到460萬(wàn)美元。眼下最主流的英偉達(dá)A100芯片,單次訓(xùn)練的使用量應(yīng)達(dá)到數(shù)百片,成本在3000萬(wàn)元左右。
這注定是一場(chǎng)只有巨頭才有入門券資格的游戲。那么問(wèn)題來(lái)了,教育公司如果想要入局分一杯羹,是否有能力或者說(shuō)有必要再造一個(gè)大模型?還是說(shuō)通過(guò)購(gòu)買調(diào)取現(xiàn)有大模型,進(jìn)行更偏自身業(yè)務(wù)屬性的調(diào)適?
段亦濤曾在上述直播中稱,“這次技術(shù)更新是一次顛覆性的創(chuàng)新,但在細(xì)分場(chǎng)景的應(yīng)用過(guò)程中實(shí)際上并不需要這樣一個(gè)大而全的模型,更需要一些縱深向的探索。比如,有道正在探索ChatGPT同源技術(shù)AIGC在學(xué)習(xí)場(chǎng)景中的落地,這個(gè)過(guò)程加深了我們對(duì)于ChatGPT的進(jìn)一步理解。”
西部證券在日前研報(bào)中指出,中國(guó)AIGC產(chǎn)業(yè)仍處于發(fā)展初期,最先興起的是AI寫作和語(yǔ)音合成模塊,虛擬人概念剛興起,底層技術(shù)較國(guó)外仍有較大差距。眾多國(guó)內(nèi)廠商從內(nèi)容布局入手,目前商業(yè)模式不成熟,還停留在免費(fèi)引流階段。
該機(jī)構(gòu)認(rèn)為,AIGC目前主要客戶集中在B端,廠商話語(yǔ)權(quán)較弱,未來(lái)會(huì)向2B+2C方向發(fā)展,B端降本增效是根本訴求,C端的付費(fèi)邏輯在于高效獲取信息,替代表達(dá)以及擴(kuò)大用戶創(chuàng)造力。
“2023年有望成為AIGC發(fā)展大年。類似ChatGPT的大模型作為AIGC的底層平臺(tái),將成為核心資源?!蔽鞑孔C券稱。
科大訊飛在公開發(fā)言中,則透露了其有信心在預(yù)訓(xùn)練認(rèn)知智能大模型上代表中國(guó)實(shí)現(xiàn)突破。
在1月31日披露的投資者關(guān)系活動(dòng)記錄表中,科大訊飛稱,自2018年起,預(yù)訓(xùn)練模型范式就逐步開始在自然語(yǔ)言處理領(lǐng)域應(yīng)用,包括谷歌、微軟、OpenAI、科大訊飛、智源、鵬城等單位陸續(xù)推出預(yù)訓(xùn)練模型。
科大訊飛陸續(xù)開源了六大類、超40個(gè)通用領(lǐng)域的系列中文預(yù)訓(xùn)練語(yǔ)言模型,開源三年模型庫(kù)月均調(diào)用量超千萬(wàn),并自稱是“業(yè)界最廣泛流行的中文預(yù)訓(xùn)練模型之一”,在GitHub(面向開源及私有軟件項(xiàng)目的托管平臺(tái))的中文預(yù)訓(xùn)練模型的星標(biāo)數(shù)達(dá)13346位列第一。
去年,該公司發(fā)布了面向多模態(tài)領(lǐng)域的兩個(gè)輕量級(jí)預(yù)訓(xùn)練模型,并表示“在參數(shù)量遠(yuǎn)小于業(yè)界公開模型20倍以上的情況下,識(shí)別效果提升20%-30%”。
據(jù)自媒體數(shù)智前線援引業(yè)內(nèi)人士觀點(diǎn)稱,整個(gè)互聯(lián)網(wǎng)的中文數(shù)據(jù)質(zhì)量,相比于英文還是有明顯差距,需要做中英文不同語(yǔ)言之間的數(shù)據(jù)互補(bǔ)。目前全球還沒(méi)有能跟ChatGPT抗衡的大模型,業(yè)界共識(shí)是差距在兩年以上。國(guó)內(nèi)先不談彎道超車,趁早追趕反而是更重要的。
掃描二維碼推送至手機(jī)訪問(wèn)。
版權(quán)聲明:本文由財(cái)神資訊-領(lǐng)先的體育資訊互動(dòng)媒體轉(zhuǎn)載發(fā)布,如需刪除請(qǐng)聯(lián)系。