![](/resources/images/search.png)
2023年5月6日科大訊飛召開“訊飛星火認(rèn)知大模型”成果發(fā)布會(huì)。
科大訊飛董事長(zhǎng)劉慶峰、科大訊飛研究院院長(zhǎng)劉聰,從文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、數(shù)學(xué)能力、邏輯推理、代碼生成、多模態(tài)輸入及生成7個(gè)維度演示了大模型的通用能力,以及認(rèn)知大模型與訊飛現(xiàn)有產(chǎn)品結(jié)合的商業(yè)應(yīng)用成果。
國(guó)內(nèi)認(rèn)知大模型的最高水平是什么樣?一起來(lái)看看。
一、認(rèn)知大模型的七個(gè)能力維度
自從去年11月OpenAI推出ChatGPT以來(lái),認(rèn)知大模型技術(shù)在全球掀起了人工智能的全新浪潮,認(rèn)知大模型的出現(xiàn)不亞于PC或者互聯(lián)網(wǎng)的誕生。
通過(guò)統(tǒng)一的大模型學(xué)習(xí)后,系統(tǒng)具備了像人類一樣觸類旁通的能力,可以在跨領(lǐng)域形成良好表現(xiàn),認(rèn)知大模型已經(jīng)實(shí)實(shí)在在開啟了通用人工智能的曙光,星星之火開始出現(xiàn)。
目前,國(guó)內(nèi)通用大模型的水平如何?
我們不得而知,但是訊飛的認(rèn)知大模型已經(jīng)具備了7大通用能力,在教育、辦公、汽車、數(shù)字員工等多個(gè)領(lǐng)域都能落地應(yīng)用,并且在文本生成、知識(shí)問(wèn)答、數(shù)學(xué)能力三大能力上已超越ChatGPT。
1.長(zhǎng)文本生成能力
劉聰現(xiàn)場(chǎng)用星火認(rèn)知大模型生成了一段歡迎詞,展示了大模型的文本生成能力。
為了測(cè)試不同文本類型的生成能力,劉聰還讓星火認(rèn)知大模型生成了郵件、故事、中英品宣文案等文字內(nèi)容。
認(rèn)知大模型,生成了一段孫悟空和奧特曼的故事,還使用語(yǔ)音朗讀了這段現(xiàn)場(chǎng)生成的小故事。
所有內(nèi)容都是大模型隨機(jī)生成的,即使是同樣的關(guān)鍵詞和描述,每次生成的內(nèi)容也是不同的。星火認(rèn)知大模型在中文文本生成方面的能力已經(jīng)超越了ChatGPT,英文方面達(dá)到了4.29分,而ChatGPT是4.48分。
2.語(yǔ)言理解能力
科大訊飛通過(guò)兩個(gè)例子,演示了大模型在語(yǔ)法檢查和語(yǔ)義理解上的成果。
在輸入一段存在單詞拼寫錯(cuò)誤、單復(fù)數(shù)錯(cuò)誤、時(shí)態(tài)錯(cuò)誤等問(wèn)題的英文段落后,星火認(rèn)知大模型迅速生成了一段糾正所有錯(cuò)誤的文字。
展示語(yǔ)義理解能力時(shí),劉慶峰以“俗話說(shuō)男子漢大丈夫?qū)幩啦磺?,但俗話又說(shuō)男子漢大丈夫能屈能伸”為例,測(cè)試了大模型是否能準(zhǔn)確理解這兩句話背后的含義。
此外,對(duì)同一句話在不同語(yǔ)境中的不同理解,大模型也給出了準(zhǔn)確的回答。
3.知識(shí)問(wèn)答
大模型的知識(shí)問(wèn)答能力包括生活常識(shí)類、科學(xué)知識(shí)、工作技巧、醫(yī)學(xué)知識(shí)等。比如,在醫(yī)療領(lǐng)域,大模型將不僅成為醫(yī)生的助手,還會(huì)成為每個(gè)人的健康助手。
后續(xù)更多科普知識(shí)也會(huì)被融入到大模型中。在中國(guó)科學(xué)院支持下,大模型將持續(xù)不斷學(xué)習(xí)更多科學(xué)資料,不斷提升科學(xué)問(wèn)答能力。
4.邏輯推理
為了測(cè)試星火大模型是否真的可以理解人類提問(wèn),劉慶峰通過(guò)常識(shí)理解和故事編輯兩種方式進(jìn)行了演示。
現(xiàn)場(chǎng)問(wèn)大模型“孔子在2008年奧運(yùn)會(huì)上發(fā)表了什么講話?”大模型基于歷史和常識(shí)判斷出孔子不可能出現(xiàn)在奧運(yùn)會(huì)現(xiàn)場(chǎng)。讓大模型以此為主題生成一個(gè)故事時(shí),它則從創(chuàng)作維度根據(jù)給出的提示編輯生成了一個(gè)小故事。
5.數(shù)學(xué)能力
數(shù)學(xué)能力一定意義上代表了認(rèn)知大模型通用能力的認(rèn)知水平,星火認(rèn)知大模型在數(shù)學(xué)能力方面遙遙領(lǐng)先。
從基礎(chǔ)計(jì)算到三角形求度數(shù)再到應(yīng)用題,星火認(rèn)知大模型都在現(xiàn)場(chǎng)演示中給出了準(zhǔn)確答案。
6.代碼能力
發(fā)布會(huì)現(xiàn)場(chǎng)星火認(rèn)知大模型進(jìn)行了一小段“找出1到100之間的質(zhì)數(shù)并輸出結(jié)果”代碼生成的演示。
代碼生成能力主要針對(duì)工業(yè)互聯(lián)網(wǎng)和企業(yè)內(nèi)部使用,星火認(rèn)知大模型仍在不斷訓(xùn)練中,未來(lái)兩到三個(gè)月代碼運(yùn)行能力將有很大提升。
7.多模態(tài)輸入和表達(dá)能力
除了前文已經(jīng)提到過(guò)的語(yǔ)音識(shí)別和朗讀功能,發(fā)布會(huì)中還展示了大模型的圖文輸入和理解能力,不僅可以把英文菜單翻譯為中文,還可以對(duì)菜單里的菜名進(jìn)行解釋,描述菜品的味道。
這一功能不僅可以應(yīng)用在簡(jiǎn)單的圖文翻譯中,也可以成為旅行助手,在提供翻譯功能的同時(shí),介紹不同名勝古跡背后的含義和歷史故事。
更值得一提的是,星火認(rèn)知大模型還可以根據(jù)文字直接生成視頻內(nèi)容,無(wú)論是聲音、虛擬人形象、唇型、手勢(shì)還是視頻背景都由大模型實(shí)時(shí)生成。
后續(xù),星火認(rèn)知大模型完善的方向如下:進(jìn)一步提升大模型的開放式問(wèn)答和多輪對(duì)話能力;實(shí)現(xiàn)代碼生成能力升級(jí),并將多模態(tài)交互能力開放給客戶;全面實(shí)現(xiàn)通用模型對(duì)標(biāo)ChatGPT等。
二、四個(gè)領(lǐng)域,取得落地成果
在教育領(lǐng)域,一直以來(lái),作文提升都是教學(xué)中的一大難點(diǎn),以批改為例,找出病句、好句、給出評(píng)語(yǔ),一篇文章最少需要老師用30分鐘才能完成。
而星火大模型的語(yǔ)言能力和學(xué)習(xí)機(jī)結(jié)合,可以對(duì)作文快速進(jìn)行深度理解,自動(dòng)生成評(píng)語(yǔ)和范文。
在辦公領(lǐng)域,大模型升級(jí)產(chǎn)品,幫助智慧辦公邁入了全新階段,可以滿足語(yǔ)音轉(zhuǎn)寫、會(huì)議記錄等多語(yǔ)種翻譯等多種辦公需求,助力職場(chǎng)人提升工作效率。
在汽車領(lǐng)域和數(shù)字人領(lǐng)域,大模型和產(chǎn)品及業(yè)務(wù)進(jìn)行全面結(jié)合,比如虛擬人智能交互機(jī)現(xiàn)已有1000多個(gè)虛擬形象資產(chǎn)、300多個(gè)專業(yè)聲音、30多萬(wàn)用戶自定義音庫(kù),可以提供更加自動(dòng)化、個(gè)性化的數(shù)字員工服務(wù),實(shí)現(xiàn)24小時(shí)不打烊營(yíng)業(yè)。
三、中外大模型能力差距爭(zhēng)議
追趕OpenAI首先需要一套科學(xué)系統(tǒng)的評(píng)測(cè)體系。
劉慶峰認(rèn)為,認(rèn)知大模型剛剛起步,還在快速成長(zhǎng)和迭代過(guò)程中。
讓這次智慧涌現(xiàn)的認(rèn)知智能解決社會(huì)剛需,需要一套腳踏實(shí)地的科學(xué)系統(tǒng)的評(píng)測(cè)體系。
在認(rèn)知大模型還在快速迭代中,如果只是找單點(diǎn)例子來(lái)證明某個(gè)系統(tǒng)的強(qiáng)弱,是沒(méi)有意義的。