国产精品无码久久久久,成人国产一区二区三区精品,99热99re8国产在线播放,国产呦精品一区二区三区下载,秋霞免费理论片鲁丝在线观看,最近中文字幕大全免费全集3,国产一区免费在线观看,久久青草免费97线频观,999久久66久6只有精品

X

掃碼登錄

二維碼
  • 賬號(hào)登錄
登錄
登錄視為您已同意第三方賬號(hào)綁定協(xié)議、服務(wù)條款、隱私政策
X

掃碼注冊(cè)

二維碼
  • 賬號(hào)注冊(cè)
我以閱讀并同意 服務(wù)條款、 隱私政策
注冊(cè)
注冊(cè)視為您已同意第三方賬號(hào)綁定協(xié)議、服務(wù)條款、隱私政策

大模型不能只會(huì)開(kāi)放閑聊——專訪上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華

2023年10月30日 17:03
行業(yè)資訊 瀏覽:306

中國(guó)市場(chǎng)巨大、數(shù)據(jù)豐富、應(yīng)用場(chǎng)景豐富,完全可以用完善的應(yīng)用生態(tài)來(lái)帶動(dòng)底座大模型的進(jìn)步,走一條“農(nóng)村包圍城市”的路線。


《瞭望東方周刊》記者萬(wàn)宏蕾?編輯顧佳贇

7月7日,華為技術(shù)有限公司在華為開(kāi)發(fā)者大會(huì)2023上正式發(fā)布人工智能(AI)大模型華為云盤古大模型 3.0 ( 陳宇軒/攝 )

自ChatGPT上線來(lái),國(guó)際國(guó)內(nèi)各大廠商紛紛跟進(jìn),投入了巨大研發(fā)資源來(lái)研發(fā)類似大模型。人工智能的發(fā)展,尤其到了通用人工智能階段,可謂熱點(diǎn)紛呈。

作為人工智能產(chǎn)業(yè)發(fā)展過(guò)程中的里程碑事件,ChatGPT代表通用人工智能技術(shù)的成熟,宣告人類社會(huì)技術(shù)進(jìn)步有可能進(jìn)入快速增長(zhǎng)期,甚至一個(gè)指數(shù)發(fā)展期。在類ChatGPT大模型領(lǐng)域,中國(guó)尚處于起步階段,需做進(jìn)一步戰(zhàn)略規(guī)劃并統(tǒng)籌發(fā)展。就相關(guān)問(wèn)題,《瞭望東方周刊》近日專訪了上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任、復(fù)旦大學(xué)教授肖仰華,探討我國(guó)大模型產(chǎn)業(yè)的發(fā)展路徑。

肖仰華

知識(shí)底座

《瞭望東方周刊》:通用大模型一定程度上刷新了我們對(duì)人工智能領(lǐng)域的認(rèn)知,如何理解它帶來(lái)的變革?或者說(shuō)大模型有哪些能力?

肖仰華:大模型是人類文明所積累的海量知識(shí)容器,其所具備的通識(shí)能力,就是開(kāi)放世界的理解能力?,F(xiàn)在跟ChatGPT聊天,聊任何行業(yè)、學(xué)科的問(wèn)題,它都能給出一個(gè)看起來(lái)不錯(cuò)的答案,雖然其仍可能犯一些事實(shí)錯(cuò)誤、一些邏輯錯(cuò)誤,但基本不會(huì)太偏離問(wèn)題主旨——比如問(wèn)出生日期卻答出生地點(diǎn)。它還具備一定的“自知之明”能力,對(duì)于超出范圍或者倫理敏感的問(wèn)題,會(huì)拒絕回答。大模型這種對(duì)人類開(kāi)放世界的理解力,已達(dá)到甚至超越普通人的水平。傳統(tǒng)人工智能產(chǎn)品的“智障”問(wèn)題已基本解決,這種開(kāi)放世界的理解能力,對(duì)垂直領(lǐng)域(垂域)的認(rèn)知非常關(guān)鍵,因?yàn)榇褂驊?yīng)用是建立在通用大模型的通用認(rèn)知能力基礎(chǔ)之上的。

大模型有組合創(chuàng)新能力。我們?cè)谥噶顚W(xué)習(xí)階段讓它學(xué)了A任務(wù)、B任務(wù),它以后有可能泛化出求解A+B任務(wù)的能力。這種組合泛化,以前做不到,今天能做到,通用大模型讓“舉一反三”成為可能。

大模型有忠實(shí)的指令理解和執(zhí)行能力,尤其是超大模型。只要給它指令、要求、約束、規(guī)范、規(guī)則,它就一定能夠按照要求一步步完成任務(wù)。這本質(zhì)上是一種情境化生成能力。我甚至認(rèn)為,大模型智能本質(zhì)就是情境化生成能力,因?yàn)榇竽P驮谔崾驹絹?lái)越豐富時(shí),生成的效果越來(lái)越好。

大模型有復(fù)雜任務(wù)的分解能力和規(guī)劃能力。現(xiàn)實(shí)中很多場(chǎng)景都是復(fù)雜任務(wù),需要一步一步求解,先做什么,再做什么,按照順序進(jìn)行合理編排,這就是規(guī)劃能力。

大模型還有強(qiáng)大的符號(hào)推理能力。以前人們只是把大模型當(dāng)做知識(shí)容器來(lái)看待,只期望其提供需要的知識(shí)。但今天不得不承認(rèn)大模型也一定程度上具備類似知識(shí)庫(kù)(知識(shí)圖譜)所具備的推理能力,比如常識(shí)推理、數(shù)值推理等能力,當(dāng)然這方面能力還需要進(jìn)一步提升。

《瞭望東方周刊》:為什么說(shuō)單有通用大模型不足以解決行業(yè)領(lǐng)域很多問(wèn)題,需要發(fā)展垂域大模型?

肖仰華:因?yàn)榫哂猩鲜瞿芰?,通用大模型好比是一個(gè)寬廣的知識(shí)底座,但仍然缺乏專業(yè)知識(shí)的深度,缺乏專業(yè)領(lǐng)域復(fù)雜應(yīng)用的長(zhǎng)程推理能力。ChatGPT這類大模型本質(zhì)上只是實(shí)現(xiàn)了在開(kāi)放環(huán)境下的人機(jī)對(duì)話,或者叫開(kāi)放閑聊,但開(kāi)放閑聊并不能幫我們解決實(shí)實(shí)在在的工作場(chǎng)景中的復(fù)雜決策任務(wù),比如要做設(shè)備故障排查、疾病診斷,都是嚴(yán)肅復(fù)雜的決策場(chǎng)景。在這些場(chǎng)景中需要豐富的專業(yè)知識(shí)、復(fù)雜的決策邏輯、宏觀態(tài)勢(shì)的研判能力、綜合任務(wù)的拆解與規(guī)劃能力、復(fù)雜約束的取舍能力、未見(jiàn)事物的預(yù)見(jiàn)能力、不確定場(chǎng)景的推理推斷能力等。

大模型的開(kāi)放閑聊過(guò)程中可能存在兩個(gè)問(wèn)題:一是“幻覺(jué)”問(wèn)題。與ChatGPT聊天,有時(shí)它說(shuō)得頭頭是道,但仔細(xì)分析,會(huì)發(fā)現(xiàn)它正在胡編亂造一些不存在的事實(shí)。同時(shí)因?yàn)槠湔Z(yǔ)言風(fēng)格一本正經(jīng),讓普通人很容易相信它,即便是領(lǐng)域?qū)<乙獜乃邪逵醒鄣奈谋局凶R(shí)別虛構(gòu)和錯(cuò)誤也是一件不易的事。

二是缺乏領(lǐng)域“忠實(shí)度”的問(wèn)題。解決任何專業(yè)領(lǐng)域的問(wèn)題都要求大模型不要自己根據(jù)通識(shí)去自由發(fā)揮,而要嚴(yán)格遵循這個(gè)領(lǐng)域的規(guī)范、用符合這個(gè)領(lǐng)域的知識(shí)體系來(lái)回答問(wèn)題。但是我們?nèi)L試了一些通用大模型,發(fā)現(xiàn)如果不做一些調(diào)教優(yōu)化,它總是會(huì)超出你給定的領(lǐng)域文檔自由發(fā)揮,進(jìn)而犯錯(cuò)。

所以,一個(gè)基本的判斷是:?jiǎn)螁卫矛F(xiàn)在的通用大模型不足以解決行業(yè)很多問(wèn)題。實(shí)際應(yīng)用需要的是事實(shí)正確、忠實(shí)于領(lǐng)域知識(shí)與文本的垂域大模型。從這個(gè)判斷出發(fā),當(dāng)下我們要發(fā)展面向垂域的大模型,要發(fā)展通用大模型的外圍插件,要采取大模型和知識(shí)圖譜、傳統(tǒng)知識(shí)庫(kù)相結(jié)合的策略。

趕上差距

《瞭望東方周刊》:面對(duì)ChatGPT所引發(fā)的通用人工智能產(chǎn)業(yè)變革,國(guó)內(nèi)企業(yè)應(yīng)該如何抓住大模型產(chǎn)業(yè)機(jī)會(huì)?

肖仰華:大模型絕不是宣傳文案的噱頭。我們正在見(jiàn)證由通用人工智能所帶來(lái)的前所未有的技術(shù)革命。通用人工智能是人類歷史上第一次關(guān)于智能本身的革命。歷次技術(shù)突破都是人類智能的產(chǎn)物,而唯獨(dú)通用人工智能是“智能”本身的革命。

大模型的誕生宣告了整個(gè)人工智能進(jìn)入全新的重工業(yè)時(shí)代?;仡櫲祟悮v史上的歷次技術(shù)革命,多始于相對(duì)低級(jí)的手工作坊模式,經(jīng)過(guò)漫長(zhǎng)的發(fā)展周期,最終形成了成熟的重工業(yè)發(fā)展模式。重工業(yè)化的人工智能有三個(gè)鮮明的特征:大模型、大算力和大數(shù)據(jù)。

5月23日,工作人員在貴州大學(xué)省部共建公共大數(shù)據(jù)國(guó)家重點(diǎn)實(shí)驗(yàn)室算力中心 ( 劉續(xù)/攝 )

國(guó)外大模型產(chǎn)業(yè)已經(jīng)形成了一個(gè)生態(tài),而且發(fā)展非常迅速。反觀國(guó)內(nèi),從表象上看熱鬧非凡、模型林立,但是剝開(kāi)外殼從內(nèi)里看,仍然有不少問(wèn)題,不免讓人擔(dān)憂。

一方面,幾乎所有國(guó)內(nèi)人工智能產(chǎn)業(yè)的重要企業(yè)與研發(fā)機(jī)構(gòu)紛紛推出了自己的類ChatGPT大模型。這說(shuō)明,大家都意識(shí)到大模型的戰(zhàn)略意義,積極主動(dòng)投入資源,這值得肯定。

另一方面,國(guó)內(nèi)大模型產(chǎn)業(yè)發(fā)展已經(jīng)出現(xiàn)一些問(wèn)題:一是技術(shù)路線同質(zhì)化嚴(yán)重,很多大模型都是用ChatGPT喂養(yǎng)自己的大模型,或是在國(guó)外開(kāi)源通用大模型基礎(chǔ)上進(jìn)行指令微調(diào);二是數(shù)據(jù)生態(tài)不完善,中文數(shù)據(jù)生態(tài)尤其重要,但現(xiàn)在較為欠缺;三是算力掣肘;四是模型創(chuàng)新有限,現(xiàn)在很多國(guó)內(nèi)大模型都基于國(guó)外的開(kāi)源社區(qū)模型。

總之,ChatGPT所引發(fā)的通用人工智能產(chǎn)業(yè)變革才剛剛開(kāi)始,中國(guó)相關(guān)部門和企業(yè)要以深入的思考和扎實(shí)的實(shí)踐抓住機(jī)遇,同時(shí)高度重視發(fā)展過(guò)程中出現(xiàn)的問(wèn)題。

《瞭望東方周刊》:具體來(lái)說(shuō),中國(guó)發(fā)展大模型產(chǎn)業(yè)目前面臨哪些短板?

肖仰華:大模型產(chǎn)業(yè)的發(fā)展取決于多個(gè)因素:其一是模型,模型好比內(nèi)功,模型越大,潛力越強(qiáng)。其二是算力,這是大模型的核心競(jìng)爭(zhēng)力,大模型競(jìng)爭(zhēng)歸根結(jié)底是算力的競(jìng)爭(zhēng)。其三是數(shù)據(jù),只有高質(zhì)量的數(shù)據(jù),才能喂養(yǎng)出高水平的大模型。不過(guò),這幾個(gè)問(wèn)題都不是中國(guó)大模型產(chǎn)業(yè)的真正短板所在。

與國(guó)際同行相比,當(dāng)前我國(guó)大模型產(chǎn)業(yè)發(fā)展在數(shù)據(jù)上有優(yōu)勢(shì),在算力方面有基礎(chǔ),模型本身也不存在什么技術(shù)秘密,真正的短板在于我們對(duì)大模型“煉制”工藝的掌握,包括數(shù)據(jù)配方、數(shù)據(jù)清洗和參數(shù)設(shè)置等等,這些從根本上決定了大模型的效果,是大模型產(chǎn)業(yè)發(fā)展的重要因素。這方面短期之內(nèi)難以跟上或者超越,需要我們付出巨大代價(jià)進(jìn)行摸索。

實(shí)際上,上述的每一個(gè)具體模塊,國(guó)內(nèi)都知道怎么做,但是將它們整合在一起,總體效果和國(guó)外是存在差距的,不是0分和100分的差距,而是70分與100分的差距。我們要趕上最后這幾十分,要不斷試錯(cuò)、評(píng)測(cè)和改進(jìn)。

從大模型問(wèn)題引申來(lái)看,應(yīng)用和集成創(chuàng)新,一直是我們的強(qiáng)項(xiàng)。但是跟美國(guó)相比,我們?nèi)鄙僭紕?chuàng)新,原始創(chuàng)新甚至到了極度稀缺的程度。原始創(chuàng)新是怎么來(lái)的?可能來(lái)自科學(xué)家的奇思妙想,可能來(lái)自偏執(zhí)甚至瘋狂的想法。比如Open AI的CEO山姆·奧特曼(Sam Altman),他在2015年成立Open AI,2018年投入巨資研發(fā)大模型。而在2018年這個(gè)時(shí)間點(diǎn),全世界沒(méi)有多少科學(xué)家認(rèn)為通用大模型這條路可以走通。

將來(lái)我們要實(shí)現(xiàn)引領(lǐng),就一定要不斷優(yōu)化科研文化和科研生態(tài),鼓勵(lì)思辨、鼓勵(lì)質(zhì)疑,激發(fā)原始創(chuàng)新。

7月8日,2023世界人工智能大會(huì)在上海世博展覽館舉行。蜜度信息,“文稿通”基于大模型的詩(shī)歌生成

戰(zhàn)略定力

《瞭望東方周刊》:在大模型熱潮之下,中國(guó)自己的大模型發(fā)展道路究竟該怎么走?

肖仰華:國(guó)家有關(guān)部門要引導(dǎo)業(yè)界統(tǒng)一規(guī)劃、合作協(xié)同、有序發(fā)展、健康發(fā)展。對(duì)此,我建議,可以從八個(gè)方面的應(yīng)對(duì)措施推動(dòng)我國(guó)大模型產(chǎn)業(yè)的發(fā)展:一是積極推動(dòng)數(shù)據(jù)聯(lián)盟(數(shù)據(jù)交易)的建設(shè),促進(jìn)優(yōu)質(zhì)數(shù)據(jù)的共享與傳播;二是大力推動(dòng)算力聯(lián)盟建設(shè),促進(jìn)優(yōu)質(zhì)算力共享與協(xié)作;三是推動(dòng)模型開(kāi)源社區(qū)建設(shè),完善國(guó)產(chǎn)大模型的開(kāi)源生態(tài);四是創(chuàng)新培養(yǎng)方式,培育大模型產(chǎn)業(yè)人才;五是建立大模型的診斷與應(yīng)用評(píng)測(cè)體系,保障大模型產(chǎn)業(yè)健康發(fā)展;六是研究綠色可持續(xù)的大模型技術(shù),降低大模型落地成本;七是積極探索大模型的應(yīng)用模式,豐富大模型的應(yīng)用場(chǎng)景;八是持續(xù)研究大模型訓(xùn)練與應(yīng)用關(guān)鍵技術(shù),完善大模型技術(shù)體系。

尤其要注意,在這波大模型的發(fā)展熱潮之下,不能為了追隨ChatGPT,忽略了其他熱點(diǎn),錯(cuò)失了下一個(gè)機(jī)遇。我們一定要有戰(zhàn)略定力,對(duì)不斷出現(xiàn)的熱點(diǎn)要有戰(zhàn)略重視,但不能打亂既有部署。比如,很多傳統(tǒng)小模型,該研究還得繼續(xù)研究,數(shù)字化與智能化進(jìn)程中的其他技術(shù)也得往前推進(jìn)。

在方向上,或者說(shuō),只有底座大模型與垂域應(yīng)用相結(jié)合,才能最終創(chuàng)造價(jià)值。比如,醫(yī)療領(lǐng)域希望做能代替或部分解放醫(yī)生的問(wèn)診機(jī)器人,投資領(lǐng)域希望有投資顧問(wèn)機(jī)器人,司法領(lǐng)域希望有法律咨詢機(jī)器人,這都屬于垂域場(chǎng)景。在提升通用大模型能力的同時(shí),也期待相關(guān)企業(yè)能在大模型垂域應(yīng)用上有所作為,把大模型的通識(shí)能力更好地與垂域的專業(yè)知識(shí)、專家經(jīng)驗(yàn)、行業(yè)解決問(wèn)題的思維方式相結(jié)合,去解決現(xiàn)實(shí)中的復(fù)雜問(wèn)題。我們既要重視通用大模型,更要重視垂域應(yīng)用,重模型輕應(yīng)用或者重應(yīng)用輕模型,都是不可取的。

中國(guó)市場(chǎng)巨大、數(shù)據(jù)豐富、應(yīng)用場(chǎng)景豐富,完全可以用完善的應(yīng)用生態(tài)來(lái)帶動(dòng)底座大模型的進(jìn)步,走一條“農(nóng)村包圍城市”的路線。也就說(shuō),先把我們擅長(zhǎng)的外圍應(yīng)用和技術(shù)生態(tài)做好,不斷去補(bǔ)齊通用大模型在數(shù)據(jù)、算力、模型和工藝等方面的短板,并在這一過(guò)程中摸索有中國(guó)特色的大模型發(fā)展道路,形成獨(dú)特優(yōu)勢(shì),另辟大模型競(jìng)爭(zhēng)賽道,進(jìn)而形成核心競(jìng)爭(zhēng)力,形成百花齊放、百家爭(zhēng)鳴的繁榮生態(tài)。

總之,國(guó)產(chǎn)大模型絕不能停留在類ChatGPT的開(kāi)放閑聊,要盡快提升其解決千行百業(yè)實(shí)際問(wèn)題的能力,切實(shí)把大模型發(fā)展成為推動(dòng)我國(guó)各行業(yè)數(shù)字化轉(zhuǎn)型與高質(zhì)量發(fā)展的先進(jìn)生產(chǎn)力。

暫無(wú)評(píng)論
頭像
0/1000
匿名