網(wǎng)站首頁 | 網(wǎng)站地圖

大國新村
首頁 > 原創(chuàng)精品 > 成果首發(fā) > 正文

人工智能大模型發(fā)展的新形勢(shì)及其省思

【摘要】隨著相關(guān)技術(shù)的不斷進(jìn)步,大模型發(fā)展呈現(xiàn)出與數(shù)據(jù)要素深度融合、其日益沉淀為基礎(chǔ)設(shè)施、發(fā)展焦點(diǎn)從底座模型轉(zhuǎn)移至應(yīng)用生態(tài)等新的趨勢(shì)。針對(duì)大模型產(chǎn)業(yè)發(fā)展呈現(xiàn)出的新態(tài)勢(shì)、新動(dòng)向,我們要樹立大模型發(fā)展的全局觀和整體觀,積極采取加快建設(shè)人工智能教育體系、建立以智能科學(xué)為核心的跨學(xué)科研究體系、推動(dòng)大模型與數(shù)據(jù)要素協(xié)同發(fā)展并堅(jiān)持多元化的大模型發(fā)展路徑等新的應(yīng)對(duì)舉措。作為一種先進(jìn)技術(shù),大模型具有兩面性,我們?cè)诜e極采取措施促進(jìn)其良性發(fā)展并釋放其應(yīng)用價(jià)值的同時(shí),也要密切關(guān)注其濫用、誤用與惡用所帶來的虛假內(nèi)容泛濫、影響人類心智和能力的發(fā)展與培育等負(fù)面問題,未雨綢繆積極做好風(fēng)險(xiǎn)治理與管控。

【關(guān)鍵詞】大模型 人工智能 風(fēng)險(xiǎn)管控 大模型應(yīng)用落地

【中圖分類號(hào)】TP18/F49 【文獻(xiàn)標(biāo)識(shí)碼】A

【DOI】10.16619/j.cnki.rmltxsqy.2024.13.004

【作者簡介】肖仰華,復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授、博導(dǎo),上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任。研究方向?yàn)橹R(shí)圖譜、知識(shí)工程、大數(shù)據(jù)管理與挖掘。主要著作有《圖對(duì)稱性理論及其在數(shù)據(jù)管理中的應(yīng)用》、《知識(shí)圖譜:概念與技術(shù)》(合著)、《生成式語言模型與通用人工智能:內(nèi)涵、路徑與啟示》(論文)等。

 

自2022年底OpenAI發(fā)布ChatGPT以來,大模型產(chǎn)業(yè)發(fā)展先后經(jīng)歷了百模大戰(zhàn)、追求更大參數(shù)、刷榜競(jìng)分,直到近期各大廠商相繼加入價(jià)格戰(zhàn),可謂熱點(diǎn)紛呈。大模型的技術(shù)形態(tài)也從單純文本發(fā)展到了多模態(tài),從模擬人類大腦的認(rèn)知功能發(fā)展到操控機(jī)器身體進(jìn)而與復(fù)雜環(huán)境交互,從通用發(fā)展到專業(yè)與行業(yè)大模型,大模型技術(shù)生態(tài)日益繁榮。熱鬧的產(chǎn)業(yè)發(fā)展背后涌動(dòng)的是科技巨頭對(duì)通用人工智能(Artificial General Intelligence,簡稱AGI)技術(shù)賽道的激烈拼搶,是大國科技競(jìng)爭(zhēng)態(tài)勢(shì)的愈演愈烈。如果說ChatGPT打響了通用人工智能技術(shù)革命的第一槍,那么當(dāng)下AGI產(chǎn)業(yè)競(jìng)爭(zhēng)似乎進(jìn)入了多點(diǎn)開花、犬牙交錯(cuò)的局面,未來走勢(shì)并不清晰。與此同時(shí),大模型產(chǎn)業(yè)發(fā)展過程中的各種問題也日益突出:各廠商仍在艱難摸索大模型變現(xiàn)路徑、研發(fā)投入仍在持續(xù)增長、需求方的耐心不斷被消磨,對(duì)生成式大模型的根本性問題(比如幻覺問題)仍然缺乏有效應(yīng)對(duì)策略、大模型訓(xùn)練與應(yīng)用的資源與能源消耗問題日益突出。久而久之,大模型廠商成本壓力增大,市場(chǎng)也逐漸冷靜。此外,大模型技術(shù)大規(guī)模應(yīng)用所帶來的各種社會(huì)問題也逐漸凸顯。大模型產(chǎn)業(yè)似乎進(jìn)入了一個(gè)中場(chǎng)階段,盤點(diǎn)與反思當(dāng)前發(fā)展態(tài)勢(shì)、梳理與總結(jié)發(fā)展中的問題、展望與謀劃未來對(duì)策成為推動(dòng)大模型產(chǎn)業(yè)進(jìn)一步發(fā)展的重要議題。

大模型發(fā)展的新態(tài)勢(shì)

大模型日益成為人工智能產(chǎn)業(yè)發(fā)展的基礎(chǔ)設(shè)施。從大模型的基本內(nèi)涵來看,其勢(shì)必演變?yōu)槿斯ぶ悄墚a(chǎn)業(yè)發(fā)展的基礎(chǔ)設(shè)施。從字面上的意義來看,大模型即大規(guī)模參數(shù)化的深度神經(jīng)網(wǎng)絡(luò),海量參數(shù)是其根本特征。大模型需要大規(guī)模算力和海量數(shù)據(jù)進(jìn)行訓(xùn)練,也因此成為人工智能的重型裝備,這也宣告AI(Artificial Intelligence,人工智能)進(jìn)入了重工業(yè)發(fā)展階段,而重型裝備往往是產(chǎn)業(yè)發(fā)展基礎(chǔ)設(shè)施的代名詞。大模型在學(xué)術(shù)界有時(shí)又被翻譯為基礎(chǔ)模型(Foundation Model),是指經(jīng)過預(yù)訓(xùn)練而得并能夠在多種下游任務(wù)中發(fā)揮基礎(chǔ)作用的模型。[1]例如,代碼基礎(chǔ)模型經(jīng)過少量下游任務(wù)提示就可以用于代碼生成、改寫、檢測(cè)、推薦、搜索等任務(wù)。由此可見,大模型發(fā)展趨勢(shì)之一就是成為人工智能產(chǎn)業(yè)發(fā)展的重要基礎(chǔ)設(shè)施。

從功用來看,大模型往往被用作海量知識(shí)的容器、模擬人類心智能力的認(rèn)知引擎、驅(qū)動(dòng)智能體與環(huán)境交互的大腦、協(xié)同不同組件與工具的操作系統(tǒng)、人機(jī)自然交互的接口。傳統(tǒng)AI解決問題需要面向特定任務(wù)進(jìn)行針對(duì)性的模型研發(fā),而當(dāng)前這一范式讓位于基于統(tǒng)一大模型進(jìn)行任務(wù)微調(diào)或者指令指引的新范式。大模型的功用與應(yīng)用范式?jīng)Q定了其在智能系統(tǒng)架構(gòu)中日益下沉為整個(gè)架構(gòu)的基礎(chǔ),不僅支撐著豐富多樣的上層應(yīng)用,也支撐著復(fù)雜意圖的理解與用戶需求的滿足。[2]近期打響的價(jià)格戰(zhàn)也從側(cè)面展現(xiàn)了大模型的基礎(chǔ)設(shè)施地位,唯有基礎(chǔ)設(shè)施才需要以持續(xù)走低的價(jià)格鎖定海量的忠實(shí)用戶,而只有持續(xù)增長的用戶和規(guī)?;瘧?yīng)用才能有效分?jǐn)偞竽P途薮蟮那捌谘兄瞥杀尽?/p>

大模型成為新質(zhì)生產(chǎn)力的代表。大模型是AGI最重要的技術(shù)形態(tài)之一,是一種先進(jìn)生產(chǎn)力,也可以說是新質(zhì)生產(chǎn)力的代表。勞動(dòng)力是生產(chǎn)力諸要素中起決定性作用的要素,只有勞動(dòng)力才能支配與使用其他生產(chǎn)要素(土地、資本、數(shù)據(jù)等)。大模型驅(qū)動(dòng)的數(shù)字與機(jī)器員工將成為新型勞動(dòng)力,這是大模型作為先進(jìn)生產(chǎn)力的本質(zhì),人類迎來了可以與人類勞動(dòng)力媲美的新型勞動(dòng)力。AGI旨在達(dá)到或接近人類智力,一旦相關(guān)技術(shù)成熟,AGI驅(qū)動(dòng)的智能機(jī)器,包括有形的機(jī)器勞動(dòng)力和虛擬的數(shù)字勞動(dòng)力等,將成為人類勞動(dòng)力的重要補(bǔ)充。而機(jī)器和數(shù)字勞動(dòng)力在可靠性、可用性以及對(duì)復(fù)雜與惡劣環(huán)境的適應(yīng)性等很多方面具有相較于人類勞動(dòng)力的巨大優(yōu)勢(shì)。

從某種程度上說,以生成式大模型為代表的AGI將可能成為超越人類的先進(jìn)勞動(dòng)力。語言大模型一定程度上再現(xiàn)了人類的言說能力、寫作能力以及基于語言的邏輯表達(dá)與情感表達(dá)能力。多模態(tài)大模型能夠進(jìn)一步完成多模態(tài)內(nèi)容的生成任務(wù),甚至實(shí)現(xiàn)了復(fù)雜世界的建模。具身大模型則側(cè)重于使智能機(jī)器具備規(guī)劃能力與理解復(fù)雜環(huán)境及進(jìn)行自適應(yīng)交互的能力,機(jī)器操控各類工具完成復(fù)雜任務(wù)成為現(xiàn)實(shí)。[3]各種科學(xué)大模型、專業(yè)大模型則專注于具體科學(xué)任務(wù),使得專業(yè)性工作提質(zhì)增效,比如蛋白質(zhì)結(jié)構(gòu)大模型使得蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)效率得到極大提升。最近OpenAI推出的GPT-4o更是將機(jī)器的自然交互水平推向了新高度,機(jī)器已經(jīng)能在多人對(duì)話場(chǎng)景中實(shí)時(shí)理解人類的語音、姿態(tài)、情緒、意圖,具備了一定的認(rèn)知人類社會(huì)的能力。單單就GPT-4o所展現(xiàn)出的能力可以預(yù)見,未來涉及人類情感交流的諸多行業(yè),比如教培、護(hù)理、心理咨詢等都將被AI賦能。[4]從腦力代替到體力代替、從文案生成到問題求解、從事實(shí)檢索到邏輯推理,可以說大模型正在全面進(jìn)入人類智力的領(lǐng)地,除了自我意識(shí)等少部分人類自身也未能準(zhǔn)確定義與理解的問題外,但凡能夠精準(zhǔn)描述、刻畫、定義的大多數(shù)人類能力在不遠(yuǎn)的將來都可能被大模型掌握。

值得注意的是,即便AI勞動(dòng)力再先進(jìn),我們也必須堅(jiān)持構(gòu)建人機(jī)協(xié)作的和諧人機(jī)關(guān)系。一方面,生成式AI短期內(nèi)仍將存在包括幻覺問題、過度能耗在內(nèi)的諸多局限,其生成過程與結(jié)果仍然需要人類的提示、控制與評(píng)判。另一方面,為推動(dòng)實(shí)現(xiàn)人機(jī)和諧共處,人類不應(yīng)放棄決策自主權(quán),即便未來機(jī)器能夠在某項(xiàng)任務(wù)中代替人類,人類仍然應(yīng)該掌握最終的確認(rèn)與決策權(quán),這也是人類應(yīng)該積極承擔(dān)和難以免除的責(zé)任。從短期來看,機(jī)器還難以被視作責(zé)任主體,“機(jī)器協(xié)作+人類決策”仍將是人機(jī)混合的勞動(dòng)力市場(chǎng)的基本形態(tài)。從中長期來看,我們需要重新梳理人類的責(zé)權(quán)體系,機(jī)器有可能成為非關(guān)鍵責(zé)任主體或部分責(zé)任主體,在此過程中,我們要警惕人類推卸責(zé)任的傾向。

數(shù)據(jù)將成為大模型發(fā)展的決定性要素。大模型工程的本質(zhì)是數(shù)據(jù)工程,數(shù)據(jù)決定了大模型的落地效果。大模型的預(yù)訓(xùn)練、指令微調(diào)、價(jià)值對(duì)齊、評(píng)估評(píng)測(cè)等都依賴高質(zhì)量數(shù)據(jù)。當(dāng)前的研究與實(shí)踐證明高質(zhì)量數(shù)據(jù)是決定大模型性能與效果的關(guān)鍵因素,甚至是決定性因素。而大模型訓(xùn)練過程中的數(shù)據(jù)合成、數(shù)據(jù)配比、數(shù)據(jù)治理也能決定大模型的訓(xùn)練效果。[5]總體而言,高質(zhì)量數(shù)據(jù)以及高水平的數(shù)據(jù)工程方法是大模型發(fā)展的關(guān)鍵。此外,數(shù)據(jù)規(guī)模與復(fù)雜性會(huì)隨著人類社會(huì)的發(fā)展而增長。換言之,伴隨著技術(shù)進(jìn)步與社會(huì)發(fā)展,數(shù)據(jù)的規(guī)模只會(huì)不斷創(chuàng)造新的記錄,數(shù)據(jù)的多樣性只會(huì)提升,而數(shù)據(jù)給技術(shù)帶來的挑戰(zhàn)也會(huì)進(jìn)一步增加。隨著人才、算力等瓶頸被進(jìn)一步突破,數(shù)據(jù)可能成為大模型發(fā)展的長期性、根本性、戰(zhàn)略性問題,甚至可能成為AGI發(fā)展的最大制約。

具體而言,一方面,構(gòu)建面向大模型的優(yōu)質(zhì)數(shù)據(jù)集仍需付出較大代價(jià)。訓(xùn)練語料、優(yōu)質(zhì)指令、評(píng)測(cè)數(shù)據(jù)總體上呈現(xiàn)一種分散狀態(tài),需要通過匯聚、清洗、去重、合成、篩選才能夠成為訓(xùn)練大模型的優(yōu)質(zhì)語料、指令與評(píng)測(cè)數(shù)據(jù)。[6]大模型總體上呈現(xiàn)出對(duì)于高質(zhì)量數(shù)據(jù)的“饑渴”狀態(tài),近期大模型產(chǎn)業(yè)發(fā)展的一些新動(dòng)向多多少少都與搶占數(shù)據(jù)有關(guān)。例如,有傳統(tǒng)媒體狀告Google等企業(yè)在未經(jīng)授權(quán)的情況下使用媒體數(shù)據(jù)進(jìn)行模型訓(xùn)練,以及OpenAI與Quora(國際版知乎)深度合作、OpenAI與蘋果智能深度合作,上述動(dòng)向本質(zhì)上都是大模型頭部企業(yè)尋求優(yōu)質(zhì)數(shù)據(jù)的努力,表現(xiàn)出大模型產(chǎn)業(yè)發(fā)展對(duì)媒體數(shù)據(jù)、高質(zhì)量社區(qū)問答數(shù)據(jù)甚至個(gè)人數(shù)據(jù)的渴求。[7]另一方面,數(shù)據(jù)供應(yīng)不暢、數(shù)據(jù)治理能力薄弱等,都是大模型向縱深發(fā)展的限制性因素。從長期來講,數(shù)據(jù)問題的緩解需要數(shù)據(jù)要素市場(chǎng)的充分發(fā)展,當(dāng)下數(shù)據(jù)交易的一個(gè)重要?jiǎng)恿褪菢?gòu)建高質(zhì)量的行業(yè)大模型訓(xùn)練語料。但數(shù)據(jù)要素市場(chǎng)目前仍處于發(fā)展與完善進(jìn)程中,其制度和基礎(chǔ)設(shè)施建設(shè)不僅需要時(shí)間,也需要大量實(shí)踐的反饋與優(yōu)化。此外,隨著大模型的進(jìn)一步發(fā)展,其與千行百業(yè)的深度融合成為趨勢(shì)。在這一進(jìn)程中,高質(zhì)量、高價(jià)值行業(yè)數(shù)據(jù)的價(jià)值更加凸顯,決定了大模型在各行業(yè)中的應(yīng)用效果。目前,行業(yè)數(shù)據(jù)對(duì)于大模型能力的價(jià)值還未得到充分釋放,這是大模型賦能高價(jià)值行業(yè)之前必須解決的重大問題??梢哉f,數(shù)據(jù)是大模型競(jìng)爭(zhēng)的決定性因素,而從根本上緩解數(shù)據(jù)對(duì)大模型發(fā)展的制約,需要持續(xù)性、系統(tǒng)性的努力。

大模型產(chǎn)業(yè)發(fā)展焦點(diǎn)從基礎(chǔ)模型走向應(yīng)用生態(tài)。當(dāng)大模型具備了人類智能的基本能力,如何用好大模型就成為了重點(diǎn)。值得強(qiáng)調(diào)的是,用好大模型絕不比研發(fā)大模型容易。事實(shí)上,自ChatGPT誕生至今,大模型并未給人類切實(shí)創(chuàng)造多少價(jià)值,這一窘狀不應(yīng)歸咎于大模型自身的不足,而應(yīng)該歸因于人類自身能力的不足,特別是大模型應(yīng)用水平的不足。大模型好比武俠小說中的利器,唯有強(qiáng)者才能駕馭這一利器,進(jìn)而釋放其價(jià)值。大部分人對(duì)于大模型的應(yīng)用可能就僅限于閑聊、文字潤飾。大模型本質(zhì)上是智者的利器,換言之,只有洞悉大模型特性的知識(shí)精英或者行家里手才能將大模型的能力淋漓盡致地發(fā)揮出來。用好大模型本身就是個(gè)人、組織、國家未來的核心競(jìng)爭(zhēng)力之一。

如果將大模型視作一種電能,那么圍繞大模型打造的應(yīng)用就好比電器,形式多樣的電器是電能賦能千家萬戶的最終形態(tài)。我們不能否認(rèn)發(fā)電的價(jià)值,但更應(yīng)該肯定電器制造的價(jià)值。圍繞大模型打造相關(guān)應(yīng)用,解決千行百業(yè)的痛點(diǎn)問題,將成為大模型產(chǎn)業(yè)未來發(fā)展的焦點(diǎn)。這決定了大模型下一階段發(fā)展的重點(diǎn)勢(shì)必是從通用走向?qū)S?,從開放走向私域,從基礎(chǔ)模型走向應(yīng)用生態(tài)。大模型能否解決金融決策輔助、醫(yī)療決策輔助、生產(chǎn)流程優(yōu)化、質(zhì)量提升、風(fēng)險(xiǎn)管控等問題,決定了其價(jià)值密度。一旦大模型能在千行百業(yè)發(fā)揮作用,將釋放更大的產(chǎn)業(yè)能級(jí)。

大模型的應(yīng)用生態(tài)百花齊放,其中以下四類應(yīng)用尤為值得注意。一是硬件終端的智能升級(jí)。大模型賦能各種終端是正在發(fā)生的一個(gè)重大產(chǎn)業(yè)趨勢(shì),PC、音箱、家電、手機(jī)、手表、智能車等都將被大模型賦能,而大模型將借助這些硬件載體為人類帶來更強(qiáng)大的意圖理解、更自然的人機(jī)交互、更細(xì)致的任務(wù)規(guī)劃以及更精準(zhǔn)的信息服務(wù)。二是個(gè)人消費(fèi)服務(wù)的智能升級(jí)。購物、出行、游戲、文化、教育、健康等涉及個(gè)人服務(wù)的場(chǎng)景將被大模型顯著賦能,比如大模型驅(qū)動(dòng)游戲中的NPC(Non-Player Character),能夠顯著提升NPC的智能水平,提升游戲玩家體驗(yàn);英語外教等教培行業(yè)也正在被大模型重塑。三是企業(yè)信息服務(wù)的智能升級(jí)。大模型對(duì)于推動(dòng)企業(yè)數(shù)字化轉(zhuǎn)型具有革命性意義。在大模型驅(qū)動(dòng)下,企業(yè)經(jīng)營管理和決策過程將發(fā)生根本性、革命性的升級(jí),大模型將在傳統(tǒng)企業(yè)運(yùn)營流程中扮演重要角色,代替人類專家、小模型以及專家系統(tǒng),完成流程中的諸多環(huán)節(jié)。此外,大模型對(duì)于開放世界的理解能力有助于提高企業(yè)數(shù)字化解決方案對(duì)于市場(chǎng)變化的響應(yīng)效率,增強(qiáng)系統(tǒng)的敏捷應(yīng)對(duì)能力。四是行業(yè)智能化應(yīng)用。行業(yè)應(yīng)用的本質(zhì)是認(rèn)知決策,大模型豐富的知識(shí)儲(chǔ)備和強(qiáng)大的認(rèn)知能力使其能在各行各業(yè)的商務(wù)決策過程中扮演重要輔助角色,如金融市場(chǎng)決策、醫(yī)療診斷決策等。同時(shí),大模型將成為人類專家的決策助手,拓展專家的認(rèn)知范圍,提供更多的決策變量、方案選擇和決策路徑指引,提示潛在風(fēng)險(xiǎn),對(duì)人類方案提出優(yōu)化建議等等。

大模型發(fā)展的新舉措

針對(duì)大模型產(chǎn)業(yè)發(fā)展呈現(xiàn)出的新態(tài)勢(shì)、新動(dòng)向,我們要樹立大模型發(fā)展的全局觀和整體觀,提前研判、積極應(yīng)對(duì)。大模型產(chǎn)業(yè)發(fā)展涉及要素眾多,不能僅從大模型自身發(fā)展的核心要素進(jìn)行思考。一方面,要統(tǒng)籌考慮大模型與數(shù)據(jù)要素市場(chǎng)發(fā)展;另一方面,要將大模型置于推動(dòng)我國各行業(yè)轉(zhuǎn)型升級(jí)、高質(zhì)量發(fā)展,全面深化改革以及解決或緩解當(dāng)前我國經(jīng)濟(jì)社會(huì)發(fā)展中諸多問題的重要科技引擎的新角色中進(jìn)行思考;此外,更要從大模型作為一種先進(jìn)生產(chǎn)力對(duì)生產(chǎn)關(guān)系、人類發(fā)展、社會(huì)發(fā)展的影響等宏觀角度進(jìn)行思考。

加快人工智能教育體系的建設(shè)。如果有人問,人類為迎接即將到來的AI技術(shù)革命所需要開展的第一項(xiàng)工作是什么?筆者認(rèn)為答案應(yīng)是教育變革。AI作為一種先進(jìn)生產(chǎn)力,它的發(fā)展勢(shì)必要求生產(chǎn)關(guān)系與之相適應(yīng)。生產(chǎn)關(guān)系的調(diào)整過程涉及整個(gè)社會(huì)諸要素的調(diào)整,涉及因素眾多,其中最基礎(chǔ)、最首要的一環(huán)就是教育。為在大模型國際競(jìng)爭(zhēng)賽道上搶占先機(jī),我們必須培養(yǎng)大量人工智能專業(yè)技術(shù)人才,具體而言,不僅需要培養(yǎng)跨行業(yè)融合的AI人才,以將AI技術(shù)應(yīng)用于千行百業(yè);還需要培養(yǎng)跨學(xué)科的AI人才,以重塑人文社科的學(xué)科內(nèi)涵,加速自然科學(xué)的知識(shí)發(fā)現(xiàn)進(jìn)程。此外,我們還需要提升全體國民的AI素養(yǎng),使AI技術(shù)像電腦與互聯(lián)網(wǎng)一樣得到廣泛應(yīng)用,唯有如此,AI才有可能成為全社會(huì)發(fā)展的引擎。

在AGI時(shí)代即將全面到來之際,教育本身的內(nèi)涵需要重塑。教師教什么?學(xué)生學(xué)什么?教育管什么?這些問題都需要重新回答?,F(xiàn)代文明所追求的知識(shí)發(fā)現(xiàn)與獲取能力或?qū)⒅鸩酵嗜ス猸h(huán),生存與發(fā)展的智慧將更具價(jià)值。除了作為現(xiàn)代文明人所必要的核心素養(yǎng)與能力之外,審美、判斷、鑒賞、提問、批判能力將更加重要。事實(shí)的記憶、繁瑣的運(yùn)算、常規(guī)內(nèi)容的生成,基本上都可以交給人工智能。在未來AGI大發(fā)展時(shí)代,如何駕馭與使用AI將成為人類最有價(jià)值的技能之一。然而,隨著AGI的日益復(fù)雜及其能力的增長,認(rèn)知并駕馭AI也將愈加困難,AI教育的使命日益艱巨。

推動(dòng)AI教育的首要任務(wù)在于確立AI技術(shù)在教育中安全應(yīng)用的基本原則。當(dāng)前,很多組織和高校都在積極推動(dòng)AI教育,各國政府也紛紛發(fā)出了AI與教育深度融合的呼聲,這對(duì)推動(dòng)AI技術(shù)在教育教學(xué)中的普及與應(yīng)用有著積極的意義。然而,我們要尤為注意的是,AI在教育中的應(yīng)用需“有所為、有所不為”,而不能越界,否則將可能違背教育的初衷。對(duì)于AI在教育中的應(yīng)用,需仔細(xì)甄別其對(duì)于學(xué)習(xí)者自身能力的習(xí)得是有利還是有弊,而不能不加選擇地盲目濫用。試想一下,如果一個(gè)仍在學(xué)習(xí)寫作的小學(xué)生使用AIGC(Aritificial Intelligence Generated Content,生成式人工智能)進(jìn)行作文輔助,如果學(xué)生在做每一道數(shù)學(xué)題之前都先去問問AI,那么學(xué)生們的寫作與計(jì)算能力如何才能形成呢?與此相反,教師、家長利用AGI進(jìn)行備課、輔導(dǎo)卻是十分有益的。由此可見,AI技術(shù)在教育中的應(yīng)用需具體問題具體分析,其中針對(duì)學(xué)習(xí)者的AI應(yīng)用應(yīng)該極為謹(jǐn)慎,否則可能事與愿違。

學(xué)習(xí)者是否應(yīng)該使用AI,如何使用AI?解決此類問題需要十分細(xì)致而繁瑣的甄別工作。其基本原則在于,在學(xué)習(xí)者的某項(xiàng)核心能力形成之前,應(yīng)該謹(jǐn)慎借助AI的此項(xiàng)能力。因此,對(duì)學(xué)習(xí)者的能力進(jìn)行精準(zhǔn)刻畫,進(jìn)而進(jìn)行分級(jí)分類的AI應(yīng)用管控是促進(jìn)學(xué)習(xí)者更好利用AI的基本思路,除此之外的其他分類依據(jù)都存在一定的不合理之處。例如,有觀點(diǎn)認(rèn)為大學(xué)生可以肆無忌憚地使用AI,這樣的分類原則顯然過于武斷了,比如對(duì)于一個(gè)第一次學(xué)習(xí)日語的日語系新生而言,他/她完全是日語語言習(xí)得的門外漢,而對(duì)AI的濫用可能導(dǎo)致其永遠(yuǎn)也無法習(xí)得日語言說的能力。

建立以智能科學(xué)為核心的跨學(xué)科研究體系。學(xué)科劃分使得人類對(duì)于客觀世界和人類社會(huì)的有限經(jīng)驗(yàn)與理性思考逐漸走向?qū)iT化、專業(yè)化,也在一定程度上造成了人類對(duì)世界統(tǒng)一性、整體性認(rèn)知被分解。部分細(xì)分學(xué)科內(nèi)部同質(zhì)化研究泛濫,原始創(chuàng)新動(dòng)力不足,未來最為重要的任務(wù)在于重建關(guān)于世界本原的整體性認(rèn)知。

AGI擁有不同學(xué)科知識(shí),為人類的跨學(xué)科認(rèn)知進(jìn)而整體性把握世界帶來了重大機(jī)遇。大模型通過通用語料訓(xùn)練習(xí)得了不同學(xué)科的知識(shí),同時(shí)具備了一定的組合創(chuàng)新能力,因而擅長將不同學(xué)科的知識(shí)進(jìn)行組合以解決問題。大模型的跨學(xué)科知識(shí)將是協(xié)助人類開展跨學(xué)科融合研究的利器。對(duì)于人文社科而言,AI帶來的絕不僅僅是工具的革新,而是重塑傳統(tǒng)人文社科的一次重大機(jī)遇。人工智能通過實(shí)現(xiàn)一個(gè)無限接近于人的智能體,在不斷追問人的本質(zhì)、智能的本質(zhì)、自我的本質(zhì),而實(shí)現(xiàn)本身就是一種理解。AI的快速進(jìn)步需要我們重塑理解“人與社會(huì)”的既有概念與理論框架。從本質(zhì)上來講,認(rèn)知人文社會(huì)現(xiàn)象的隱喻對(duì)象發(fā)生了根本變化,從傳統(tǒng)的動(dòng)物轉(zhuǎn)變成了智能機(jī)器。智能機(jī)器通過不同于人類的機(jī)制甚至實(shí)現(xiàn)了很多超越人的根本特性,這就可能從根基上撼動(dòng)現(xiàn)有人文社科的理論框架。同時(shí),AGI也呈現(xiàn)出強(qiáng)大的世界建模能力,以Sora為代表的大模型建模能力達(dá)到了新的高度。從一定意義上說,對(duì)于某個(gè)特定現(xiàn)象的重建能力就可以被視作一種理解能力,AI一旦具備世界建模能力,其對(duì)世界認(rèn)知的廣度與深度就可能超越人類,AI對(duì)世界本原的認(rèn)知也就有可能超越人類的現(xiàn)有認(rèn)知。未來科學(xué)研究的重大任務(wù)之一就是借助AGI對(duì)復(fù)雜世界的編碼與建模能力,重建對(duì)于世界本原的認(rèn)知。

跨學(xué)科研究另一個(gè)方向的重要使命在于“為機(jī)器立心、為智能立命”。加深對(duì)于AGI本身的認(rèn)知,建立理解AGI的概念框架,是推動(dòng)AGI進(jìn)一步發(fā)展以及幫助人類更好地駕馭與管控AGI的根本所在。人工智能以人類智能為拓版,而今卻日益呈現(xiàn)出其專有特性。幾千年來,人類已經(jīng)建立起的對(duì)于人以及由人所構(gòu)成社會(huì)的認(rèn)知體系與理論框架,這是我們理解AI的心智以及智能體社會(huì)的有益參考。至少可以說,以人類為模板去理解AI是理解AI的第一步。隨著AGI日益融入人類生活,如何理解與控制AI個(gè)體以及群體的心智、角色、行為,是實(shí)現(xiàn)AI安全可控的關(guān)鍵,是促使AI造福人類而不致危害人類的關(guān)鍵。為AI“立心立命”,讓AI守規(guī)守矩,是智能時(shí)代到來之前我們需要做好充分應(yīng)對(duì)準(zhǔn)備的難題之一。

加速數(shù)據(jù)要素市場(chǎng)發(fā)展,推動(dòng)大模型與數(shù)據(jù)要素的協(xié)同發(fā)展。大模型產(chǎn)業(yè)進(jìn)一步發(fā)展對(duì)高質(zhì)量數(shù)據(jù)的需求更為迫切,大模型與數(shù)據(jù)要素的發(fā)展日益融合,二者協(xié)同發(fā)展勢(shì)在必行。第一,大模型有望成為激活數(shù)據(jù)要素價(jià)值的智能引擎。以生成式大語言模型為代表,大模型已具備強(qiáng)大的世界建模能力、數(shù)據(jù)認(rèn)知與操控能力,這將促使其成為激活數(shù)據(jù)要素價(jià)值、實(shí)現(xiàn)數(shù)據(jù)要素累乘效應(yīng)的智能引擎。大模型與數(shù)據(jù)要素的融合發(fā)展,有望賦能千行百業(yè)成為數(shù)據(jù)價(jià)值變現(xiàn)的重要方式。第二,大模型將為緩解數(shù)據(jù)治理技術(shù)瓶頸帶來新的機(jī)遇。數(shù)據(jù)治理代價(jià)大、成本高,已經(jīng)成為數(shù)據(jù)要素價(jià)值變現(xiàn)的堵點(diǎn)與痛點(diǎn)。大模型有著強(qiáng)大的開放數(shù)據(jù)的理解和操控能力,因而有望利用大模型等人工智能技術(shù)手段構(gòu)建智能化數(shù)據(jù)治理體系,進(jìn)而實(shí)現(xiàn)自動(dòng)化、智能化數(shù)據(jù)治理,減少治理過程對(duì)人力的依賴。第三,基于大模型智能體技術(shù)有望打造貫穿數(shù)據(jù)價(jià)值變現(xiàn)流程的數(shù)據(jù)挖掘、分析、操控智能體,全面提升數(shù)據(jù)要素價(jià)值變現(xiàn)的效率。大模型對(duì)于數(shù)據(jù)、數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)處理過程的理解與操控能力,使其可能成為釋放數(shù)據(jù)要素價(jià)值的數(shù)據(jù)智能體。第四,圍繞大模型行業(yè)語料所形成的高價(jià)值數(shù)據(jù)產(chǎn)品可以檢驗(yàn)數(shù)據(jù)要素市場(chǎng)機(jī)制。目前,數(shù)據(jù)要素市場(chǎng)中仍然缺乏商業(yè)價(jià)值明確、交易機(jī)制清晰、安全可靠合規(guī)的數(shù)據(jù)產(chǎn)品。相較于其他涉及國計(jì)民生的數(shù)據(jù)產(chǎn)品,大模型訓(xùn)練語料接近教學(xué)科普類書籍的內(nèi)容,與個(gè)人隱私、行業(yè)安全關(guān)聯(lián)不大,其交易相對(duì)安全、可靠、合規(guī),因而容易形成高價(jià)值的數(shù)據(jù)產(chǎn)品,進(jìn)而檢驗(yàn)我國數(shù)據(jù)要素市場(chǎng)制度建設(shè)和基礎(chǔ)設(shè)施建設(shè)的合理性。

數(shù)據(jù)要素市場(chǎng)的進(jìn)一步健全、數(shù)據(jù)要素技術(shù)的進(jìn)一步完善,也將為大模型的發(fā)展注入強(qiáng)勁動(dòng)力。首先,數(shù)據(jù)要素市場(chǎng)為大模型的數(shù)據(jù)集提供了合法合規(guī)的獲取渠道與機(jī)制。通過數(shù)據(jù)產(chǎn)品的合規(guī)交易,各行業(yè)大模型訓(xùn)練所需要的高質(zhì)量訓(xùn)練語料有望得以匯集,從而緩解大模型在行業(yè)落地過程中對(duì)于高質(zhì)量數(shù)據(jù)的“饑渴”狀態(tài)。其次,強(qiáng)大的數(shù)據(jù)合成與治理能力可以用于進(jìn)一步提升大模型訓(xùn)練語料、指令數(shù)據(jù)的質(zhì)量與規(guī)模。面向大模型訓(xùn)練的語料集建設(shè)、指令集構(gòu)建、價(jià)值對(duì)齊數(shù)據(jù)構(gòu)建等都對(duì)數(shù)據(jù)治理、數(shù)據(jù)處理、數(shù)據(jù)合成等技術(shù)提出了較高要求,而大模型驅(qū)動(dòng)的智能化的數(shù)據(jù)能力體系能夠滿足相應(yīng)要求。

堅(jiān)持多元化的大模型發(fā)展路徑。以大模型為代表的AGI形態(tài)與發(fā)展路徑是多種多樣的,為此應(yīng)堅(jiān)持多元化的發(fā)展戰(zhàn)略。從參數(shù)規(guī)模角度來看,大模型會(huì)向越來越大和越來越小兩個(gè)方向同時(shí)發(fā)展。當(dāng)前,大模型發(fā)展的一個(gè)重要趨勢(shì)是參數(shù)量越來越大,主流參數(shù)在十億、百億到千億級(jí),不同參數(shù)規(guī)模有著不同的智能潛能,適合不同的應(yīng)用場(chǎng)景。大模型的能力隨著參數(shù)規(guī)模、訓(xùn)練數(shù)據(jù)和訓(xùn)練時(shí)間的增加而持續(xù)增長。增大模型參數(shù)量仍是探索機(jī)器智能極限的重要方式之一,而更大參數(shù)的模型也是進(jìn)一步發(fā)揮大模型的標(biāo)度律(scaling law)效應(yīng)的方式之一。[8]值得深思的問題是,大模型發(fā)展到終極狀態(tài),標(biāo)度律是否仍然成立。換言之,大模型的能力提升是否存在天花板,也就是說再多的數(shù)據(jù)、再多的訓(xùn)練、再多的參數(shù)也不再能提升大模型的能力。提出這個(gè)問題的理由是充分的,一方面,大模型訓(xùn)練正在迅速耗盡人類的優(yōu)質(zhì)數(shù)據(jù);另一方面,能源消耗存在天花板,人類社會(huì)的能源開發(fā)和利用仍然存在制約,因而人類不可能無限、單向度地向大模型供給能源。此外,歷史上任何技術(shù)發(fā)展曲線最終都會(huì)遭遇天花板。由此,對(duì)大模型的標(biāo)度律進(jìn)行質(zhì)疑是合理且充分的。

但是,以大模型為代表的AGI也呈現(xiàn)出自我提升與自我完善的可能性。這與人類相似,人類一直在追求并實(shí)現(xiàn)對(duì)于前代的超越,上升似乎是人類水平的智能族群的基本特征之一。那么,當(dāng)AGI達(dá)到或超越人類智能水平之后,同樣有著充分的理由推斷AGI可能實(shí)現(xiàn)持續(xù)上升從而保持標(biāo)度律持續(xù)有效。因此,對(duì)于AGI天花板是否存在這一問題,保持一種謹(jǐn)慎而開放的態(tài)度是合適且必要的。然而,當(dāng)前一些現(xiàn)實(shí)因素可能會(huì)制約大模型能力的進(jìn)一步增長。首先,優(yōu)質(zhì)數(shù)據(jù)生產(chǎn)速度可能遠(yuǎn)遠(yuǎn)跟不上大模型學(xué)習(xí)數(shù)據(jù)的速度;其次,人類新能源開發(fā)與利用的效率難以滿足大模型能源消耗的需求。[9]因此,筆者傾向于認(rèn)為大模型的能力最終會(huì)進(jìn)入一個(gè)或至少會(huì)保持一段時(shí)間的徘徊期。在這個(gè)徘徊期內(nèi),大模型會(huì)隨著所學(xué)習(xí)數(shù)據(jù)的增多,持續(xù)拓展其認(rèn)知的事實(shí)與知識(shí)邊界,但是決定其智商與情商的核心能力,如思維能力、邏輯能力、推理能力以及與人類共情的能力的發(fā)展可能會(huì)遭遇天花板??档略?jīng)將人類的智能分為知性與理性,所謂知性是指感性而雜多的事實(shí)性知識(shí),而理性則是一種將這些雜多的知識(shí)進(jìn)行有序組織的能力。套用康德的分類,筆者傾向于認(rèn)為大模型所代表的AI在知性方面將仍然遵守標(biāo)度律,但在理性方面則將遭遇天花板。

如果說更大規(guī)模參數(shù)的大模型是在幫我們探索智能的極限,那么更加小型而實(shí)用化的模型則是夯實(shí)AGI現(xiàn)實(shí)應(yīng)用的基礎(chǔ)。大模型的小型化是推動(dòng)大模型在更加泛在的低端硬件和邊緣環(huán)境應(yīng)用落地的必然舉措。大模型的小型化從表面上看是大模型的瘦身,涉及大模型的蒸餾機(jī)制,[10]但是從本質(zhì)來看,其涉及的是大模型可解釋機(jī)理等根本問題。[11]如果將大模型類比于人類大腦的神經(jīng)網(wǎng)絡(luò),那么與人腦類似,至今對(duì)人類諸多能力的實(shí)現(xiàn)與表達(dá)是分布式還是集中式(抑或是宏觀上集中,微觀上分布),仍存在爭(zhēng)議。對(duì)于“祖母”細(xì)胞是否在大腦中存在這一問題,理解之關(guān)鍵在于確證大腦神經(jīng)元是否存在特定區(qū)域完成特定功能的傾向,事實(shí)上,一些解剖學(xué)研究成果證明大腦存在一定的功能區(qū)域,比如人腦的海馬體為人類提供認(rèn)知地圖的能力。目前,大模型是否也存在著類似的功能分區(qū)(或者說相對(duì)集中)仍然不得而知,一定程度上,剖析大模型并不比剖析人腦的神經(jīng)網(wǎng)絡(luò)更為簡單。唯有從源頭上厘清大模型的參數(shù)分布與模型能力之間的因果關(guān)系,才能從根本上響應(yīng)大模型的小型化等應(yīng)用訴求。

AI智能體重塑社會(huì)關(guān)系與行業(yè)發(fā)展形態(tài),塑造社會(huì)科學(xué)新內(nèi)涵。大模型的應(yīng)用普及將重塑各行各業(yè)的發(fā)展形態(tài),人類社會(huì)甚至存在被AI代理全面接盤的可能。以內(nèi)容生產(chǎn)與傳播行業(yè)為例,AIGC提高了內(nèi)容創(chuàng)作效率,內(nèi)容與信息呈泛濫之勢(shì),普通人已經(jīng)無法完全閱讀仍在快速增長的新聞,科學(xué)家也無法盡閱每天生產(chǎn)的海量文獻(xiàn)。作為生物智能的人類的有限認(rèn)知能力使其淹沒于內(nèi)容海洋,對(duì)世界準(zhǔn)確的整體性理解越發(fā)困難。而破題的關(guān)鍵仍然在于用好AI,讓AI成為每個(gè)個(gè)人的數(shù)字分身,完整復(fù)制每個(gè)個(gè)體的價(jià)值與情感偏好,使其成為我們的內(nèi)容生產(chǎn)與消費(fèi)的忠實(shí)代理。未來,AI生成的泛濫必然催生內(nèi)容生產(chǎn)和消費(fèi)的AI代理模式。內(nèi)容生成將由人類授意的AI代理智能體完成,內(nèi)容的閱讀與消費(fèi)同樣由人類的AI代理完成。這些AI代理將協(xié)助人類完成內(nèi)容的生產(chǎn)、分發(fā)、篩選、傳播與消費(fèi)。

一個(gè)數(shù)字分身或者智能代理泛濫的時(shí)代又會(huì)是個(gè)怎樣的時(shí)代呢?這是個(gè)更加值得深入思考的問題。你的數(shù)字分身或者AI代理在多大程度上能夠行使你的主體意志,每個(gè)個(gè)體又在多大程度上能夠讓渡主體意志給AI呢?未來社會(huì)可能將日益演變成人類及其AI代理構(gòu)成的社會(huì),人與人的關(guān)系已經(jīng)無法完整地定義社會(huì)關(guān)系,人與自己的AI代理、AI代理與AI代理,成為了社會(huì)關(guān)系的必要構(gòu)成。社會(huì)科學(xué)的全部內(nèi)涵因此而被刷新,重建我們的社會(huì)科學(xué)成為新的歷史使命。AI智能體社會(huì)的到來,勢(shì)必要求重新建構(gòu)人類的倫理框架、道德體系、情感框架,構(gòu)建和諧的人機(jī)關(guān)系將成為社會(huì)關(guān)系發(fā)展的重要目標(biāo)之一,而不單單是人與人的關(guān)系。

AI代理參與的社會(huì)也將重塑人類的生活方式和行業(yè)業(yè)態(tài)。比如,出于功能性的消費(fèi)活動(dòng)完全可以由AI代理完成,人類消費(fèi)的真正價(jià)值可能僅在于情感體驗(yàn),如精挑細(xì)選的樂趣,而不再是買到商品這一樸素目的。從這個(gè)意義上來講,購物的功能性內(nèi)涵將消失。再比如內(nèi)容生產(chǎn)與傳播行業(yè),如果AI代理將代替人類成為內(nèi)容生產(chǎn)與傳播的主要受眾或?qū)ο螅敲磦鹘y(tǒng)的面向人的圖書編輯與出版、新聞內(nèi)容的生成與傳播將何去何從?一定程度上可以說,幾乎所有的行業(yè)都要正視一個(gè)新的事實(shí):服務(wù)對(duì)象從人變成人的AI代理,而這一變化勢(shì)必要求重塑傳統(tǒng)行業(yè)形態(tài)。

大模型發(fā)展過程中的風(fēng)險(xiǎn)管控

作為一種先進(jìn)技術(shù),大模型具有兩面性,運(yùn)用得當(dāng)將成為先進(jìn)生產(chǎn)力,但運(yùn)用不當(dāng)也可能成為巨大破壞力。安全可控必須是發(fā)展大模型的前提,為此,我們必須未雨綢繆,對(duì)未來大模型的大規(guī)模應(yīng)用所帶來的諸多負(fù)面問題做好提前研判與積極準(zhǔn)備,從全局考慮AI應(yīng)用問題,不能唯生產(chǎn)力論AI,而應(yīng)兼顧AI應(yīng)用所帶來的方方面面影響,并深入研判AI應(yīng)用的長期影響。

加大大模型風(fēng)險(xiǎn)管控力度,加強(qiáng)大模型合規(guī)應(yīng)用的制度建設(shè)。大模型會(huì)對(duì)人類社會(huì)的哪些方面產(chǎn)生影響?這種提問已不合時(shí)宜。其相反的問題更有價(jià)值,即人類社會(huì)的哪些方面不會(huì)受到大模型影響?答案可能是“并不多”,大模型對(duì)人類社會(huì)的影響是廣泛而深遠(yuǎn)的。人類社會(huì)方方面面的發(fā)展都需要運(yùn)用人類的智力,而但凡人類智識(shí)所及之處皆可為大模型用武之地。正是基于這個(gè)原因,大模型的負(fù)面影響,更加值得我們高度關(guān)注。

隨著大模型的普及應(yīng)用,其所帶來的負(fù)面問題日益顯現(xiàn),如虛假內(nèi)容泛濫、價(jià)值觀偏差、侵犯版權(quán)、隱私泄露、人群偏見、新型信息繭房等。其一是大模型驅(qū)動(dòng)的AIGC技術(shù)使得內(nèi)容生成與制作的門檻大大降低,虛假內(nèi)容呈現(xiàn)泛濫態(tài)勢(shì)。[12]傳媒生態(tài)所賴以存在的信息真實(shí)性前提受到前所未有的挑戰(zhàn)。其二是大模型存在暴露偏差等問題,即大模型訓(xùn)練語料可能存在各種偏差與傾向,比如種族偏見、性別偏見、文化偏見、意識(shí)形態(tài)偏見。[13]其三是大模型給版權(quán)保護(hù)帶來了前所未有的挑戰(zhàn)。一方面,大模型廠商可能在未經(jīng)授權(quán)的情況下使用版權(quán)所有者的數(shù)據(jù)進(jìn)行訓(xùn)練。另一方面,大模型的使用者可能使用大模型生成的內(nèi)容作為自主知識(shí)產(chǎn)權(quán)的內(nèi)容。由此可見,大模型給傳統(tǒng)知識(shí)產(chǎn)權(quán)概念框架與實(shí)踐操作均帶來了重大挑戰(zhàn)。[14]其四是大模型訓(xùn)練數(shù)據(jù)對(duì)用戶隱私的侵犯,進(jìn)而對(duì)傳統(tǒng)的隱私框架提出了新要求。例如一個(gè)教授在學(xué)校網(wǎng)站上公開了自己的聯(lián)系方式,但這并不意味著該教授希望自己的聯(lián)系方式被大模型習(xí)得而為所有人認(rèn)知。[15]其五是新型信息繭房的形成,隨著大模型日益成為各類互聯(lián)網(wǎng)信息系統(tǒng)的新基座,信息消費(fèi)者的認(rèn)知將難以掙脫由大模型所編織的新型信息繭房[16]。這些隨大模型普及應(yīng)用而正在逐漸顯現(xiàn)的問題都需要有關(guān)部門加強(qiáng)研究,加大大模型風(fēng)險(xiǎn)管控力度,加快大模型合規(guī)應(yīng)用的制度建設(shè)。

AI大規(guī)模濫用對(duì)人類自身發(fā)展帶來的長期負(fù)面影響。顯性的負(fù)面影響容易覺察,但更為致命的則是不易覺察的問題。因此,我們更需要高度警惕AI(特別是AGI技術(shù))大規(guī)模濫用帶來的隱性、長期的負(fù)面影響。所謂AI濫用是指過度地、不加限制地使用AI技術(shù),這種濫用往往出于眼前的或者短期巨大利益的考量而有意無意忽視AI發(fā)展的長期問題,最終對(duì)人類福祉或者特定群體利益造成長期的難以彌補(bǔ)的侵害。AI濫用往往有著溫和甚至是極具吸引力的外表,如果在推動(dòng)AI成為先進(jìn)生產(chǎn)力的過程中對(duì)AI的應(yīng)用不加以區(qū)分與選擇,對(duì)AI的負(fù)面問題視而不見,久而久之,AI濫用會(huì)像溫水煮青蛙一般以一種緩慢而難以察覺的進(jìn)程給人類帶來難以挽回的傷害。鑒于此,我們需高度警惕AI的濫用問題,認(rèn)識(shí)到AI應(yīng)用應(yīng)該“有所為、有所不為”,盡快為AI的安全應(yīng)用設(shè)立基本原則。

從本質(zhì)上看,大規(guī)模AI的長期濫用可能會(huì)帶來人之為人的本性倒退。技術(shù)的每一次進(jìn)步都可能帶來人類某種能力的倒退,例如輸入法技術(shù)的進(jìn)步帶來的是很多人的提筆忘字。但是,當(dāng)達(dá)到人類智力水平的AGI大量代替人類腦力勞動(dòng)時(shí),隨之而來的可能的腦力倒退卻是人類難以承受的。具體而言,在個(gè)體具備某項(xiàng)能力之前(比如寫作),不加克制地濫用AI的相應(yīng)能力,將會(huì)阻礙個(gè)體獲得此項(xiàng)能力。因而即使計(jì)算機(jī)早就能代替人類進(jìn)行計(jì)算,但是我們的兒童必須付諸艱苦的訓(xùn)練掌握基本的計(jì)算能力。我們必須警惕人類心智的核心能力因?yàn)锳I的濫用而倒退,人類心智水平的倒退,勢(shì)必帶來主體意志的逐步消退,而AI對(duì)于人類主體意志的侵犯,將導(dǎo)致難以承受的后果。

由此可見,無論AI技術(shù)發(fā)展到何種水平,AI應(yīng)用都應(yīng)該以保障人性和人類智能的核心素養(yǎng)與能力的充分發(fā)展為前提。AI應(yīng)用應(yīng)該為人類智力、能力的訓(xùn)練與實(shí)踐留下充足的機(jī)會(huì)和空間,面向青少年的基礎(chǔ)教育階段恰恰是人類核心能力的形成時(shí)期,因而對(duì)于此階段的AI應(yīng)用應(yīng)高度謹(jǐn)慎。同時(shí),人類社會(huì)的大部分工作崗位,都必須保留特定規(guī)模的人群從事相應(yīng)的手工工作,人類的所有技術(shù)應(yīng)該像非物質(zhì)文化遺產(chǎn)一樣,指定足夠規(guī)模的人類群體進(jìn)行傳承和發(fā)展,而AI應(yīng)用應(yīng)該適當(dāng)“留白”。

生產(chǎn)關(guān)系、社會(huì)價(jià)值觀念、文化藝術(shù)創(chuàng)作等與AI生產(chǎn)力的適應(yīng)性問題。作為先進(jìn)生產(chǎn)力,大模型對(duì)整個(gè)社會(huì)和各行各業(yè)進(jìn)行全面滲透并產(chǎn)生革命性影響幾乎是不可避免的。這就要求關(guān)系到價(jià)值觀念、倫理體系、文化教育、生產(chǎn)關(guān)系等社會(huì)發(fā)展的方方面面都要作出積極變革和適應(yīng)性調(diào)整,才能適應(yīng)這種先進(jìn)生產(chǎn)力的發(fā)展。

從短期來看,大模型等AGI技術(shù)將給就業(yè)市場(chǎng)帶來直接影響。AGI應(yīng)用的過程本質(zhì)上就是AI勞動(dòng)力逐步代替人類勞動(dòng)力的過程,在這個(gè)過程中,越來越多的任務(wù)、工作逐步交給了效率更高、效果更好的機(jī)器。而AI代替人類的過程必須是緩慢、漸進(jìn)、有序的過程,以避免劇烈的就業(yè)結(jié)構(gòu)調(diào)整所帶來的社會(huì)震蕩。從更長時(shí)期的范圍來看,大規(guī)模AI應(yīng)用也可能影響現(xiàn)有的社會(huì)階層結(jié)構(gòu)。未來,因?yàn)锳I智能水平參考線的存在,人類群體將可能被分為AI智識(shí)水平之上和之下兩大層次。對(duì)于人類個(gè)體而言,跨越AI的智識(shí)水平線將變得日趨困難。隨之可能帶來的階層固化甚至對(duì)立是需要正視的問題。此外,AI無節(jié)制地介入人類情感生活會(huì)讓人迷失于虛擬的情感世界、甚至產(chǎn)生畸形的情感依賴。人與人之間的真摯情感將可能被人機(jī)虛擬情感所干擾,進(jìn)而引發(fā)人類情感混亂。

大規(guī)模AI應(yīng)用對(duì)人類思想、文化、藝術(shù)等方面產(chǎn)生的更長期的影響同樣值得注意。當(dāng)前,生成式人工智能已經(jīng)涉足音樂、繪畫、影視等幾乎一切人類的藝術(shù)創(chuàng)作形式。人類的生命是有限的,而即使人類生命延長似乎也無法趕上藝術(shù)品生產(chǎn)的速度,那么,人類在有限的生命里何以享受這過于豐盛的藝術(shù)盛宴。歷史上,人類從未像今天一樣面臨窘境:我們淹沒在審美的海洋中,試問,我們會(huì)不會(huì)因此而窒息呢?如果人類個(gè)體的一生都處于審美的高亢興奮體驗(yàn)之中,這樣的人生又有怎樣的價(jià)值與意義呢?美之泛濫是否會(huì)消滅美的本身呢?生成式人工智能的泛濫將會(huì)打破美的稀缺性,而這可能進(jìn)一步消弭審美需求,進(jìn)而影響傳統(tǒng)藝術(shù)形式的發(fā)展。AI創(chuàng)作似乎正在快速窮盡藝術(shù)創(chuàng)作的組合空間,比如AI生成音樂可能很快窮舉我們所能感知的絕大部分曲調(diào),繼而危及音樂這種藝術(shù)形式的存在。

為使社會(huì)發(fā)展能夠以和諧的方式適應(yīng)人工智能這一先進(jìn)生產(chǎn)力,我國應(yīng)充分發(fā)揮在統(tǒng)籌社會(huì)方面的制度優(yōu)勢(shì),在生產(chǎn)關(guān)系調(diào)整、教育體系革新等方面作出富有前瞻性與建設(shè)性的系統(tǒng)謀劃,并積極、嚴(yán)密、細(xì)致地推進(jìn)相應(yīng)的布局調(diào)整,避免出現(xiàn)劇烈沖擊和較大的震蕩。目前我國正處于全面深化改革的關(guān)鍵時(shí)期,進(jìn)一步全面深化改革,要抓住主要矛盾和矛盾的主要方面,“進(jìn)一步解放和發(fā)展社會(huì)生產(chǎn)力、增強(qiáng)社會(huì)活力,推動(dòng)生產(chǎn)關(guān)系和生產(chǎn)力、上層建筑和經(jīng)濟(jì)基礎(chǔ)更好相適應(yīng)”[17]。推動(dòng)以大模型為代表的AGI技術(shù)與生產(chǎn)關(guān)系、上層建筑更好地適應(yīng),無疑是踐行這一方針的具體措施之一。

結(jié)語

當(dāng)前,大模型發(fā)展日益呈現(xiàn)出與數(shù)據(jù)要素融合發(fā)展、其逐漸沉淀為基礎(chǔ)設(shè)施、發(fā)展焦點(diǎn)從底座模型轉(zhuǎn)移至應(yīng)用生態(tài)等新的趨勢(shì)。以大模型為代表的AGI將成為先進(jìn)生產(chǎn)力的代表,我們?cè)趽肀н@一先進(jìn)生產(chǎn)力的興奮之余,也要密切關(guān)注其濫用、誤用與惡用所帶來的負(fù)面問題。要以更為深入的思考、更加長遠(yuǎn)的眼光、更加全面的梳理和更加精準(zhǔn)的研判,做好全面、積極、主動(dòng)的應(yīng)對(duì),確保AI成為人類之福,而不是人類之禍。

在AGI快速發(fā)展的時(shí)代,如何打發(fā)閑暇時(shí)光,如何安置靈魂成為人類需要直面的問題。從表面上看這似乎是個(gè)幸福的煩惱,然而,筆者更愿意稱其為“戴著和善面具的惡魔”。未來,人類應(yīng)對(duì)AGI的利用加以適當(dāng)引導(dǎo)與控制。即便有AI的助力,以卓越精神仰望星空也仍需要付諸常人所不能想象的艱辛和長期堅(jiān)持。

古代歐洲的貴族們往往都有貼心的管家?guī)椭淞侠砼c經(jīng)營生活,這成就了一批貴族精英代表人類專心致志、心無旁騖地探索未知世界,但更為常見的情形卻是養(yǎng)出了大批“好吃懶做、肥頭大耳”的精神侏儒。AGI日漸成為人類的貼心管家,AI代理人類社會(huì)似乎成為必然趨勢(shì),而在這一過程中人類更應(yīng)奮發(fā)向上,借助AI力量去勤奮地探索未知世界,不斷開辟新的認(rèn)知疆域。

注釋

[1]R. Bommasani, D. A. Hudson et al., “On the Opportunities and Risks of Foundation Models,“ arXiv preprint arXiv:2108.07258, 2021; A. Young, B. Chen, C. Li et al., “Yi: Open Foundation Models by 01.AI,“ arXiv preprint arXiv:2403.04652, 2024.

[2]X. Chen, L. Li, L. Chang et al., “Challenges and Contributing Factors in the Utilization of Large Language Models (LLMs),“ arXiv preprint arXiv:2310.13343, 2023.

[3]S. Pang, E. Nol, K. Heng, “ChatGPT-4o for English Language Teaching and Learning: Features, Applications, and Future Prospects,“ SSRN Electronic Journal, 2024; S. N. Wadekar, A. Chaurasia, A. Chadha et al., “The Evolution of Multimodal Model Architectures,“ arXiv preprint arXiv:2405.17927, 2024.

[4]S. Pang, E. Nol, K. Heng, “ChatGPT-4o for English Language Teaching and Learning: Features, Applications, and Future Prospects,“ SSRN Electronic Journal, 2024.

[5]D. Zhang, Y. Yu, C. Li et al., “MM-LLMs: Recent Advances in Multimodal Large Language Models,“ arXiv preprint arXiv:2401.13601, 2024.

[6]D. Zhang, Y. Yu, C. Li et al., “MM-LLMs: Recent Advances in Multimodal Large Language Models,“ arXiv preprint arXiv:2401.13601, 2024; Y. Liu, J. Cao, C. Liu et al., “Datasets for Large Language Models: A Comprehensive Survey,“ arXiv preprint arXiv:2402.18041, 2024.

[7]《7天內(nèi)2次收購!OpenAI豪擲重金接連吞并兩家初創(chuàng)》,2024年6月26日, https://www.thepaper.cn/newsDetail_forward_27859971;《違規(guī)使用新聞出版商數(shù)據(jù)訓(xùn)練大模型,谷歌在法被罰2.5億歐》,2024年3月26日, https://new.qq.com/rain/a/20240326A0A27N00。

[8]J. Kaplan, S. McCandlish, T. Henighan et al., “Scaling Laws for Neural Language Models,“ arXiv preprint arXiv:2001.08361, 2020.

[9]N. Muennighoff, A. Rush, B. Barak et al., “Scaling Data-Constrained Language Models,“ Advances in Neural Information Processing Systems, 2024, 36; Y. Liu, J. Cao, C. Liu et al., “Datasets for Large Language Models: A Comprehensive Survey,“ arXiv preprint arXiv:2402.18041, 2024.

[10]X. Xu, M. Li, C. Tao et al., “A Survey on Knowledge Distillation of Large Language Models,“ arXiv preprint arXiv:2402.13116, 2024.

[11]D. Chen, J. P. Mei, H. Zhang et al., “Knowledge Distillation with the Reused Teacher Classifier,“ 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), New Orleans, LA, USA, 2022.

[12]X. Li, Y. Zhang, E. C. Malthouse, “Large Language Model Agent for Fake News Detection,“ arXiv preprint arXiv:2405.01593, 2024;《又遭投訴!Meta因利用用戶數(shù)據(jù)訓(xùn)練人工智能模型遭挪威“開火”》,2024年6月14日,https://www.sohu.com/a/785794320_114984。

[13]T. Hosking, P. Blunsom, M. Bartolo, “Human Feedback Is Not Gold Standard,“ arXiv preprint arXiv:2309.16349, 2023; J. Yang, H. Jin, R. Tang et al., “Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond,“ ACM Transactions on Knowledge Discovery from Data, 2024, 18(6).

[14]《一文讀懂:AI大模型訓(xùn)練中的核心版權(quán)問題》,2023年10月19日, http://news.sohu.com/a/729633870_455313;《大模型版權(quán)爭(zhēng)議再起 紐約時(shí)報(bào)起訴OpenAI和微軟》,2023年12月28日,https://finance.sina.com.cn/jjxw/2023-12-28/doc-imzzpyuc6959399.shtml。

[15]D. Yu, P. Kairouz, S. Oh et al., “Privacy-Preserving Instructions for Aligning Large Language Models,“ arXiv preprint arXiv:2402.13659, 2024; V. Patil, P. Hase, M. Bansal, “Can Sensitive Information Be Deleted from LLMs? Objectives for Defending Against Extraction Attacks,“ 2023, https://openreview.net/pdf?id=7erlRDoaV8.

[16]《違規(guī)使用新聞出版商數(shù)據(jù)訓(xùn)練大模型,谷歌在法被罰2.5億歐》,2024年3月26日, https://new.qq.com/rain/a/20240326A0A27N00。

[17]《習(xí)近平主持召開企業(yè)和專家座談會(huì)強(qiáng)調(diào):緊扣推進(jìn)中國式現(xiàn)代化主題 進(jìn)一步全面深化改革》,2024年5月23日,https://www.gov.cn/yaowen/liebiao/202405/content_6953237.htm?menuid=197。

責(zé) 編∕包 鈺 美 編∕梁麗琛

New Situation of and Reflection on the Development of Large Model of Artificial Intelligence

Xiao Yanghua

Abstract: With the continuous progress of related technologies, the development of large models presents new trends such as deep integration with data elements, increasingly becoming infrastructure, and shifting the focus of large model development from base models to application ecology. In response to the new situation and new trend of the development of the large model industry, we must establish a holistic and comprehensive view of the development of large models, and actively adopt new countermeasures such as accelerating the construction of artificial intelligence education system, establishing an interdisciplinary research system with intelligent science as the core, promoting the coordinated development of large models and data elements, and adhering to the diversified development path of large models. As an advanced technology, large model has two sides. While actively taking measures to promote its benign development and release the potential of its application value, we should also pay close attention to the negative issues caused by its abuse, misuse and evil use, such as the proliferation of false content, and affecting the development and cultivation of human mind and ability. We should take proactive measures to manage and control risks.

Keywords: large model, artificial intelligence, risk control, large model application

[責(zé)任編輯:包鈺]