主講人:孫凝晖,中國工(gōng)程院院士,中國科學院計(jì)算(suàn)技術研究所研究員、學術委員會(huì)主任
2024年4月26日,十四屆全國人大(dà)常委會(huì)舉行第十講專題講座,趙樂際委員長主持。
中國工(gōng)程院院士、中國科學院計(jì)算(suàn)技術研究所研究員孫凝晖作(zuò)了(le)題爲《人工(gōng)智能(néng)與智能(néng)計(jì)算(suàn)的發展》的講座。
委員長、各位副委員長、秘書長、各位委員:
人工(gōng)智能(néng)領域近年來(lái)正在迎來(lái)一場由生成式人工(gōng)智能(néng)大(dà)模型引領的爆發式發展。2022年11月30日,OpenAI公司推出一款人工(gōng)智能(néng)對(duì)話(huà)聊天機器人ChatGPT,其出色的自(zì)然語言生成能(néng)力引起了(le)全世界範圍的廣泛關注,2個月突破1億用(yòng)戶,國内外(wài)随即掀起了(le)一場大(dà)模型浪潮,Gemini、文(wén)心一言、Copilot、LLaMA、SAM、SORA等各種大(dà)模型如雨後春筍般湧現(xiàn),2022年也(yě)被譽爲大(dà)模型元年。當前信息時(shí)代正加快(kuài)進入智能(néng)計(jì)算(suàn)的發展階段,人工(gōng)智能(néng)技術上(shàng)的突破層出不窮,逐漸深入地賦能(néng)千行百業,推動人工(gōng)智能(néng)與數據要素成爲新質生産力的典型代表。習近平總書記指出,把新一代人工(gōng)智能(néng)作(zuò)爲推動科技跨越發展、産業優化升級、生産力整體躍升的驅動力量,努力實現(xiàn)高(gāo)質量發展。黨的十八大(dà)以來(lái),以習近平同志爲核心的黨中央高(gāo)度重視(shì)智能(néng)經濟發展,促進人工(gōng)智能(néng)和(hé)實體經濟深度融合,爲高(gāo)質量發展注入強勁動力。
一、計(jì)算(suàn)技術發展簡介
計(jì)算(suàn)技術的發展曆史大(dà)緻可分爲四個階段,算(suàn)盤的出現(xiàn)标志着人類進入第一代——機械計(jì)算(suàn)時(shí)代,第二代——電子計(jì)算(suàn)的标志是出現(xiàn)電子器件與電子計(jì)算(suàn)機,互聯網的出現(xiàn)使我們進入第三代——網絡計(jì)算(suàn),當前人類社會(huì)正在進入第四階段——智能(néng)計(jì)算(suàn)。
早期的計(jì)算(suàn)裝置是手動輔助計(jì)算(suàn)裝置和(hé)半自(zì)動計(jì)算(suàn)裝置,人類計(jì)算(suàn)工(gōng)具的曆史是從(cóng)公元1200年的中國算(suàn)盤開(kāi)始,随後出現(xiàn)了(le)納皮爾籌(1612年)和(hé)滾輪式加法器(1642年),到(dào)1672年第一台自(zì)動完成四則運算(suàn)的計(jì)算(suàn)裝置——步進計(jì)算(suàn)器誕生了(le)。
機械計(jì)算(suàn)時(shí)期已經出現(xiàn)了(le)現(xiàn)代計(jì)算(suàn)機的一些(xiē)基本概念。查爾斯∙巴貝奇(Charles Babbage)提出了(le)差分機(1822年)與分析機(1834年)的設計(jì)構想,支持自(zì)動機械計(jì)算(suàn)。這(zhè)一時(shí)期,編程與程序的概念基本形成,編程的概念起源于雅卡爾提花(huā)機,通過打孔卡片控制印花(huā)圖案,最終演變爲通過計(jì)算(suàn)指令的形式來(lái)存儲所有數學計(jì)算(suàn)步驟;人類曆史的第一個程序員是詩人拜倫之女艾達(Ada),她(tā)爲巴貝奇差分機編寫了(le)一組求解伯努利數列的計(jì)算(suàn)指令,這(zhè)套指令也(yě)是人類曆史上(shàng)第一套計(jì)算(suàn)機算(suàn)法程序,它将硬件和(hé)軟件分離,第一次出現(xiàn)程序的概念。
直到(dào)在二十世紀上(shàng)半葉,出現(xiàn)了(le)布爾代數(數學)、圖靈機(計(jì)算(suàn)模型) 、馮諾依曼體系結構(架構) 、晶體管(器件)這(zhè)四個現(xiàn)代計(jì)算(suàn)技術的科學基礎。其中,布爾代數用(yòng)來(lái)描述程序和(hé)硬件如CPU的底層邏輯;圖靈機是一種通用(yòng)的計(jì)算(suàn)模型,将複雜(zá)任務轉化爲自(zì)動計(jì)算(suàn)、不需人工(gōng)幹預的自(zì)動化過程;馮諾依曼體系結構提出了(le)構造計(jì)算(suàn)機的三個基本原則:采用(yòng)二進制邏輯、程序存儲執行、以及計(jì)算(suàn)機由運算(suàn)器、控制器、存儲器、輸入設備、輸出設備這(zhè)五個基本單元組成;晶體管是構成基本的邏輯電路和(hé)存儲電路的半導體器件,是建造現(xiàn)代計(jì)算(suàn)機之塔的“磚塊”。基于以上(shàng)科學基礎,計(jì)算(suàn)技術得以高(gāo)速發展,形成規模龐大(dà)的産業。
從(cóng)1946年世界上(shàng)第一台電子計(jì)算(suàn)機ENIAC誕生到(dào)二十一世紀的今天,已經形成了(le)五類成功的平台型計(jì)算(suàn)系統。當前各領域各種類型的應用(yòng),都可以由這(zhè)五類平台型計(jì)算(suàn)裝置支撐。
第一類是高(gāo)性能(néng)計(jì)算(suàn)平台,解決了(le)國家核心部門(mén)的科學與工(gōng)程計(jì)算(suàn)問題;
第二類是企業計(jì)算(suàn)平台,又稱服務器,用(yòng)于企業級的數據管理(lǐ)、事(shì)務處理(lǐ),當前像百度、阿裏和(hé)騰訊這(zhè)些(xiē)互聯網公司的計(jì)算(suàn)平台都屬于這(zhè)一類;
第三類是個人電腦(nǎo)平台,以桌面應用(yòng)的形式出現(xiàn),人們通過桌面應用(yòng)與個人電腦(nǎo)交互;
第四類是智能(néng)手機,主要特點是移動便攜,手機通過網絡連接數據中心,以互聯網應用(yòng)爲主,它們分布式地部署在數據中心和(hé)手機終端;
第五類是嵌入式計(jì)算(suàn)機,嵌入到(dào)工(gōng)業裝備和(hé)軍事(shì)設備,通過實時(shí)的控制,保障在确定時(shí)間内完成特定任務。這(zhè)五類裝置幾乎覆蓋了(le)我們信息社會(huì)的方方面面,長期以來(lái)人們追求的以智能(néng)計(jì)算(suàn)應用(yòng)爲中心的第六類平台型計(jì)算(suàn)系統尚未形成。
IT2.0又稱網絡計(jì)算(suàn)時(shí)代(1980-2020),以“人”爲中心。互聯網将人使用(yòng)的終端與後台的數據中心連接,互聯網應用(yòng)通過智能(néng)終端與人進行交互。以亞馬遜等爲代表的互聯網公司提出了(le)雲計(jì)算(suàn)的思想,将後台的算(suàn)力封裝成一個公共服務租借給第三方用(yòng)戶,形成了(le)雲計(jì)算(suàn)與大(dà)數據産業。
IT3.0又稱智能(néng)計(jì)算(suàn)時(shí)代,始于2020年,與IT2.0相比增加了(le)“物”的概念,即物理(lǐ)世界的各種端側設備,被數字化、網絡化和(hé)智能(néng)化,實現(xiàn)“人-機-物”三元融合。智能(néng)計(jì)算(suàn)時(shí)代,除了(le)互聯網以外(wài),還有數據基礎設施,支撐各類終端通過端邊雲實現(xiàn)萬物互聯,終端、物端、邊緣、雲都嵌入AI,提供與ChatGPT類似的大(dà)模型智能(néng)服務,最終實現(xiàn)有計(jì)算(suàn)的地方就有AI智能(néng)。智能(néng)計(jì)算(suàn)帶來(lái)了(le)巨量的數據、人工(gōng)智能(néng)算(suàn)法的突破和(hé)對(duì)算(suàn)力的爆發性需求。
二、智能(néng)計(jì)算(suàn)發展簡介
智能(néng)計(jì)算(suàn)包括人工(gōng)智能(néng)技術與它的計(jì)算(suàn)載體,大(dà)緻曆經了(le)四個階段,分别爲通用(yòng)計(jì)算(suàn)裝置、邏輯推理(lǐ)專家系統、深度學習計(jì)算(suàn)系統、大(dà)模型計(jì)算(suàn)系統。
智能(néng)計(jì)算(suàn)的起點是通用(yòng)自(zì)動計(jì)算(suàn)裝置(1946年)。艾倫·圖靈(Alan Turing)和(hé)馮·諾依曼(John von Neumann)等科學家,一開(kāi)始都希望能(néng)夠模拟人腦(nǎo)處理(lǐ)知(zhī)識的過程,發明(míng)像人腦(nǎo)一樣思考的機器,雖未能(néng)實現(xiàn),但(dàn)卻解決了(le)計(jì)算(suàn)的自(zì)動化問題。通用(yòng)自(zì)動計(jì)算(suàn)裝置的出現(xiàn),也(yě)推動了(le)1956年人工(gōng)智能(néng)(AI)概念的誕生,此後所有人工(gōng)智能(néng)技術的發展都是建立在新一代計(jì)算(suàn)設備與更強的計(jì)算(suàn)能(néng)力之上(shàng)的。
智能(néng)計(jì)算(suàn)發展的第二階段是邏輯推理(lǐ)專家系統(1990年)。E.A.費根鮑姆(Edward Albert Feigenbaum)等符号智能(néng)學派的科學家以邏輯和(hé)推理(lǐ)能(néng)力自(zì)動化爲主要目标,提出了(le)能(néng)夠将知(zhī)識符号進行邏輯推理(lǐ)的專家系統。人的先驗知(zhī)識以知(zhī)識符号的形式進入計(jì)算(suàn)機,使計(jì)算(suàn)機能(néng)夠在特定領域輔助人類進行一定的邏輯判斷和(hé)決策,但(dàn)專家系統嚴重依賴于手工(gōng)生成的知(zhī)識庫或規則庫。這(zhè)類專家系統的典型代表是日本的五代機和(hé)我國863計(jì)劃支持的306智能(néng)計(jì)算(suàn)機主題,日本在邏輯專家系統中采取專用(yòng)計(jì)算(suàn)平台和(hé)Prolog這(zhè)樣的知(zhī)識推理(lǐ)語言完成應用(yòng)級推理(lǐ)任務;我國采取了(le)與日本不同的技術路線,以通用(yòng)計(jì)算(suàn)平台爲基礎,将智能(néng)任務變成人工(gōng)智能(néng)算(suàn)法,将硬件和(hé)系統軟件都接入通用(yòng)計(jì)算(suàn)平台,并催生了(le)曙光、漢王、科大(dà)訊飛(fēi)等一批骨幹企業。
符号計(jì)算(suàn)系統的局限性在于其爆炸的計(jì)算(suàn)時(shí)空(kōng)複雜(zá)度,即符号計(jì)算(suàn)系統隻能(néng)解決線性增長問題,對(duì)于高(gāo)維複雜(zá)空(kōng)間問題是無法求解的,從(cóng)而限制了(le)能(néng)夠處理(lǐ)問題的大(dà)小(xiǎo)。同時(shí)因爲符号計(jì)算(suàn)系統是基于知(zhī)識規則建立的,我們又無法對(duì)所有的常識用(yòng)窮舉法來(lái)進行枚舉,它的應用(yòng)範圍就受到(dào)了(le)很(hěn)大(dà)的限制。随着第二次AI寒冬的到(dào)來(lái),第一代智能(néng)計(jì)算(suàn)機逐漸退出曆史舞台。
直到(dào)2014年左右,智能(néng)計(jì)算(suàn)進階到(dào)第三階段——深度學習計(jì)算(suàn)系統。以傑弗裏·辛頓(Geoffrey Hinton)等爲代表的連接智能(néng)學派,以學習能(néng)力自(zì)動化爲目标,發明(míng)了(le)深度學習等新AI算(suàn)法。通過深度神經元網絡的自(zì)動學習,大(dà)幅提升了(le)模型統計(jì)歸納的能(néng)力,在模式識别①等應用(yòng)效果上(shàng)取得了(le)巨大(dà)突破,某些(xiē)場景的識别精度甚至超越了(le)人類。以人臉識别爲例,整個神經網絡的訓練過程相當于一個網絡參數調整的過程,将大(dà)量的經過标注的人臉圖片數據輸入神經網絡,然後進行網絡間參數調整,讓神經網絡輸出的結果的概率無限逼近真實結果。神經網絡輸出真實情況的概率越大(dà),參數就越大(dà),從(cóng)而将知(zhī)識和(hé)規則編碼到(dào)網絡參數中,這(zhè)樣隻要數據足夠多,就可以對(duì)各種大(dà)量的常識進行學習,通用(yòng)性得到(dào)極大(dà)的提升。連接智能(néng)的應用(yòng)更加廣泛,包括語音(yīn)識别、人臉識别、自(zì)動駕駛等。在計(jì)算(suàn)載體方面,中國科學院計(jì)算(suàn)技術研究所2013年提出了(le)國際首個深度學習處理(lǐ)器架構,國際知(zhī)名的硬件廠(chǎng)商英偉達(NVIDIA)持續發布了(le)多款性能(néng)領先的通用(yòng)GPU芯片,都是深度學習計(jì)算(suàn)系統的典型代表。
智能(néng)計(jì)算(suàn)發展的第四階段是大(dà)模型計(jì)算(suàn)系統(2020年)。在人工(gōng)智能(néng)大(dà)模型技術的推動下(xià),智能(néng)計(jì)算(suàn)邁向新的高(gāo)度。2020年,AI從(cóng)“小(xiǎo)模型+判别式”轉向“大(dà)模型+生成式”,從(cóng)傳統的人臉識别、目标檢測、文(wén)本分類,升級到(dào)如今的文(wén)本生成、3D數字人生成、圖像生成、語音(yīn)生成、視(shì)頻生成。大(dà)語言模型在對(duì)話(huà)系統領域的一個典型應用(yòng)是OpenAI公司的ChatGPT,它采用(yòng)預訓練基座大(dà)語言模型GPT-3,引入3000億單詞的訓練語料,相當于互聯網上(shàng)所有英語文(wén)字的總和(hé)。其基本原理(lǐ)是:通過給它一個輸入,讓它預測下(xià)一個單詞來(lái)訓練模型,通過大(dà)量訓練提升預測精确度,最終達到(dào)向它詢問一個問題,大(dà)模型産生一個答(dá)案,與人即時(shí)對(duì)話(huà)。在基座大(dà)模型的基礎上(shàng),再給它一些(xiē)提示詞進行有監督的指令微調,通過人類的<指令,回複>對(duì)逐漸讓模型學會(huì)如何與人進行多輪對(duì)話(huà);最後,通過人爲設計(jì)和(hé)自(zì)動生成的獎勵函數來(lái)進行強化學習叠代,逐步實現(xiàn)大(dà)模型與人類價值觀的對(duì)齊。
大(dà)模型的特點是以“大(dà)”取勝,其中有三層含義:
(1)參數大(dà),GPT-3就有1700億個參數;
(2)訓練數據大(dà),ChatGPT大(dà)約用(yòng)了(le)3000億個單詞,570GB訓練數據;
(3)算(suàn)力需求大(dà),GPT-3大(dà)約用(yòng)了(le)上(shàng)萬塊V100 GPU進行訓練。爲滿足大(dà)模型對(duì)智能(néng)算(suàn)力爆炸式增加的需求,國内外(wài)都在大(dà)規模建設耗資巨大(dà)的新型智算(suàn)中心,英偉達公司也(yě)推出了(le)采用(yòng)256個H100芯片,150TB海量GPU内存等構成的大(dà)模型智能(néng)計(jì)算(suàn)系統。
大(dà)模型的出現(xiàn)帶來(lái)了(le)三個變革。
一是技術上(shàng)的規模定律(Scaling Law),即很(hěn)多AI模型的精度在參數規模超過某個阈值後模型能(néng)力快(kuài)速提升,其原因在科學界還不是非常清楚,有很(hěn)大(dà)的争議(yì)。AI模型的性能(néng)與模型參數規模、數據集大(dà)小(xiǎo)、算(suàn)力總量三個變量成“對(duì)數線性關系”,因此可以通過增大(dà)模型的規模來(lái)不斷提高(gāo)模型的性能(néng)。目前最前沿的大(dà)模型GPT-4參數量已經達到(dào)了(le)萬億到(dào)十萬億量級,并且仍在不斷增長中;
二是産業上(shàng)算(suàn)力需求爆炸式增長,千億參數規模大(dà)模型的訓練通常需要在數千乃至數萬GPU卡上(shàng)訓練2-3個月時(shí)間,急劇(jù)增加的算(suàn)力需求帶動相關算(suàn)力企業超高(gāo)速發展,英偉達的市值接近兩萬億美(měi)元,對(duì)于芯片企業以前從(cóng)來(lái)沒有發生過;
三是社會(huì)上(shàng)沖擊勞動力市場,北京大(dà)學國家發展研究院與智聯招聘聯合發布的《AI大(dà)模型對(duì)我國勞動力市場潛在影響研究》報(bào)告指出,受影響最大(dà)的20個職業中财會(huì)、銷售、文(wén)書位于前列,需要與人打交道(dào)并提供服務的體力勞動型工(gōng)作(zuò),如人力資源、行政、後勤等反而相對(duì)更安全。
人工(gōng)智能(néng)的技術前沿将朝着以下(xià)四個方向發展。
第一個前沿方向爲多模态大(dà)模型。從(cóng)人類視(shì)角出發,人類智能(néng)是天然多模态的,人擁有眼、耳、鼻、舌、身、嘴(語言),從(cóng)AI視(shì)角出發,視(shì)覺,聽覺等也(yě)都可以建模爲token②的序列,可采取與大(dà)語言模型相同的方法進行學習,并進一步與語言中的語義進行對(duì)齊,實現(xiàn)多模态對(duì)齊的智能(néng)能(néng)力。
第二個前沿方向爲視(shì)頻生成大(dà)模型。OpenAI于2024年2月15日發布文(wén)生視(shì)頻模型SORA,将視(shì)頻生成時(shí)長從(cóng)幾秒鐘(zhōng)大(dà)幅提升到(dào)一分鐘(zhōng),且在分辨率、畫(huà)面真實度、時(shí)序一緻性等方面都有顯著提升。SORA的最大(dà)意義是它具備了(le)世界模型的基本特征,即人類觀察世界并進一步預測世界的能(néng)力。世界模型是建立在理(lǐ)解世界的基本物理(lǐ)常識(如,水(shuǐ)往低(dī)處流等)之上(shàng),然後觀察并預測下(xià)一秒将要發生什(shén)麽事(shì)件。雖然SORA要成爲世界模型仍然存在很(hěn)多問題,但(dàn)可以認爲SORA學會(huì)了(le)畫(huà)面想象力和(hé)分鐘(zhōng)級未來(lái)預測能(néng)力,這(zhè)是世界模型的基礎特征。
第三個前沿方向爲具身智能(néng)。具身智能(néng)指有身體并支持與物理(lǐ)世界進行交互的智能(néng)體,如機器人、無人車等,通過多模态大(dà)模型處理(lǐ)多種傳感數據輸入,由大(dà)模型生成運動指令對(duì)智能(néng)體進行驅動,替代傳統基于規則或者數學公式的運動驅動方式,實現(xiàn)虛拟和(hé)現(xiàn)實的深度融合。因此,具有具身智能(néng)的機器人,可以聚集人工(gōng)智能(néng)的三大(dà)流派:以神經網絡爲代表的連接主義,以知(zhī)識工(gōng)程爲代表的符号主義和(hé)控制論相關的行爲主義,三大(dà)流派可以同時(shí)作(zuò)用(yòng)在一個智能(néng)體,這(zhè)預期會(huì)帶來(lái)新的技術突破。
第四個前沿方向是AI4R(AI for Research)成爲科學發現(xiàn)與技術發明(míng)的主要範式。當前科學發現(xiàn)主要依賴于實驗和(hé)人腦(nǎo)智慧,由人類進行大(dà)膽猜想、小(xiǎo)心求證,信息技術無論是計(jì)算(suàn)和(hé)數據,都隻是起到(dào)一些(xiē)輔助和(hé)驗證的作(zuò)用(yòng)。相較于人類,人工(gōng)智能(néng)在記憶力、高(gāo)維複雜(zá)、全視(shì)野、推理(lǐ)深度、猜想等方面具有較大(dà)優勢,是否能(néng)以AI爲主進行一些(xiē)科學發現(xiàn)和(hé)技術發明(míng),大(dà)幅提升人類科學發現(xiàn)的效率,比如主動發現(xiàn)物理(lǐ)學規律、預測蛋白(bái)質結構、設計(jì)高(gāo)性能(néng)芯片、高(gāo)效合成新藥等。因爲人工(gōng)智能(néng)大(dà)模型具有全量數據,具備上(shàng)帝視(shì)角,通過深度學習的能(néng)力,可以比人向前看(kàn)更多步數,如能(néng)實現(xiàn)從(cóng)推斷(inference)到(dào)推理(lǐ)(reasoning)的躍升,人工(gōng)智能(néng)模型就有潛力具備愛因斯坦一樣的想象力和(hé)科學猜想能(néng)力,極大(dà)提升人類科學發現(xiàn)的效率,打破人類的認知(zhī)邊界。這(zhè)才是真正的颠覆所在。
最後,通用(yòng)人工(gōng)智能(néng)③(Artificial General Intelligence,簡稱AGI)是一個極具挑戰的話(huà)題,極具争論性。曾經有一個哲學家和(hé)一個神經科學家打賭:25年後(即2023年)科研人員是否能(néng)夠揭示大(dà)腦(nǎo)如何實現(xiàn)意識?當時(shí)關于意識有兩個流派,一個叫集成信息理(lǐ)論,一個叫全局網絡工(gōng)作(zuò)空(kōng)間理(lǐ)論,前者認爲意識是由大(dà)腦(nǎo)中特定類型神經元連接形成的“結構”,後者指出意識是當信息通過互連網絡傳播到(dào)大(dà)腦(nǎo)區(qū)域時(shí)産生的。2023年,人們通過六個獨立實驗室進行了(le)對(duì)抗性實驗,結果與兩種理(lǐ)論均不完全匹配,哲學家赢了(le),神經科學家輸了(le)。通過這(zhè)一場賭約,可以看(kàn)出人們總是希望人工(gōng)智能(néng)能(néng)夠了(le)解人類的認知(zhī)和(hé)大(dà)腦(nǎo)的奧秘。從(cóng)物理(lǐ)學的視(shì)角看(kàn),物理(lǐ)學是對(duì)宏觀世界有了(le)透徹理(lǐ)解後,從(cóng)量子物理(lǐ)起步開(kāi)啓了(le)對(duì)微觀世界的理(lǐ)解。智能(néng)世界與物理(lǐ)世界一樣,都是具有巨大(dà)複雜(zá)度的研究對(duì)象,AI大(dà)模型仍然是通過數據驅動等研究宏觀世界的方法,提高(gāo)機器的智能(néng)水(shuǐ)平,對(duì)智能(néng)宏觀世界理(lǐ)解并不夠,直接到(dào)神經系統微觀世界尋找答(dá)案是困難的。人工(gōng)智能(néng)自(zì)誕生以來(lái),一直承載着人類關于智能(néng)與意識的種種夢想與幻想,也(yě)激勵着人們不斷探索。
三、人工(gōng)智能(néng)的安全風(fēng)險
人工(gōng)智能(néng)的發展促進了(le)當今世界科技進步的同時(shí),也(yě)帶來(lái)了(le)很(hěn)多安全風(fēng)險,要從(cóng)技術與法規兩方面加以應對(duì)。
首先是互聯網虛假信息泛濫。這(zhè)裏列舉若幹場景:
一是數字分身。AI Yoon是首個使用(yòng) DeepFake 技術合成的官方“候選人”,這(zhè)個數字人以韓國國民力量黨候選人尹錫悅(Yoon Suk-yeol)爲原型,借助尹錫悅 20 小(xiǎo)時(shí)的音(yīn)頻和(hé)視(shì)頻片段、以及其專門(mén)爲研究人員錄制的 3000 多個句子,由當地一家 DeepFake 技術公司創建了(le)虛拟形象 AI Yoon,并在網絡上(shàng)迅速走紅(hóng)。實際上(shàng) AI Yoon 表達的内容是由競選團隊撰寫的,而不是候選人本人。
二是僞造視(shì)頻,尤其是僞造領導人視(shì)頻引起國際争端,擾亂選舉秩序,或引起突發輿情事(shì)件,如僞造尼克松宣布第一次登月失敗,僞造烏克蘭總統澤連斯基宣布“投降”的信息,這(zhè)些(xiē)行爲導緻新聞媒體行業的社會(huì)信任衰退。
三是僞造新聞,主要通過虛假新聞自(zì)動生成牟取非法利益,使用(yòng)ChatGPT生成熱點新聞,賺取流量,截至2023年6月30日全球生成僞造新聞網站(zhàn)已達277個,嚴重擾亂社會(huì)秩序。
四是換臉變聲,用(yòng)于詐騙。如由于AI語音(yīn)模仿了(le)企業高(gāo)管的聲音(yīn),一家香港國際企業因此被騙3500萬美(měi)元。
五是生成不雅圖片,特别是針對(duì)公衆人物。如影視(shì)明(míng)星的色情視(shì)頻制作(zuò),造成不良社會(huì)影響。因此,迫切需要發展互聯網虛假信息的僞造檢測技術。
其次,AI大(dà)模型面臨嚴重可信問題。這(zhè)些(xiē)問題包括:
(1)“一本正經胡說八道(dào)”的事(shì)實性錯誤;
(2)以西方價值觀叙事(shì),輸出政治偏見和(hé)錯誤言論;
(3)易被誘導,輸出錯誤知(zhī)識和(hé)有害内容;
(4)數據安全問題加重,大(dà)模型成爲重要敏感數據的誘捕器,ChatGPT将用(yòng)戶輸入納入訓練數據庫,用(yòng)于改善ChatGPT,美(měi)方能(néng)夠利用(yòng)大(dà)模型獲得公開(kāi)渠道(dào)覆蓋不到(dào)的中文(wén)語料,掌握我們自(zì)己都可能(néng)不掌握的“中國知(zhī)識”。因此,迫切需要發展大(dà)模型安全監管技術與自(zì)己的可信大(dà)模型。
除了(le)技術手段外(wài),人工(gōng)智能(néng)安全保障需要相關立法工(gōng)作(zuò)。2021年科技部發布《新一代人工(gōng)智能(néng)倫理(lǐ)規範》,2022年8月,全國信息安全标準化技術委員會(huì)發布《信息安全技術 機器學習算(suàn)法安全評估規範》,2022-2023年,中央網信辦先後發布《互聯網信息服務算(suàn)法推薦管理(lǐ)規定》《互聯網信息服務深度合成管理(lǐ)規定》《生成式人工(gōng)智能(néng)服務管理(lǐ)辦法》等。歐美(měi)國家也(yě)先後出台法規,2018年5月25日,歐盟出台《通用(yòng)數據保護條例》,2022年10月4日,美(měi)國發布《人工(gōng)智能(néng)權利法案藍圖》,2024年3月13日,歐洲議(yì)會(huì)通過了(le)歐盟《人工(gōng)智能(néng)法案》。
我國應加快(kuài)推進《人工(gōng)智能(néng)法》出台,構建人工(gōng)智能(néng)治理(lǐ)體系,确保人工(gōng)智能(néng)的發展和(hé)應用(yòng)遵循人類共同價值觀,促進人機和(hé)諧友好(hǎo);創造有利于人工(gōng)智能(néng)技術研究、開(kāi)發、應用(yòng)的政策環境;建立合理(lǐ)披露機制和(hé)審計(jì)評估機制,理(lǐ)解人工(gōng)智能(néng)機制原理(lǐ)和(hé)決策過程;明(míng)确人工(gōng)智能(néng)系統的安全責任和(hé)問責機制,可追溯責任主體并補救;推動形成公平合理(lǐ)、開(kāi)放(fàng)包容的國際人工(gōng)智能(néng)治理(lǐ)規則。
四、中國智能(néng)計(jì)算(suàn)發展困境
人工(gōng)智能(néng)技術與智能(néng)計(jì)算(suàn)産業處于中美(měi)科技競争的焦點,我國在過去幾年雖然取得了(le)很(hěn)大(dà)的成績,但(dàn)依然面臨諸多發展困境,特别是由美(měi)國的科技打壓政策帶來(lái)的困難。
困境一爲美(měi)國在AI核心能(néng)力上(shàng)長期處于領先地位,中國處于跟蹤模式。中國在AI高(gāo)端人才數量、AI基礎算(suàn)法創新、AI底座大(dà)模型能(néng)力(大(dà)語言模型、文(wén)生圖模型、文(wén)生視(shì)頻模型)、底座大(dà)模型訓練數據、底座大(dà)模型訓練算(suàn)力等,都與美(měi)國存在一定的差距,并且這(zhè)種差距還将持續很(hěn)長一段時(shí)間。
困境二爲高(gāo)端算(suàn)力産品禁售,高(gāo)端芯片工(gōng)藝長期被卡。A100,H100,B200等高(gāo)端智算(suàn)芯片對(duì)華禁售。華爲、龍芯、寒武紀、曙光、海光等企業都進入實體清單,它們芯片制造的先進工(gōng)藝④受限,國内可滿足規模量産的工(gōng)藝節點落後國際先進水(shuǐ)平2-3代,核心算(suàn)力芯片的性能(néng)落後國際先進水(shuǐ)平2-3代。
困境三爲國内智能(néng)計(jì)算(suàn)生态孱弱,AI開(kāi)發框架滲透率不足。英偉達CUDA⑤(Compute Unified Device Architecture, 通用(yòng)計(jì)算(suàn)設備架構)生态完備,已形成了(le)事(shì)實上(shàng)的壟斷。國内生态孱弱,具體表現(xiàn)在:一是研發人員不足,英偉達CUDA生态有近2萬人開(kāi)發,是國内所有智能(néng)芯片公司人員總和(hé)的20倍;二是開(kāi)發工(gōng)具不足,CUDA有550個SDK(Software Development Kit, 軟件開(kāi)發工(gōng)具包),是國内相關企業的上(shàng)百倍;三是資金(jīn)投入不足,英偉達每年投入50億美(měi)元,是國内相關公司的幾十倍;四是AI開(kāi)發框架TensorFlow占據工(gōng)業類市場,PyTorch占據研究類市場,百度飛(fēi)槳等國産AI開(kāi)發框架的開(kāi)發人員隻有國外(wài)框架的1/10。更爲嚴重的是國内企業之間山頭林(lín)立,無法形成合力,從(cóng)智能(néng)應用(yòng)、開(kāi)發框架、系統軟件、智能(néng)芯片,雖然每層都有相關産品,但(dàn)各層之間沒有深度适配,無法形成一個有競争力的技術體系。
困境四爲AI應用(yòng)于行業時(shí)成本、門(mén)檻居高(gāo)不下(xià)。當前我國AI應用(yòng)主要集中在互聯網行業和(hé)一些(xiē)國防領域。AI技術推廣應用(yòng)于各行各業時(shí),特别是從(cóng)互聯網行業遷移到(dào)非互聯網行業,需要進行大(dà)量的定制工(gōng)作(zuò),遷移難度大(dà),單次使用(yòng)成本高(gāo)。最後,我國在AI領域的人才數量與實際需求相比也(yě)明(míng)顯不足。
五、中國如何發展智能(néng)計(jì)算(suàn)的道(dào)路選擇
人工(gōng)智能(néng)發展的道(dào)路選擇對(duì)我國至關重要,關系到(dào)發展的可持續性與最終的國際競争格局。當前人工(gōng)智能(néng)的使用(yòng)成本十分高(gāo)昂,微軟Copilot套件要支付每月10美(měi)元的使用(yòng)費用(yòng),ChatGPT每天消耗50萬千瓦時(shí)的電力,英偉達B200芯片價格高(gāo)達3萬美(měi)元以上(shàng)。總體來(lái)說,我國應發展用(yòng)得起、安全可信的人工(gōng)智能(néng)技術,消除我國信息貧困人口、并造福“一帶一路”國家;低(dī)門(mén)檻地賦能(néng)各行各業,讓我國的優勢産業保持競争力,讓相對(duì)落後的産業能(néng)夠大(dà)幅地縮小(xiǎo)差距。
選擇一:統一技術體系走閉源封閉,還是開(kāi)源開(kāi)放(fàng)的道(dào)路?
支撐智能(néng)計(jì)算(suàn)産業的是一個相互緊耦合的技術體系,即由一系列技術标準和(hé)知(zhī)識産權将材料、器件、工(gōng)藝、芯片、整機、系統軟件、應用(yòng)軟件等密切聯系在一起的技術整體。我國發展智能(néng)計(jì)算(suàn)技術體系存在三條道(dào)路:
一是追趕兼容美(měi)國主導的A體系。我國大(dà)多數互聯網企業走的是GPGPU/CUDA兼容道(dào)路,很(hěn)多芯片領域的創業企業在生态構建上(shàng)也(yě)是盡量與CUDA兼容,這(zhè)條道(dào)路較爲現(xiàn)實。由于在算(suàn)力方面美(měi)國對(duì)我國工(gōng)藝和(hé)芯片帶寬的限制,在算(suàn)法方面國内生态林(lín)立很(hěn)難形成統一,生态成熟度嚴重受限,在數據方面中文(wén)高(gāo)質量數據匮乏,這(zhè)些(xiē)因素會(huì)使得追趕者與領先者的差距很(hěn)難縮小(xiǎo),一些(xiē)時(shí)候還會(huì)進一步拉大(dà)。
二是構建專用(yòng)封閉的B體系。在軍事(shì)、氣象、司法等專用(yòng)領域構建企業封閉生态,基于國産成熟工(gōng)藝生産芯片,相對(duì)于底座大(dà)模型更加關注特定領域垂直類大(dà)模型,訓練大(dà)模型更多采用(yòng)領域專有高(gāo)質量數據等。這(zhè)條道(dào)路易于形成完整可控的技術體系與生态,我國一些(xiē)大(dà)型骨幹企業走的是這(zhè)條道(dào)路,它的缺點是封閉,無法凝聚國内大(dà)多數力量,也(yě)很(hěn)難實現(xiàn)全球化。
三是全球共建開(kāi)源開(kāi)放(fàng)的C體系。用(yòng)開(kāi)源打破生态壟斷,降低(dī)企業擁有核心技術的門(mén)檻,讓每個企業都能(néng)低(dī)成本地做自(zì)己的芯片,形成智能(néng)芯片的汪洋大(dà)海,滿足無處不在的智能(néng)需求。用(yòng)開(kāi)放(fàng)形成統一的技術體系,我國企業與全球化力量聯合起來(lái)共建基于國際标準的統一智能(néng)計(jì)算(suàn)軟件棧。形成企業競争前共享機制,共享高(gāo)質量數據庫,共享開(kāi)源通用(yòng)底座大(dà)模型。對(duì)于全球開(kāi)源生态,我國企業在互聯網時(shí)代收益良多,我國更多的是使用(yòng)者,是參與者,在智能(néng)時(shí)代我國企業在RISC-V⑥+AI開(kāi)源技術體系上(shàng)應更多地成爲主力貢獻者,成爲全球化開(kāi)放(fàng)共享的主導力量。
選擇二:拼算(suàn)法模型,還是拼新型基礎設施?
人工(gōng)智能(néng)技術要賦能(néng)各行各業,具有典型的長尾效應⑦。我國80%的中小(xiǎo)微企業,需要的是低(dī)門(mén)檻、低(dī)價格的智能(néng)服務。因此,我國智能(néng)計(jì)算(suàn)産業必須建立在新的數據空(kōng)間基礎設施之上(shàng),其中關鍵是我國應率先實現(xiàn)智能(néng)要素即數據、算(suàn)力、算(suàn)法的全面基礎設施化。這(zhè)項工(gōng)作(zuò)可比肩二十世紀初美(měi)國信息高(gāo)速公路計(jì)劃(即信息基礎設施建設)對(duì)互聯網産業的曆史作(zuò)用(yòng)。
信息社會(huì)最核心的生産力是網絡空(kōng)間(Cyberspace)。網絡空(kōng)間的演進過程是:從(cóng)機器一元連接構成的計(jì)算(suàn)空(kōng)間,演進到(dào)人機信息二元連接構成的信息空(kōng)間,再演進到(dào)人機物數據三元連接構成的數據空(kōng)間。從(cóng)數據空(kōng)間看(kàn),人工(gōng)智能(néng)的本質是數據的百煉成鋼,大(dà)模型就是對(duì)互聯網全量數據進行深度加工(gōng)後的産物。在數字化時(shí)代,在互聯網上(shàng)傳輸的是信息流,是算(suàn)力對(duì)數據進行粗加工(gōng)後的結構化抽象;在智能(néng)時(shí)代,在互聯網上(shàng)傳輸的是智能(néng)流,是算(suàn)力對(duì)數據進行深度加工(gōng)與精煉後的模型化抽象。智能(néng)計(jì)算(suàn)的一個核心特征就是用(yòng)數值計(jì)算(suàn)、數據分析、人工(gōng)智能(néng)等算(suàn)法,在算(suàn)力池中加工(gōng)海量數據件,得到(dào)智能(néng)模型,再嵌入到(dào)信息世界、物理(lǐ)世界的各個過程中。
我國政府已經前瞻性地提前布局了(le)新型基礎設施,在世界各國競争中搶占了(le)先機。
首先,數據已成爲國家戰略信息資源。數據具有資源要素與價值加工(gōng)兩重屬性,數據的資源要素屬性包括生産、獲取、傳輸、彙聚、流通、交易、權屬、資産、安全等各個環節,我國應繼續加大(dà)力度建設國家數據樞紐與數據流通基礎設施。
其次,AI大(dà)模型就是數據空(kōng)間的一類算(suàn)法基礎設施。以通用(yòng)大(dà)模型爲基座,構建大(dà)模型研發與應用(yòng)的基礎設施,支撐廣大(dà)企業研發領域專用(yòng)大(dà)模型,服務于機器人、無人駕駛、可穿戴設備、智能(néng)家居、智能(néng)安防等行業,覆蓋長尾應用(yòng)。
最後,全國一體化算(suàn)力網建設在推動算(suàn)力的基礎設施化上(shàng)發揮了(le)先導作(zuò)用(yòng)。算(suàn)力基礎設施化的中國方案,應在大(dà)幅度降低(dī)算(suàn)力使用(yòng)成本和(hé)使用(yòng)門(mén)檻的同時(shí),爲最廣範圍覆蓋人群提供高(gāo)通量、高(gāo)品質的智能(néng)服務。算(suàn)力基礎設施的中國方案需要具備“兩低(dī)一高(gāo)”,即在供給側,大(dà)幅度降低(dī)算(suàn)力器件、算(suàn)力設備、網絡連接、數據獲取、算(suàn)法模型調用(yòng)、電力消耗、運營維護、開(kāi)發部署的總成本,讓廣大(dà)中小(xiǎo)企業都消費得起高(gāo)品質的算(suàn)力服務,有積極性開(kāi)發算(suàn)力網應用(yòng);在消費側,大(dà)幅度降低(dī)廣大(dà)用(yòng)戶的算(suàn)力使用(yòng)門(mén)檻,面向大(dà)衆的公共服務必須做到(dào)易獲取、易使用(yòng),像水(shuǐ)電一樣即開(kāi)即用(yòng),像編寫網頁一樣輕松定制算(suàn)力服務,開(kāi)發算(suàn)力網應用(yòng)。在服務效率側,中國的算(suàn)力服務要實現(xiàn)低(dī)熵高(gāo)通量,其中高(gāo)通量是指在實現(xiàn)高(gāo)并發⑧度服務的同時(shí),端到(dào)端服務的響應時(shí)間可滿足率高(gāo);低(dī)熵是指在高(gāo)并發負載中出現(xiàn)資源無序競争的情況下(xià),保障系統通量不急劇(jù)下(xià)降。保障“算(suàn)得多”對(duì)中國尤其重要。
選擇三:AI+着重賦能(néng)虛拟經濟,還是發力實體經濟?
“AI+”的成效是人工(gōng)智能(néng)價值的試金(jīn)石。次貸危機後,美(měi)國制造業增加值占GDP的比重從(cóng)1950年的28%降低(dī)爲2021年的11%,美(měi)國制造業在全行業就業人數占比從(cóng)1979年的35%降低(dī)爲2022年的8%,可見美(měi)國更傾向于回報(bào)率更高(gāo)的虛拟經濟,輕視(shì)投資成本高(gāo)且經濟回報(bào)率低(dī)的實體經濟。中國傾向于實體經濟與虛拟經濟同步發展,更加重視(shì)發展裝備制造、新能(néng)源汽車、光伏發電、锂電池、高(gāo)鐵(tiě)、5G等實體經濟。
相應地美(měi)國AI主要應用(yòng)于虛拟經濟和(hé)IT基礎工(gōng)具,AI技術也(yě)是“脫實向虛”,自(zì)2007年以來(lái)矽谷不斷炒作(zuò)虛拟現(xiàn)實(Virtual Reality,VR)、元宇宙、區(qū)塊鏈、Web3.0、深度學習、AI大(dà)模型等,是這(zhè)個趨勢的反映。
我國的優勢在實體經濟,制造業全球産業門(mén)類最齊全,體系最完整,特點是場景多、私有數據多。我國應精選若幹行業加大(dà)投入,形成可低(dī)門(mén)檻全行業推廣的範式,如選擇裝備制造業作(zuò)爲延續優勢代表性行業,選擇醫(yī)藥業作(zuò)爲快(kuài)速縮短差距的代表性行業。賦能(néng)實體經濟的技術難點是AI算(suàn)法與物理(lǐ)機理(lǐ)的融合。
人工(gōng)智能(néng)技術成功的關鍵是能(néng)否讓一個行業或一個産品的成本大(dà)幅下(xià)降,從(cóng)而将用(yòng)戶數與産業規模擴大(dà)10倍,産生類似于蒸汽機對(duì)于紡織業,智能(néng)手機對(duì)于互聯網業的變革效果。
我國應走出适合自(zì)己的人工(gōng)智能(néng)賦能(néng)實體經濟的高(gāo)質量發展道(dào)路。
注釋:
①模式識别是指用(yòng)計(jì)算(suàn)的方法根據樣本的特征将樣本劃分到(dào)一定的類别中去,是通過計(jì)算(suàn)機用(yòng)數學方法來(lái)研究模式的自(zì)動處理(lǐ)和(hé)判讀,把環境與客體統稱爲“模式”。以圖像處理(lǐ)與計(jì)算(suàn)機視(shì)覺、語音(yīn)語言信息處理(lǐ)、腦(nǎo)網絡組、類腦(nǎo)智能(néng)等爲主要研究方向。
②Token可翻譯爲詞元,指自(zì)然語言處理(lǐ)過程中用(yòng)來(lái)表示單詞或短語的符号。token可以是單個字符,也(yě)可以是多個字符組成的序列。
③通用(yòng)人工(gōng)智能(néng)是指擁有與人類相當甚至超過人類智能(néng)的人工(gōng)智能(néng)類型。通用(yòng)人工(gōng)智能(néng)不僅能(néng)像人類一樣進行感知(zhī)、理(lǐ)解、學習和(hé)推理(lǐ)等基礎思維能(néng)力,還能(néng)在不同領域靈活應用(yòng)、快(kuài)速學習和(hé)創造性思考。通用(yòng)人工(gōng)智能(néng)的研究目标是尋求統一的理(lǐ)論框架來(lái)解釋各種智能(néng)現(xiàn)象。
④芯片制造工(gōng)藝指制造CPU或GPU的制程,即晶體管門(mén)電路的尺寸,單位爲納米,目前國際上(shàng)實現(xiàn)量産的最先進工(gōng)藝以台積電的3nm爲代表。更先進的制造工(gōng)藝可以使CPU與GPU内部集成更多的晶體管,使處理(lǐ)器具有更多的功能(néng)以及更高(gāo)的性能(néng),面積更小(xiǎo),成本更低(dī)等。
⑤CUDA是英偉達公司設計(jì)研發一種并行計(jì)算(suàn)平台和(hé)編程模型,包含了(le)CUDA指令集架構以及GPU内部的并行計(jì)算(suàn)引擎。開(kāi)發人員可以使用(yòng)C語言來(lái)爲CUDA架構編寫程序,所編寫出的程序可以在支持CUDA的處理(lǐ)器上(shàng)以超高(gāo)性能(néng)運行。
⑥RISC-V(發音(yīn)爲“risk-five”)是一個由美(měi)國加州大(dà)學伯克利分校發起的開(kāi)放(fàng)通用(yòng)指令集架構,相比于其他(tā)付費指令集,RISC-V允許任何人免費地使用(yòng)RISC-V指令集設計(jì)、制造和(hé)銷售芯片和(hé)軟件。
⑦長尾效應是指那些(xiē)原來(lái)不受到(dào)重視(shì)的銷量小(xiǎo)但(dàn)種類多的産品或服務由于總量巨大(dà),累積起來(lái)的總收益超過主流産品的現(xiàn)象。在互聯網領域,長尾效應尤爲顯著。
⑧高(gāo)并發通常指通過設計(jì)保證系統能(néng)夠同時(shí)并行處理(lǐ)很(hěn)多請(qǐng)求。