不知(zhī)道(dào)大(dà)家還記不記得在電影《蟻人2》中,當反派想問出主人公的下(xià)落時(shí),給他(tā)的朋友路易斯注射了(le)一劑“吐真劑”。這(zhè)針藥物直接讓路易斯什(shén)麽都往外(wài)說,把主人公的情感生活都快(kuài)抖摟幹淨了(le)。
而就在近日的《自(zì)然——神經科學》上(shàng),來(lái)自(zì)得克薩斯大(dà)學的科學家們發表了(le)一篇論文(wén),文(wén)中提到(dào)他(tā)們在大(dà)型語言模型的助力下(xià),開(kāi)發出了(le)一種現(xiàn)代“讀心機”,雖然它不能(néng)讓你(nǐ)直接“說真話(huà)”,但(dàn)是可以将你(nǐ)的大(dà)腦(nǎo)活動轉換成清晰的圖像或語言直接表述出來(lái)。
原本電影不過是電影,但(dàn)現(xiàn)代“讀心機”卻打破了(le)人們的認知(zhī)。在這(zhè)種“讀心機”誕生之前,最接近“吐真劑”的設備應該是測謊儀,然而它也(yě)是通過心跳和(hé)腦(nǎo)電波等情緒上(shàng)的起伏來(lái)間接反映人到(dào)底有沒有撒謊。那麽這(zhè)款“讀心機”到(dào)底是如何做到(dào)的呢(ne)?
AI如何直接讀取思維?
直接讀取思維,或者說是“思維解碼”,是指能(néng)夠直接從(cóng)大(dà)腦(nǎo)中提取和(hé)解析思維的過程。這(zhè)個過程涉及諸如神經元活動模式的識别,以及将這(zhè)些(xiē)模式與特定的思維或感知(zhī)相關聯。
2023年5月1日,美(měi)國得克薩斯大(dà)學奧斯汀分校的研究人員在《自(zì)然——神經科學》期刊發表了(le)研究論文(wén)。該研究開(kāi)發了(le)一種名爲語義解碼器的新型人工(gōng)智能(néng)系統,隻需要分析功能(néng)磁共振成像(fMRI)數據,就可以以非侵入性的方式,将參與者大(dà)腦(nǎo)中所想的故事(shì)甚至圖像翻譯成連續的文(wén)本流。這(zhè)一系統可能(néng)會(huì)幫助那些(xiē)有精神意識但(dàn)無法說話(huà)的人(例如,中風(fēng)患者、聾啞人)進行清晰的交流。
有意思的是,這(zhè)項研究工(gōng)作(zuò)部分依賴于大(dà)語言模型(LLM),而大(dà)語言模型正是最近爆火的人工(gōng)智能(néng)聊天軟件 ChatGPT 的基礎。
在訓練系統階段,科學家們讓志願者躺在fMRI機器中,在接受fMRI掃描的同時(shí),從(cóng)耳機中聽取播客故事(shì)。在訓練階段,研究人員利用(yòng)基于GPT-1的大(dà)型語言模型,将參與者fMRI數據顯示的大(dà)腦(nǎo)活動,與播客故事(shì)裏的語言特征聯系起來(lái)。
志願者接收幾十個小(xiǎo)時(shí)播客故事(shì)後,研究人員會(huì)讓志願者聽一個全新的故事(shì)。這(zhè)一次,他(tā)們要求解碼器根據志願者的大(dà)腦(nǎo)活動,輸出語言來(lái)描述志願者聽到(dào)的故事(shì)。
實驗結果顯示,這(zhè)一系統能(néng)夠根據志願者的fMRI數據,描述出志願者聽到(dào)的故事(shì),雖然達不到(dào)100%的準确度,但(dàn)是它能(néng)夠讀出志願者大(dà)腦(nǎo)中想到(dào)的故事(shì)的大(dà)意。
除了(le)可以将文(wén)字故事(shì)解讀出來(lái)外(wài),這(zhè)個系統還能(néng)解碼圖像内容。在實驗中,研究人員讓參與者觀看(kàn)一小(xiǎo)段沒有語音(yīn)或文(wén)字的動畫(huà)視(shì)頻,然後解碼器可以根據參與者的大(dà)腦(nǎo)活動,輸出語言描述視(shì)頻中發生的事(shì)件。但(dàn)這(zhè)項研究也(yě)帶來(lái)了(le)一個全新的隐私問題——一些(xiē)不懷好(hǎo)意的人是否可以通過語義解碼器竊取他(tā)人大(dà)腦(nǎo)中的想法呢(ne)?
論文(wén)通訊作(zuò)者 Alexander Huth 教授表示,語義解碼器是量身定做的,在使用(yòng)前需要經過十幾個小(xiǎo)時(shí)的訓練,志願受試者需要保持完全靜止,并将精神集中在他(tā)們正在聽的故事(shì),該系統才能(néng)真正發揮作(zuò)用(yòng)。研究團隊也(yě)在沒有接受過培訓的人身上(shàng)測試了(le)該系統,其解碼結果與實際相差甚遠。
目前的進展
盡管目前還遠未能(néng)完全解碼人類思維,但(dàn)研究人員還是取得了(le)一些(xiē)關鍵的進步。
例如,在今年3月份,來(lái)自(zì)日本京都大(dà)學的科學家們已經成功地使用(yòng)AI解碼出了(le)人們看(kàn)到(dào)或在大(dà)腦(nǎo)中想象的圖像,甚至是他(tā)們正在聽的或想象的語言。
該研究論文(wén)發表在《生物雜(zá)志》網絡版上(shàng)。作(zuò)者說:“在這(zhè)裏,我們提出了(le)一種新的圖像重建方法,在這(zhè)個方法中,圖像的像素值被優化,以使其深層的神經網絡特征與人類大(dà)腦(nǎo)活動的多個層面的解碼相似。”“雖然我們的模型隻接受自(zì)然圖像的訓練,但(dàn)我們的方法成功地将重建過程推廣到(dào)人工(gōng)形狀,這(zhè)表明(míng)我們的模型确實‘重構’或‘生成’大(dà)腦(nǎo)活動的圖像,而不是簡單地匹配樣本。”
該項技術的核心在于當人在觀察一幅圖像時(shí),會(huì)在腦(nǎo)海中複刻這(zhè)張圖像,AI通過特定的算(suàn)法将志願者的fMRI信号和(hé)圖片的DNN(Deep Neural Networks深度神經網絡)特征關聯,繼而訓練可以讀取你(nǐ)思維的AI。
不過需要強調的是,目前的研究大(dà)多依賴于粗糙的大(dà)腦(nǎo)成像技術和(hé)有限的數據。因此能(néng)解碼的思維種類和(hé)精度都還有限。
除了(le)準确度,延時(shí)也(yě)是一個有待解決的問題。儀器與人類的交互讀取處理(lǐ)信息等都需要時(shí)間,且不同的人大(dà)腦(nǎo)的活動方式也(yě)有差異,這(zhè)對(duì)于系統的處理(lǐ)性能(néng)也(yě)是一個不小(xiǎo)的挑戰。
此外(wài),fMRI需要參與者躺在特定的機器裏才能(néng)收集到(dào)可靠的數據,這(zhè)種苛刻的條件要求會(huì)對(duì)未來(lái)的推廣帶來(lái)不小(xiǎo)的阻礙。
未來(lái)的可能(néng)
未來(lái),随着大(dà)腦(nǎo)成像技術的進步和(hé)更多的數據可用(yòng),我們将有可能(néng)訓練出能(néng)夠解碼更複雜(zá)、更精細的思維的AI。
這(zhè)不僅可能(néng)使我們能(néng)夠更深入地理(lǐ)解大(dà)腦(nǎo)和(hé)思維,也(yě)可能(néng)開(kāi)啓全新的交流方式,如幫助行動困難的人群直接用(yòng)思維控制界面,或者可以理(lǐ)解語言障礙人群的思維。
然而,能(néng)讀取思維的AI也(yě)帶來(lái)了(le)一系列道(dào)德和(hé)倫理(lǐ)問題。例如,誰有權訪問我們的私人思維?我們應該如何保護思維隐私?這(zhè)些(xiē)都是在開(kāi)發這(zhè)項技術時(shí)必須面對(duì)和(hé)解決的問題。
目前,我們還暫時(shí)不用(yòng)擔心該項技術會(huì)對(duì)人類隐私帶