并非先聽見聲音后理解語義大腦語音處理可“多線程”工作

        科技日報 2021-09-09 20:30:06

        大腦是如何聽懂語言的?幾十年來,科學家們一直認為聽覺皮層中的語音處理就像工廠的流水線一樣,按照先后不同處理工序串聯(lián)在一起,最終轉(zhuǎn)化成有意義的單詞。

        然而這一理論近日遭到了挑戰(zhàn),一項發(fā)表在《細胞》雜志上的研究結(jié)果表明,大腦對聽覺和語言的處理是并行進行的。

        這種語音處理的并行性質(zhì)推翻了長期以來的相關(guān)假設,可能會為醫(yī)生提供新的思路,以治療患有閱讀障礙等問題的兒童,幫助他們順利識別語音。

        傳統(tǒng)假設中大腦如何“聽懂”語言

        “人腦在聽覺環(huán)境中處理語音信息時,傳統(tǒng)理論認為聽覺皮質(zhì)處理信息的過程是自上而下的。當含有語意的聲音傳到耳中,耳蝸將其轉(zhuǎn)換成電信號,在初級聽覺皮層分析聲譜,在次級聽覺區(qū)域提取音素,在外側(cè)和腹側(cè)顳葉皮層提取單詞,頂葉和額葉區(qū)域基于語法和語義屬性并結(jié)合時間信息,進行單詞順序推斷并最終理解句子的含義。”天津大學醫(yī)學部副主任、智能醫(yī)學工程教育部工程研究中心副主任倪廣健介紹。

        “語音感知的經(jīng)典層次模型是假設聲音信息首先在初級聽覺皮層接收,然后通過與外側(cè)顳上回連接轉(zhuǎn)化為更復雜的表征。”倪廣健說,這是因為先前有關(guān)聽覺機制的研究主要基于解剖模型,認為大腦遵循一種從初級到高級的層次漸進處理模式,高級聽覺區(qū)域?qū)碗s的語音和音樂有更強的反應。

        一直以來,這一理論缺乏直接證據(jù)的支持,因為它需要整個聽覺皮層在極高時空分辨率的條件下記錄詳細的神經(jīng)生理學信息。但是初級聽覺皮層位于大腦額葉和顳葉的深處,因此想進行探究并不容易。

        此次最新研究對人類初級和次級聽覺皮層功能組織的研究結(jié)論與先前一致,但在赫氏回和顳上回的起始區(qū)發(fā)現(xiàn)了早期獨立處理的證據(jù),而非傳統(tǒng)認為的遵循語音簡單串行的皮層處理層次。可以確定的是,皮層前部和中部顳上回,具有明顯的并行處理和潛在的長潛伏期串行處理,說明聽覺皮層具有分布式的專業(yè)處理單元,每個單元代表了語音信號中不同的聲學和語音線索,它們的組合創(chuàng)造了豐富的語音理解體驗。

        非侵入技術(shù)探究大腦受限于時空分辨率

        目前,已有一些較為成熟的非侵入式技術(shù)用于研究大腦處理聽覺信息,例如具有較高空間分辨率的近紅外光譜NRIS、功能性核磁共振成像fMRI、腦磁圖MEG等,以及具有較高時間分辨率的腦電EEG等。

        倪廣健舉例說,比如近紅外光譜通過測量血氧含量表征聽覺皮層的代謝狀況,就可以有效反映外界刺激下聽覺皮層的變化情況,具有噪聲低、抗環(huán)境干擾性強、成本相對較低、安全便攜、易于使用等優(yōu)點。

        功能性核磁共振成像可探索大腦處理聽覺信息的過程,通過核磁共振造影來測量神經(jīng)元活動所引發(fā)的血液動力的改變,實現(xiàn)對特定大腦活動皮層區(qū)域進行定位,具有準確定位某些區(qū)域或某些疾病發(fā)病區(qū)域(如癲癇的病灶)的優(yōu)勢,在腦神經(jīng)科學領(lǐng)域應用相對較為廣泛。

        “在靜息狀態(tài)下腦部自發(fā)的低頻活動的同步化現(xiàn)象廣泛存在于聽覺系統(tǒng)內(nèi),因此功能性核磁共振成像能夠提供人類聽覺皮層不同功能和解剖區(qū)域如何相互作用的更完整的圖像,適合用于研究不同腦區(qū)之間的功能連接性。”倪廣健說。

        另一方面,具有高時間分辨率的腦電技術(shù)因為與人工耳蝸的兼容性也使得腦電逐漸展現(xiàn)了臨床聽覺客觀評估研究的能力和潛力,使得大規(guī)模探索臨床人工耳蝸患者聽覺處理模式成為可能。

        然而,上述非侵入式技術(shù)在空間分辨率和時間分辨率上往往無法兼具。倪廣健表示,單獨采用某一種非侵入性技術(shù)探索聽覺信息的處理過程時,會受限于有限的時間—空間分辨率,無法更好地探究局部異質(zhì)神經(jīng)元間的映射結(jié)果,因此無法具體回答語音表征問題。《細胞》雜志發(fā)表的新研究通過植入小電極陣列,創(chuàng)新性地突破了這一局限。

        植入電極可繪制聽覺區(qū)域特征編碼圖

        在此次發(fā)表的新研究中,小電極陣列被放置在受研究者的整個聽覺皮層中收集神經(jīng)信號。有9名患者參與了實驗。因為需要切除腦部腫瘤或定位引發(fā)癲癇的病灶,這些患者接受了神經(jīng)外科手術(shù)。與此同時,他們同意讓醫(yī)生在手術(shù)過程中將微電極陣列放置在他們的聽覺皮層,收集神經(jīng)信號,用于分析語言功能和定位癲癇,以及研究聽覺皮層如何處理語音信息。

        “小電極陣列收集聽覺皮層神經(jīng)信號的方式,通俗來講就是通過電極直接捕獲皮層表面的神經(jīng)信號,由于外側(cè)顳上回暴露在外側(cè)顳葉,因此可通過皮層腦電圖記錄方法獲取。”倪廣健認為,植入式電極克服了以往采用功能性核磁共振成像技術(shù)研究時不能很好探明腹側(cè)溝回等腦溝的問題。

        在這個新研究中,皮層腦電圖的高時間分辨率,能夠探測赫氏回上的初級聽覺皮層到顳上回的層次結(jié)構(gòu)與聽語音和音調(diào)數(shù)據(jù)的一致程度。

        “其從左顳平面的636個電極部位和顳上回獲取顱內(nèi)記錄,與以前的顱內(nèi)手術(shù)方法是不同的。”倪廣健解釋,以前的顱內(nèi)手術(shù)方法每次僅從這些區(qū)域中的一個區(qū)域進行零碎取樣,而此顯微手術(shù)進入外側(cè)裂可同時記錄人類聽覺皮層所有區(qū)域?qū)φZ音的高度異質(zhì)性反應。

        此外,該工作采用的高密度電極網(wǎng)格使得同時記錄人類顳葉聽覺皮層多個亞區(qū)的神經(jīng)活動成為可能,因此能夠確定聽覺信息處理的流程,以及發(fā)現(xiàn)語音信號中的線索是如何跨聽覺皮層進行映射的。

        “這種分析需要對自然語音和實驗控制的簡單聲音刺激的神經(jīng)反應進行采樣,同時對所有皮層聽覺區(qū)域進行采樣,在初級和高階聽覺區(qū)域繪制一張全面的特征編碼圖,從而能夠?qū)π畔⒘髂P秃推颖碚鬓D(zhuǎn)換進行有意義的評估。”倪廣健說。

        在這項研究中,當為參與者播放短語和句子時,位于顳上回中的某些區(qū)域的反應速度與初級聽覺皮層一樣快,這表明這兩個區(qū)域同時開始處理聲學信息。

        倪廣健介紹,該工作還進一步評估了每個區(qū)域在語音處理中的作用,探索激活的時間和順序,每個區(qū)域中簡單和復雜聲音表征的性質(zhì),以及它們在功能性和外科消融的語音理解中的因果作用。

        “植入電極的方式在大腦的其他研究領(lǐng)域中已有不少成功典范,例如腦控打字,準確率已達到90%以上;基于皮層腦電的語音重構(gòu),句子的整體準確率已達到60%;腦控機器人,解碼運動狀態(tài)實現(xiàn)機械臂的控制等等。”倪廣健表示,植入電極有助于采集到高質(zhì)量的神經(jīng)電活動,具有較高的時空分辨率,比較適合機制機理方向的研究,從而探明腦部或者神經(jīng)性系統(tǒng)疾病的成因及提供治療手段。而非侵入式技術(shù)則由于其無創(chuàng)的特點,具有更加廣泛的應用場景。(記者 陳 曦)

        關(guān)鍵詞: 并非 處理 多線程 線程

        免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據(jù)。

        最新推薦