語音播報
美國加州大學(xué)戴維斯分校團(tuán)隊開發(fā)出一種研究性腦機接口,有望幫助因神經(jīng)系統(tǒng)疾病而失去說話能力的人重新“發(fā)聲”。這項成果發(fā)表在最新一期《自然》雜志上,展示了該技術(shù)如何在人嘗試說話時,立即將大腦活動轉(zhuǎn)化為語音,從而創(chuàng)建出一種“數(shù)字聲帶”。
這項技術(shù)已在一名患有肌萎縮側(cè)索硬化癥(俗稱“漸凍癥”)的參與者身上測試成功。他通過植入式腦機接口,借助計算機與家人實時對話,不僅可以控制語調(diào),還能唱出簡單的旋律。
此前的語音腦機接口主要將神經(jīng)活動翻譯成文本,類似于發(fā)送短信,存在延遲并影響自然交流。而這種新型實時語音合成系統(tǒng)則更接近于語音通話,使用戶能夠更自然地參與對話。
新植入式腦機接口系統(tǒng)由4個微電極陣列組成,電極通過手術(shù)植入大腦中負(fù)責(zé)語音生成的區(qū)域。當(dāng)參與者試圖說話時,電極記錄下神經(jīng)元的活動,并將信號傳輸?shù)酵獠坑嬎銠C進(jìn)行解碼,最終重建語音輸出。團(tuán)隊還開發(fā)了一種新算法,能將每一時刻的大腦活動精確轉(zhuǎn)換為對應(yīng)的語音,參與者可通過調(diào)整音高來表達(dá)不同的情感或意圖,比如提問、發(fā)出感嘆或強調(diào)某個詞語。
新技術(shù)的速度非常快,從神經(jīng)信號采集到語音合成僅需1/40秒——這個延遲時間幾乎等同于人們正常說話時聽到自己聲音所需的時間。
參與者還能用該系統(tǒng)“唱”出簡短的旋律,顯示出語音合成的靈活性。聽眾對合成語音的理解率達(dá)到近60%,而在不使用該系統(tǒng)的情況下,他的語音僅能聽懂約4%。
實現(xiàn)這一過程的關(guān)鍵在于先進(jìn)的人工智能算法。通過對數(shù)百個神經(jīng)元放電模式的分析,團(tuán)隊成功地將這些模式與參與者試圖產(chǎn)生的語音同步。這使得算法能在沒有語音輸入的情況下,僅憑神經(jīng)信號就準(zhǔn)確重建他想要表達(dá)的聲音。
這項研究標(biāo)志著腦機接口技術(shù)在恢復(fù)自然語言能力方面邁出的重要一步,為因疾病或損傷而失語的人群帶來了新的希望。未來,其有望應(yīng)用于更多患者,推動神經(jīng)假體領(lǐng)域邁向更加智能化和人性化。
© 1996 - 中國科學(xué)院 版權(quán)所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標(biāo)識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機) 86 10 68597289(總值班室)
© 1996 - 中國科學(xué)院 版權(quán)所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標(biāo)識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機) 86 10 68597289(總值班室)
© 1996 - 中國科學(xué)院 版權(quán)所有
京ICP備05002857號-1京公網(wǎng)安備110402500047號
網(wǎng)站標(biāo)識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話:86 10 68597114(總機)
86 10 68597289(總值班室)