在近日舉辦的第七屆數(shù)字中國(guó)建設(shè)峰會(huì)上,中國(guó)電信人工智能研究院宣布了一項(xiàng)技術(shù)突破,發(fā)布了業(yè)內(nèi)首個(gè)能同時(shí)識(shí)別30種方言的語(yǔ)音識(shí)別大模型——星辰超多方言語(yǔ)音識(shí)別大模型。這一創(chuàng)新技術(shù)打破了傳統(tǒng)單一模型僅能識(shí)別特定方言的限制,為語(yǔ)言文化的傳承注入了新的活力。
中國(guó)是一個(gè)語(yǔ)言多樣性極其豐富的國(guó)家,“百里不同俗,十里不同音”的現(xiàn)象十分普遍。方言作為地域文化的重要組成部分,其保護(hù)和傳承顯得尤為重要。然而,由于方言種類(lèi)繁多,語(yǔ)法語(yǔ)音特征各異,傳統(tǒng)的方言研究方式依賴(lài)大量的人力進(jìn)行主觀(guān)感知和標(biāo)注,工作量大且標(biāo)注難以系統(tǒng)化。在此背景下,AI技術(shù)的介入無(wú)疑為方言的保護(hù)和研究帶來(lái)變革。
星辰超多方言語(yǔ)音識(shí)別大模型的發(fā)布,正是基于A(yíng)I技術(shù)的高效與系統(tǒng)性對(duì)方言進(jìn)行整理歸納的重大成果。該模型不僅能同時(shí)識(shí)別包括粵語(yǔ)、上海話(huà)、四川話(huà)、溫州話(huà)等在內(nèi)的30多種方言,更在豐富性和質(zhì)量上居于行業(yè)前列。這得益于中國(guó)電信人工智能研究院構(gòu)建的超過(guò)30種、總計(jì)超過(guò)30萬(wàn)小時(shí)的高質(zhì)量方言數(shù)據(jù)庫(kù)。
在技術(shù)研發(fā)方面,中國(guó)電信的研發(fā)團(tuán)隊(duì)首創(chuàng)了“蒸餾+膨脹”聯(lián)合訓(xùn)練算法,有效解決了在超大規(guī)模多場(chǎng)景數(shù)據(jù)集和大規(guī)模參數(shù)條件下預(yù)訓(xùn)練可能出現(xiàn)的坍縮問(wèn)題。
目前,星辰語(yǔ)音大模型已在福建、江西、廣西、北京、內(nèi)蒙古等地的中國(guó)電信10000智能客服進(jìn)行試點(diǎn)應(yīng)用。通過(guò)接入星辰大模型,智能客服能夠迅速理解30種方言,日均處理電話(huà)量達(dá)到約200萬(wàn)通,極大地提高了服務(wù)效率和用戶(hù)體驗(yàn)。此外,該模型還在多個(gè)城市的12345市民服務(wù)平臺(tái)得到應(yīng)用,為市民提供更加便捷的服務(wù)。
星辰超多方言語(yǔ)音識(shí)別大模型的發(fā)布和應(yīng)用,不僅展示了AI技術(shù)在語(yǔ)言文化傳承方面的巨大潛力,也為中國(guó)電信在人工智能領(lǐng)域的研究和應(yīng)用增添了新的亮點(diǎn)。