原標題:AI浪潮推動超千億聲紋市場落地:個人ID時代來臨
聲紋識別技術能夠在金融場景落地,與行業(yè)的積極擁抱并出臺相關標準有關——2018年中國人民銀行發(fā)布聲紋識別相關行業(yè)標準,2019年聲紋識別系統(tǒng)成為唯一一個入選金融科技產品認證目錄的生物識別技術。
繼指紋、面部、虹膜之后,聲紋作為象征我們個人ID的一部分,也陸續(xù)開啟了商用大潮。
近日,中國工商銀行開始把聲紋識別技術應用于信用卡反欺詐場景,在其位于北京、湖北、四川、山西的四家分行正式上線,在同業(yè)中率先開啟了風險管控的新模式。
聲紋識別從單純技術本身來說,在20世紀便有了相關研究和落地的探索,近年來,部分比較成熟的方案開始被境內外一些銀行系統(tǒng)采用,那是聲紋識別技術應用落地的初級階段。
真正走向成熟,核心還是依托于21世紀AI技術取得的突破。尤其是年初數(shù)月的疫情背景下,市場對這種非接觸且高準確度的技術應用需求突然放大甚至與日俱增。
據前瞻產業(yè)研究院分析,當下全球生物識別產業(yè)規(guī)模龐大,僅語音生物識別(即聲紋識別)這一細分方向的市場規(guī)模2020年有望超過1400億元人民幣(約200億美元),占整個生物識別市場的22.4%。
聲揚科技CTO陳東鵬向21世紀經濟報道記者表示,未來隨著5G、大數(shù)據、云計算等新技術發(fā)展愈發(fā)成熟、語音的入口更普及,可利用的語音數(shù)據會越來越多。聲紋識別技術有望在金融、公安、智能硬件、IoT等領域中發(fā)揮越來越重要的作用。
逐層技術演進
提到聲紋,很容易被理解為容易被模仿的聲線,其實二者不能等同。
有行業(yè)人士向記者分析道,聲紋很難被偽裝,因為其識別的內容主要包括聲帶振動頻率、聲道等特征組成的語音模型,能被偽裝的只在于口頭禪等行為特征。
“每個人說話時的音調、音色等習慣幾乎獨一無二,這些信息通過電聲學儀器測量并分析,就構成了不同的聲波頻譜,所以用聲紋來認證身份具有唯一性和穩(wěn)定性!彼m(xù)稱。
清華大學人工智能研究院聽覺智能研究中心發(fā)布的一份聲紋識別技術白皮書顯示,目前市場上主流的生物識別方案包括掌紋、虹膜、視網膜、人臉、聲紋等。從易仿冒程度來看,虹膜和視網膜是極難的,聲紋被評定為難,其余則均為一般。
基于這些背景,關于聲紋的研究其實早已有之,只是隨著底層技術的迭代,應用過程能夠更加無感,同時達到較高準確度。
陳東鵬向21世紀經濟報道記者分析道,早期的聲紋識別技術,為了節(jié)省時間并提升用戶體驗,會要求用戶念一段固定的文本,此后每次驗證都是朗讀同一段文本。
這被稱為固定文本的認證方式!暗珪斐蓛蓚問題,第一是用戶體驗不好,每次都被要求生硬地念一段文本,無法做到與用戶在自然交流中無感地完成身份認證;第二是容易被錄音攻擊,因為每次朗讀的都是同一段內容,犯罪分子有可能通過提前偷錄他人的聲音,然后通過錄音回放攻擊系統(tǒng)。”他進一步表示,這導致初期的技術落地會存在較大風險。
大約在2000年開始,聲紋識別技術進入相對成熟期,在此期間誕生了一批老牌語音廠商,科大訊飛就在其中。
前述行業(yè)人士向記者指出,這一階段的聲紋識別技術要點在于,將錄入的聲音壓縮成固定的矢量進行匹配,準確率已經能夠達到約95%的水平,不足之處在于容易因外部干擾而影響結果,因此還沒到適合商用的標準。
從2015年開始,隨著AI技術的深化,不少以該項技術為背景的創(chuàng)業(yè)公司專門投身聲紋識別領域,不僅如此,在這兩年來,BAT等巨頭也相繼在這一領域入局。
“如今聲紋識別技術的進步,得益于深度學習技術的成熟,以及傳感器、麥克風、通信信道(如5G、4G VoLTE高清通話)等技術的進步。”陳東鵬介紹道,目前聲揚科技的聲紋識別技術可以保證在高噪聲環(huán)境下聲紋識別的魯棒性、在很短時間內完成語音認證,也無需設置固定交流內容。
應用場景擴圍
雖然當前已經可以在較好體驗的情況下落地商用,但聲紋識別技術還有更長遠的路要走。
業(yè)內認為,當前階段的聲紋識別技術已經能夠滿足部分行業(yè)特定場景的應用需求,當然從商用門檻的成熟,到未來體驗的成熟,依然有很大提升空間。
對諸多生物識別技術來說都是如此。即便是目前已經十分普及到手機端的屏下指紋識別技術,歷經多年商用迭代,也依然可以在識別時間、精準度、模組大小等方面繼續(xù)優(yōu)化。
陳東鵬向記者坦言,聲紋識別技術的下一步挑戰(zhàn)主要包括兩方面:遠場識別、跨信道識別的優(yōu)化。
“雖然聲揚科技已經可以做到兩米左右這種遠場的識別,但我們的目標是做到像‘人耳’一樣,可以距離很遠就通過聲音識別人的身份!彼M一步解釋。
而所謂跨信道識別,是指早期僅能通過手機或者電腦麥克風采集信號,但未來可以進一步擴大到更多設備中。陳東鵬續(xù)稱,“現(xiàn)在還是會受信道的影響,隨著通訊技術進步、數(shù)據積累、訓練模型魯棒性更高,相信這個問題能得到更好解決。”
此次能夠在金融場景落地,也與行業(yè)的積極擁抱并出臺相關標準有關。
2014年公安部便首次針對聲紋識別的應用技術要求和安全等級制定標準,在2019年確定了關于聲紋數(shù)據庫建設、信息采集指引的細化內容。
在金融行業(yè),2018年中國人民銀行發(fā)布聲紋識別相關行業(yè)標準,2019年聲紋識別系統(tǒng)還成為唯一一個入選金融科技產品認證目錄的生物識別技術,為今天的探索落地奠定了基礎。
前文提到的銀行信用卡反欺詐場景,其應用主要是通過電話銀行,在線上辦理信用卡申請、啟卡、盡調等環(huán)節(jié)時,遠程在線建立個人聲紋ID檔案并為后續(xù)身份識別、欺詐風險判斷提供依據。
可想而知,疫情期間對于無接觸的需求突然大增,聲紋識別技術也迎來更多落地機會。陳東鵬介紹,比如門禁、電梯、回訪平臺等,都可以用到聲紋技術!拔覀冊谝咔槠陂g做了幾款相關的產品,比如聲紋門禁、遠程健康回訪系統(tǒng),這個系統(tǒng)也最先被南山粵海街道辦采用!
“聲紋的一大優(yōu)勢,是它蘊含在人們交流所需的語音當中,這些語音包含著極為豐富的個人信息,如性別、年齡、地域、環(huán)境、情緒、職業(yè)、偏好等,聲紋揭示的身份信息,是將這些個人化的信息聚集在一起的中心點,這將是很多行業(yè)提供‘以用戶為中心’服務所必須掌握的!彼绱丝偨Y道。
(作者:駱軼琪 編輯:李清宇)