本發(fā)明涉及電子醫(yī)療器械,具體涉及到一種基于語音混合信息特征協(xié)同優(yōu)選判別的帕金森癥檢測裝置。
背景技術:
帕金森癥是一種多發(fā)于中老年的漸進性中樞神經(jīng)系統(tǒng)變性疾病,又稱巴金森氏癥或柏金遜癥,多在60歲以后發(fā)病。在帕金森癥患者中,有50%~80%的病例起病隱襲,早期難以察覺而常被忽視,因此容易造成漏診。但該病一旦形成將對患者生活造成影響。在發(fā)病早期,患者主要表現(xiàn)為功能障礙,如手指震顫、語音障礙和發(fā)音困難等。有研究表明語言功能性障礙是早期帕金森癥的典型癥狀之一,有超過90%的帕金森癥患者出現(xiàn)聲帶損傷,并伴隨有大腦語言功能區(qū)病變。研究還表明,檢測語言功能性障礙并能對其進行分級可以通過提取帕金森癥病人語音語言學參數(shù),并進行模式識別分類的方式。因此,檢測語言障礙將有助于實現(xiàn)高準確性的帕金森病早期診斷。
目前基于語音的帕金森病診斷的主流研究方法是:先提取語音特征,然后采用機器學習方法對其進行分析,實現(xiàn)分類。這些特征類型是通過語言病理學家先驗知識獲取的。其中包括了聲帶振動的基音頻率、頻率微擾、幅度微擾、諧波信噪比等。little等人最早利用基于核方法的支持向量機分類器對受試者的語音信號進行分類,revett等人建立粗糙集對帕金森病數(shù)據(jù)進行特征選擇,pei-fangguo等人利用遺傳算法進行了特征選擇分析,saker等人使用統(tǒng)計學中的集中趨勢和離差矩陣進行特征分析。上述這些研究取得了一定的分類診斷效果,大都是對特征進行優(yōu)選分析或者轉換,其缺陷是:
(1)現(xiàn)有研究大多處于理論研究階段,產(chǎn)品化較少;
(2)現(xiàn)有的各種分類算法,在分類器訓練時難以避免誤差嚴重的樣本對分類器的誤導。
技術實現(xiàn)要素:
為了解決上述問題,本發(fā)明提供一種基于語音混合信息特征協(xié)同優(yōu)選判別的帕金森癥檢測裝置,一方面將現(xiàn)有的研究算法產(chǎn)品化,另一方面,在分類器訓練時,通過樣本特征進行權值篩選,有效提高帕金森癥的真的準確性。
為實現(xiàn)上述目的,本發(fā)明所采用的具體技術方案如下:
一種基于語音混合信息特征協(xié)同優(yōu)選判別的帕金森癥檢測裝置,其關鍵在于包括:信號采集器、處理器以及結果輸出模塊;
所述信號采集器:用于獲取診斷對象的語音信息;
所述處理器:包括用于提取語音特征的特征提取模塊以及預先訓練好的分類器,通過所述分類器判斷診斷對象是否屬于帕金森癥患者;
所述結果輸出模塊:用于輸出分類器的判斷結果。
進一步地,所述處理器中的分類器按以下步驟進行預先訓練:
s1:提取樣本數(shù)據(jù)集,首先選擇m個受試者,受試者中包括帕金森患者和健康者,利用信號采集器分別采集每個受試者n個語音片段,每個語音片段采集至少一種發(fā)音內容,包括連續(xù)元音字母發(fā)音、數(shù)字發(fā)音、單詞發(fā)音和短語句發(fā)音,通過特征提取模塊從每個語音片段中提取k個特征參數(shù),從而構成樣本數(shù)據(jù)集,m、n、k均為正整數(shù);
s2:特征集變換,將同一受試者中n個語音片段所對應的k個特征參數(shù)擴展為一個n*k維的特征矩陣,然后采用留一法交叉驗證,將樣本數(shù)據(jù)集分為訓練樣本集和測試樣本集,訓練樣本對應的測試樣本集來自于不同的受試者;
s3:權重計算和特征重構,基于訓練樣本集,采用relief算法計算混合特征的權重,基于其權重大小,構造閾值,進行特征選擇,從而得到優(yōu)選后的混合特征子集;
s4:分類器訓練和測試,通過步驟s3獲得重構后的訓練樣本集與測試樣本集;設計分類器并重新對其進行訓練和測試,直到分類結果達到預設指標,訓練完成得到最終的分類器。
采用上述的技術方案,通過權重值對訓練樣本集進行篩選,對訓練樣本集進行了優(yōu)選,從而可以提取出與帕金森癥相關性大的樣本數(shù)據(jù),從而用分類器進行分類的時候,提高了分類準確性,從而提高了帕金森癥的診斷準確率。
進一步地,所述分類器為線性svm分類器、knn分類器或rf分類器。
進一步地,所述分類器為多核svm分類器。
進一步地,根據(jù)步驟s3優(yōu)選后的混合特征子集,從診斷對象中提取對應的語音片段,并采集對應的特征參數(shù),構成特征向量,輸入最終的分類器中進行分類判別,輸出測試結果。
進一步地,所述分類器采用類準確率、靈敏度以及特異度三項指標來評價其是否滿足預設條件,其中:
1)類準確率
2)靈敏度
3)特異度
其中,tp為真陽性,tn為真陰性,fp為假陽性,fn為假陰性。
進一步地,步驟s1提取樣本數(shù)據(jù)集時,選擇40個受試者,包括20個帕金森病患者,其中6個女性,14個男性,20個健康者,其中10個女性,10個男性,每個受試者分別采集到26個語音片段,然后針對每個語音片段提取出26個特征參數(shù)。
進一步地,還設置有語音引導裝置,該語音引導裝置用于輸出預設的語音片段,引導測試對象發(fā)音。通過增設語音引導裝置,將標準的語音片段預設到設備中,通過播放標準語音片段引導測試對象發(fā)音,使其臨床應用更加方便。
本發(fā)明的顯著效果是:
本發(fā)明將基于語音數(shù)據(jù)實現(xiàn)帕金森病診斷的方法進行了產(chǎn)品化實現(xiàn),在分類器訓練時,通過relief算法對語音段樣本進行了優(yōu)選,使得分類器的分類準確率,靈敏度及特異度均有提高,設備的臨床應用性強。
附圖說明
圖1為本發(fā)明實施例提供的原來框圖;
圖2為本發(fā)明實施例中分類器訓練的方法流程圖;
圖3為基于relief算法計算所得各個特征的權值關系圖;
圖4為所選特征數(shù)量與分類準確率的關系圖。
具體實施方式
為了使本發(fā)明要解決的技術問題、技術方案和優(yōu)點更加清楚,下面將結合附圖及具體實施例進行詳細描述。
如圖1所示,本實施例提供一種基于語音混合信息特征協(xié)同優(yōu)選判別的帕金森癥檢測裝置,信號采集器、處理器、存儲器、結果輸出模塊以及語音引導裝置,
所述信號采集器:通常包括麥克風和音頻信號采集模塊,用于獲取診斷對象的語音信息;
所述處理器:包括用于提取語音特征的特征提取模塊以及預先訓練好的分類器,通過所述分類器判斷診斷對象是否屬于帕金森癥患者;
所示存儲器:用于存儲訓練樣本、測試樣本以及預設的語音片段;
所述結果輸出模塊:設為顯示器輸出或語音播報輸出,用于輸出分類器的判斷結果;
所述語音引導裝置:用于輸出預設的語音片段,引導測試對象發(fā)音。
在本實施例中,語音引導裝置可以省略,臨床診斷時由醫(yī)務人員口頭引導,對應的存儲器中可以不用預先存儲語音片段,但是設置語音引導裝置后,設備的智能性和臨床應用性更強,診斷時可以直接由設備預先播報標準發(fā)音的語音片段,診斷對象跟讀設備的發(fā)音,使得語音信號采集更加標準化。
同時,如果處理器中的分類器已經(jīng)訓練好,不用重復訓練的情況下,存儲器中的訓練樣本和測試樣本可以省略,設備中直接加載訓練好的分類器即可滿足分類要求,由此以來,本發(fā)明的另一實施方式是,不設置單獨的存儲器,處理器自帶存儲功能,用于存儲已經(jīng)訓練好的分類器以及對應的特征提取算法。
如圖2所示,基于上述裝置,本發(fā)明的另一改進點在于所述處理器中的分類器訓練方式不同,在本實施例中按照以下方式進行:
s1:提取樣本數(shù)據(jù)集
本例中首先選擇40個受試者,包括20個帕金森病患者,其中6個女性,14個男性,20個健康者,其中10個女性,10個男性,利用信號采集器分別采集每個受試者26個語音片段,然后針對每個語音片段提取出26個特征參數(shù)。
采集過程中每個語音片段采集至少一種發(fā)音內容,包括連續(xù)元音字母發(fā)音、數(shù)字發(fā)音、單詞發(fā)音和短語句發(fā)音。
s2:特征集變換,將同一受試者中26個語音片段所對應的26個特征參數(shù)擴展為一個26*26維的特征矩陣,然后采用留一法交叉驗證,將樣本數(shù)據(jù)集分為訓練樣本集和測試樣本集,訓練樣本對應的測試樣本集來自于不同的受試者;
s3:權重計算和特征重構,基于訓練樣本集,采用relief算法計算混合特征的權重,基于其權重大小,構造閾值,進行特征選擇,從而得到優(yōu)選后的混合特征子集;
relief算法最早由kira提出,最初局限于兩類數(shù)據(jù)的分類問題。relief算法是一種特征權重算法(featureweightingalgorithms),根據(jù)各個特征和類別的相關性賦予特征不同的權重,權重小于某個閾值的特征將被移除。relief算法中特征和類別的相關性是基于特征對近距離樣本的區(qū)分能力。算法從訓練集d中隨機選擇一個樣本r,然后從和r同類的樣本中尋找最近鄰樣本h,稱為nearhit,從和r不同類的樣本中尋找最近鄰樣本m,稱為nearmiss,然后根據(jù)以下規(guī)則更新每個特征的權重:如果r和nearhit在某個特征上的距離小于r和nearmiss上的距離,則說明該特征對區(qū)分同類和不同類的最近鄰是有益的,則增加該特征的權重;反之,如果r和nearhit在某個特征的距離大于r和nearmiss上的距離,說明該特征對區(qū)分同類和不同類的最近鄰起負面作用,則降低該特征的權重。以上過程重復m次,最后得到各特征的平均權重。特征的權重越大,表示該特征的分類能力越強,反之,表示該特征分類能力越弱。relief算法的運行時間隨著樣本的抽樣次數(shù)m和原始特征個數(shù)n的增加線性增加,因而運行效率非常高。
s4:分類器訓練和測試,通過步驟s3獲得重構后的訓練樣本集與測試樣本集;設計分類器并重新對其進行訓練和測試,直到分類結果達到預設指標,訓練完成得到最終的分類器。
本實施例所選擇的分類器為多核svm分類器,包括一個線性核函數(shù)和一個高斯核函數(shù),作為同等替換,也可以選擇單獨的線性svm分類器、knn分類器或rf分類器。
本例中選定的線性核函數(shù)為:
在具體實施時,分類器采用類準確率、靈敏度以及特異度三項指標來評價其是否滿足預設條件,其中:
1)類準確率
2)靈敏度
3)特異度
其中,tp為真陽性,tn為真陰性,fp為假陽性,fn為假陰性。
當分類器訓練達到預設標準后,利用訓練好的分類器對測試對象進行診斷,從診斷對象中提取對應的語音片段,并采集對應的特征參數(shù),構成特征向量,輸入最終的分類器中進行分類判別,便可輸出測試結果。
在具體實施時,步驟s1中的樣本數(shù)據(jù)集也可以從現(xiàn)有的帕金森病數(shù)據(jù)庫中直接提取,比如選用little教授創(chuàng)建的數(shù)據(jù)集或sakar教授于2013年創(chuàng)建的training_data數(shù)據(jù)集,從而簡化訓練樣本和測試樣本信息的采集。
為進一步理解本發(fā)明的技術效果,接下來通過列舉具體數(shù)據(jù)做進一步說明。
本例中合并26個語音段的語音特征,形成676個新特征,組成混合特征集。
如圖3所示為混合特征權重圖。各特征權重值為所有受試者采用留一法交叉驗證后,每個受試者特征權重值線性疊加所得,橫坐標為語音段序號,縱坐標為特征序號。
權重值大的色塊的分布區(qū)域相對較為集中且數(shù)量較少,絕大部分色塊的權重值較小??梢园l(fā)現(xiàn),基于同樣的特征和不同語音段,權重差別較大。以a,b兩處色塊區(qū)域為例,其所處的特征序號為7和17。相對于第1-5個語音段來說,這兩個特征非常有效。但對于第6-9個語音段來說,這兩個特征非常差。這說明,定量分析不同語音段和特征的相互關系非常重要。結合這兩個特征和第1-5個語音段可以發(fā)現(xiàn),它們的組合形成的特征權重非常大,這說明它們之間具有很明顯的協(xié)同效應。第1-5個語音段對應的是‘a(chǎn)’,‘o’,‘u’,‘1’,‘2’,第7個特征和第17個特征的含義分別是振幅微擾‘shimmer’及基音周期標準差‘standarddeviation’。根據(jù)語音學原理可以發(fā)現(xiàn),當發(fā)這5個語音的時候,需要較好的穩(wěn)定性,而振幅微擾和周期標準差能夠較好的表征(評估)發(fā)音的穩(wěn)定性。由于帕金森病人存在發(fā)音障礙,當其在發(fā)這5個語音段時,難以保持較好的穩(wěn)定性,因此這兩個特征就能夠在此時,精確的識別其帕金森病狀態(tài),從而實現(xiàn)準確分類。
圖4為采用relief加權算法優(yōu)選后混合特征數(shù)量與分類準確率的關系圖,混合特征按權重大小排序后,取前n個特征來進行分類識別,得到分類準確率。橫坐標為優(yōu)選后混合特征數(shù)目,縱坐標為分類準確率。
由圖4可以看出,當混合特征達到20左右以后,分類準確率迅速上升到70%以上。當所選特征數(shù)目=363時,分類準確率達到最大,為82.5%。設比例系數(shù)k=所選特征數(shù)目/特征總數(shù),k=1/2,準確率為80%;k=1/4,準確率80%;k=1/6,準確率為70%;k=1/8,準確率65%??梢钥闯龌旌咸卣鲾?shù)量與分類準確率關系比較明確,但大多數(shù)情況下,分類準確率變化都比較平穩(wěn)。
進一步地,本發(fā)明與參考文獻sakarbe,isenkulme,sakarco,etal.collectionandanalysisofaparkinsonspeechdatasetwithmultipletypesofsoundrecordings.[j].ieeejournalofbiomedical&healthinformatics,2013,17(4):828-834所提出的算法進行了對比,具體如表1所示。
上述參考文獻中較好的分類結果是基于svm(線性和徑向基核函數(shù))。因此,為了公平比較,本發(fā)明與其分別進行比較。此外,該表中仍然包含了上述參考文獻的分類準確率結果。
從該表可以發(fā)現(xiàn),相較于現(xiàn)有方法,本發(fā)明取得了較為明顯的改進效果。在準確率上,本發(fā)明從67.5%提高到82.5%,改進了22%;在靈敏度上,本發(fā)明仍然保持了現(xiàn)有方法的最高水平80%;在特異度上,本發(fā)明從65%提高到85%,改進了30.8%。相較于參考文獻的結果,本發(fā)明從52%提高到82.5%,改進了58.6%,由此可見,其效果非常明顯,分類準確率,靈敏度及特異度均有顯著提高。
表1本發(fā)明分類結果對比
最后需要說明的是,上述描述為本發(fā)明的優(yōu)選實施例,本領域的普通技術人員在本發(fā)明的啟示下,在不違背本發(fā)明宗旨及權利要求的前提下,可以做出多種類似的表示,這樣的變換均落入本發(fā)明的保護范圍之內。