獨(dú)立成分分析(ICA)已經(jīng)廣泛應(yīng)用于腦成像數(shù)據(jù)分析。與廣泛使用的一般線性模型(GLM)不同,后者要求使用者對(duì)數(shù)據(jù)設(shè)定相應(yīng)的參數(shù)(例如,大腦對(duì)刺激的反應(yīng)),獨(dú)立成分分析(ICA)依賴(lài)于一般的獨(dú)立性假設(shè),允許使用者對(duì)反應(yīng)的確切形式不可知。此外,ICA本質(zhì)上是一種多變量的方法,因此每個(gè)成分將大腦活動(dòng)分組到共享相同反應(yīng)模式的區(qū)域,從而提供功能連接的自然度量。目前已經(jīng)提出了多種獨(dú)立成分分析方法,本文主要討論兩種不同的方法。本文的第一部分回顧了ICA在fMRI組水平推斷(group inferences)的應(yīng)用。作者概述了當(dāng)前利用ICA進(jìn)行群體推理的方法,重點(diǎn)介紹了GIFT軟件中實(shí)現(xiàn)的組水平ICA方法。本文的第二部分,作者將概述ICA在組合或融合多模態(tài)數(shù)據(jù)方面的應(yīng)用。ICA在多任務(wù)或多模態(tài)數(shù)據(jù)的數(shù)據(jù)融合方面特別有用,例如單核苷酸多態(tài)性(single
nucleotide polymorphism,SNP)數(shù)據(jù)或事件相關(guān)電位(ERP)。文中通過(guò)大量實(shí)例證明,ICA是研究大腦的一種功能強(qiáng)大、用途廣泛的數(shù)據(jù)驅(qū)動(dòng)方法。文章較早發(fā)表在Neuroimage雜志。希望可以溫故而知新。
關(guān)鍵詞——fMRI SNP ERP 遺傳學(xué) 獨(dú)立成分分析
【引言和背景】
獨(dú)立成分分析(ICA)越來(lái)越多地被用作評(píng)估腦成像數(shù)據(jù)中隱含的時(shí)間與空間上的架構(gòu)。此文首先對(duì)ICA和ICA在功能磁共振成像(fMRI)數(shù)據(jù)中的應(yīng)用進(jìn)行了簡(jiǎn)要概述。接下來(lái)將討論ICA和ICA的數(shù)據(jù)融合,重點(diǎn)是在作者組內(nèi)開(kāi)發(fā)的方法,并在更大的范圍內(nèi)討論目前正在使用的許多替代方法。
獨(dú)立成分分析(ICA)是用在一組數(shù)據(jù)中發(fā)現(xiàn)隱藏的因素(源或特征)的一種統(tǒng)計(jì)方法,可以使信號(hào)源在最大程度地獨(dú)立出來(lái)。它假設(shè)一個(gè)生成模型,其中觀測(cè)值被假定為獨(dú)立源的線性混合,并且與只對(duì)數(shù)據(jù)進(jìn)行不相關(guān)的主成分分析(PCA)不同,ICA使用高階統(tǒng)計(jì)量來(lái)實(shí)現(xiàn)數(shù)據(jù)來(lái)源的獨(dú)立性。不相關(guān)只是獨(dú)立性的一部分,如果兩個(gè)隨機(jī)變量是獨(dú)立的,則它們是不相關(guān)的,但并非所有不相關(guān)的隨機(jī)變量都是獨(dú)立的。直觀示例可以通過(guò)兩個(gè)獨(dú)立信號(hào)s1和s2的映射圖給出。圖1a(左、中)分別顯示了s1和s2的線性混合的PCA和ICA的投影,圖1a(右)示出了散點(diǎn)圖中兩個(gè)獨(dú)立信號(hào)(s1,s2)的圖。PCA能找到正交向量u1,u2,但無(wú)法識(shí)別獨(dú)立向量。相比之下,ICA能夠找到線性混合信號(hào)(s1,s2)的獨(dú)立向量a1、a2,進(jìn)而恢復(fù)原始信號(hào)源。
傳統(tǒng)的ICA模型假設(shè)源信號(hào)是不可觀測(cè)的、統(tǒng)計(jì)上獨(dú)立的、非高斯的,具有未知的線性混合過(guò)程。考慮觀察到的M維隨機(jī)向量:x=[x1,x2,…,xM]T,它由ICA模型生成:
圖1(a)說(shuō)明對(duì)高階統(tǒng)計(jì)量的需求:主成分分析(PCA)識(shí)別捕獲最大方差(二階統(tǒng)計(jì)量)的正交方向,而ICA使用高階統(tǒng)計(jì)量找到最大獨(dú)立方向;
(b) GLM和空間ICA對(duì)fMRI數(shù)據(jù)的比較:GLM要求在設(shè)計(jì)矩陣中指定時(shí)間模型,而ICA通過(guò)最大化組件圖像之間的獨(dú)立性來(lái)估計(jì)數(shù)據(jù)的時(shí)間過(guò)程;
(c)fMRI的空間ICA說(shuō)明:fMRI數(shù)據(jù)假定為是由一些線性混合的源構(gòu)成。
由于獨(dú)立成分分析需要二階以上的統(tǒng)計(jì)信息,因此可以使用非線性函數(shù)生成或顯式計(jì)算。使用非線性函數(shù)生成高階統(tǒng)計(jì)量的算法是最常用的ICA方法,并且有許多算法是基于最大似然估計(jì),最大信息傳遞性,互信息的最小化和非高斯性的最大化得出的。前三種方法相互等價(jià),當(dāng)分解矩陣W被約束為正交時(shí),它們與非高斯性的最大化一致。當(dāng)每個(gè)算法中的非線性被選擇來(lái)匹配源密度時(shí),這些公式中的算法在相似性下具有最佳的大樣本特性。在這些公式中導(dǎo)出的兩個(gè)常用的ICA算法是Infomax和FastICA(Hyvarinen和Oja,1997)。另一個(gè)流行的算法是特征矩陣的聯(lián)合近似對(duì)角化(JADE),它基于四階統(tǒng)計(jì)信息的顯式計(jì)算。Infomax和FastICA通常使用固定的非線性或從小數(shù)據(jù)集中選擇的非線性部分。這些算法通常適用于對(duì)稱(chēng)分布,而對(duì)于偏側(cè)分布和近似高斯分布的源,則精度較低。由于最優(yōu)性條件要求非線性與源分布的形式相匹配,因此有許多自適應(yīng)策略被開(kāi)發(fā)出來(lái)。Choi還介紹了一種使用廣義高斯密度模型方法的靈活ICA。ICA的其他靈活擴(kuò)展包括非參數(shù)ICA以及Hong和Vlassis等人中引入的kernel ICA。近年來(lái)各種各樣的ICA方法及其在生物醫(yī)學(xué)、天體物理學(xué)和通信等領(lǐng)域的應(yīng)用表明了這一領(lǐng)域研究的活力。
【fMRI(功能磁共振數(shù)據(jù))的ICA】
自McKeown在1998首次應(yīng)用于功能磁共振成像后,ICA已經(jīng)成功地應(yīng)用于大量功能磁共振成像應(yīng)用中,尤其是在那些使用標(biāo)準(zhǔn)回歸類(lèi)型方法證明具有挑戰(zhàn)性的例子中。空間ICA可以發(fā)現(xiàn)系統(tǒng)的非重疊且在時(shí)間上一致的大腦區(qū)域,而不受時(shí)間響應(yīng)模態(tài)的限制。許多功能磁共振成像實(shí)驗(yàn)的時(shí)間動(dòng)力學(xué)很難用功能磁共振成像來(lái)研究,因?yàn)槿狈σ粋€(gè)很好理解的腦激活模型,而ICA可以揭示被試者之間和事件間的時(shí)間動(dòng)態(tài)差異。它的一個(gè)優(yōu)點(diǎn)是能夠提示動(dòng)力學(xué)變化而單純的時(shí)間模型(例如GLM模型)不可以。圖1表示了應(yīng)用于fMRI分析的GLM方法和ICA的比較。
獨(dú)立成分分析的方法一般可以分為空間ICA和時(shí)間ICA。在功能磁共振成像中的應(yīng)用大多采用前一種方法,尋找空間上最大獨(dú)立的成分。在這種情況下,我們讓觀測(cè)數(shù)據(jù)矩陣為X,一個(gè) N×M矩陣(其中N是時(shí)間點(diǎn)的數(shù)目,M是體素的數(shù)目),如圖1b所示。fMRI成分分析的目的是將數(shù)據(jù)矩陣分解成一組時(shí)間序列和一組空間模式的乘積。圖1c顯示了ICA如何將數(shù)據(jù)分解為圖像和時(shí)間序列的簡(jiǎn)潔摘要的說(shuō)明。成分的數(shù)量是一個(gè)自由參數(shù),之前已根據(jù)經(jīng)驗(yàn)確定或估計(jì)。使用信息論方法估計(jì)組件數(shù)量有多種方法。
自從ICA用于功能磁共振成像分析以來(lái),空間或時(shí)間獨(dú)立性的選擇一直存在爭(zhēng)議。然而,這兩個(gè)選項(xiàng)只是兩個(gè)不同的建模假設(shè)。McKeown等人認(rèn)為典型認(rèn)知激活范式空間模式的稀疏分布特性可以很好地與空間ICA(sICA)相結(jié)合。此外,由于原型-典型的混雜也是稀疏和局部的,例如,血管搏動(dòng)(信號(hào)定位到因心臟搏動(dòng)而移動(dòng)的大靜脈)或呼吸誘發(fā)的運(yùn)動(dòng)(信號(hào)局限于不連續(xù)處附近的強(qiáng)組織對(duì)比度:“組織邊緣”),具有稀疏先驗(yàn)的Infomax算法非常適合于空間分析,并且也被用于基于時(shí)間ICA的基于相關(guān)的算法。Stone等人提出了一種試圖最大化空間和時(shí)間獨(dú)立性的方法。Seifritz等人致力于空間和時(shí)間ICA的組合。2002年他們使用初始sICA通過(guò)定位感興趣的區(qū)域來(lái)減少數(shù)據(jù)的空間維度,然后在該區(qū)域中進(jìn)行時(shí)間ICA,以更詳細(xì)地研究聽(tīng)覺(jué)皮層中重要事件響應(yīng)的結(jié)構(gòu)。
【fMR在組水平上的ICA】
與單變量方法(如回歸分析、Kolmogorov–Smirnov統(tǒng)計(jì))不同,ICA通常不會(huì)泛化為適用于對(duì)被試群體進(jìn)行推斷的方法。例如,當(dāng)使用一般的線性模型時(shí),研究者會(huì)指定感興趣的回歸因子,因此對(duì)群體數(shù)據(jù)進(jìn)行推斷是自然而然的,因?yàn)槿后w中的所有個(gè)體都共享相同的回歸因子。相比之下,在ICA中,組中不同的個(gè)體將有不同的時(shí)間序列,并且他們的排序也會(huì)不同,因此,如何使用ICA對(duì)群體數(shù)據(jù)進(jìn)行推斷目前還不清楚。盡管如此,目前已經(jīng)提出了幾種獨(dú)立成分分析多被試分析方法。不同的方法在ICA分析之前如何組織數(shù)據(jù)、可用的輸出類(lèi)型(例如單個(gè)被試者貢獻(xiàn)、組平均值等)以及如何進(jìn)行統(tǒng)計(jì)推斷方面存在差異。
圖2中提供了一些組水平ICA方法的概要。方法可分為五類(lèi)。圖2a顯示了執(zhí)行單個(gè)被試體ICA,然后嘗試通過(guò)使用諸如聚類(lèi)或空間相關(guān)性的方法將輸出組合到post hoc中的方法。這樣做的優(yōu)點(diǎn)是考慮不同的空間和時(shí)間特征,但缺點(diǎn)是,由于數(shù)據(jù)是有噪聲的,因此對(duì)于每個(gè)被試體,成分不一定以相同的方式分離。另外四種方法是直接根據(jù)組水平的數(shù)據(jù)計(jì)算ICA。圖2b中的時(shí)間連接和圖2c中的空間連接都被檢驗(yàn)過(guò)。這些方法的優(yōu)點(diǎn)是它們執(zhí)行一個(gè)ICA,然后可以將ICA劃分為特定于被試的部分,因此比較組水平的被試差異非常簡(jiǎn)單。時(shí)間連接方法允許每個(gè)被試體具有唯一的時(shí)間序列,但是假設(shè)使用公共組映射,而空間連接方法允許使用唯一的映射,但是假設(shè)使用統(tǒng)一的時(shí)間序列。雖然時(shí)間串聯(lián)實(shí)際上只是兩種不同的數(shù)據(jù)組織方法,但時(shí)間串聯(lián)似乎對(duì)功能磁共振成像數(shù)據(jù)效果更好,很可能是因?yàn)楣δ艽殴舱癯上裥盘?hào)的時(shí)間變化比空間變化大得多,因而已經(jīng)被廣泛用于fMRI數(shù)據(jù)的組水平獨(dú)立成分分析。
在MELODIC軟件以及 GIFT Matlab軟件(http://ictab.sourceforge.net/)中實(shí)現(xiàn)了時(shí)間連接方法。GIFT軟件還實(shí)現(xiàn)了一個(gè)反向重建步驟,生成特定被試體的圖像。這使得可以比較一組或多組的時(shí)間序列和圖像的仿真,其中顯示具有時(shí)間連接和反向重建的ICA可以捕捉特定圖像中的變化。因此,在GIFT中實(shí)現(xiàn)的方法在使用通用的空間地圖模型和合并單個(gè)被試ICA之間進(jìn)行了權(quán)衡。中間的方法是為每個(gè)組分別使用時(shí)間連接,盡管在這種情況下,需要再次對(duì)組件進(jìn)行事后匹配。圖2d中的方法涉及在執(zhí)行ICA之前對(duì)數(shù)據(jù)求平均值。這種方法的計(jì)算要求較低,但要求更嚴(yán)格的假設(shè),即需要一個(gè)共同的時(shí)間序列和一個(gè)共同的空間。最后,圖2e中的張量法(在MELODIC中實(shí)現(xiàn))涉及估計(jì)每個(gè)組件的公共時(shí)間序列和公共圖像,但允許估計(jì)被試的特定參數(shù)。
圖2.幾種成組ICA方法:比較5種分組ICA方法和將這些方法作為主管道實(shí)現(xiàn)的一些軟件包。
a)單獨(dú)的ICA分析在每個(gè)被試上運(yùn)行,然后進(jìn)行相關(guān)或聚類(lèi)以啟用組干擾,
b)時(shí)間連接然后聚合ICA分析是一種流行的方法,它還可以包括一個(gè)反向重建步驟來(lái)計(jì)算單個(gè)被試空間和時(shí)間過(guò)程,
c)空間連接或d)預(yù)平均先驗(yàn)對(duì)ICA也有人提議。最后,基于張量的方法將數(shù)據(jù)堆疊成一個(gè)立方體。
高階張量分解(也稱(chēng)為多維、多階或n階)最近備受關(guān)注,盡管它們對(duì)單組和多組fMRI數(shù)據(jù)的適應(yīng)性仍在探索之中。圖2e表示了一種基于三維張量的方法,該方法被開(kāi)發(fā)用于估計(jì)每個(gè)成分的單個(gè)空間、時(shí)間和特定于被試的“模式”,以嘗試在估計(jì)階段捕獲數(shù)據(jù)的多維結(jié)構(gòu)(Beckmann和Smith,2005)。然而,如果被試之間的時(shí)間序列不同,例如在靜息狀態(tài)研究中,這種方法可能無(wú)法很好地工作(沒(méi)有額外的預(yù)處理)。近期的一篇論文中詳細(xì)比較了幾種組ICA方法,包括時(shí)間連接和張量ICA。
在文中的剩余部分中,作者重點(diǎn)討論在GIFT軟件(Calhoun等人,2001b)中實(shí)現(xiàn)的組水平ICA方法,該方法使用數(shù)據(jù)連接后的多個(gè)數(shù)據(jù)簡(jiǎn)化步驟來(lái)減少計(jì)算量,并根據(jù)ICA估計(jì)對(duì)單個(gè)空間和時(shí)間序列進(jìn)行反向重建和統(tǒng)計(jì)比較。圖3(來(lái)自Calhoun等人,2001b)中給出了九名被試執(zhí)行四個(gè)周期交替左/右視覺(jué)刺激任務(wù)的實(shí)例組ICA分析。左側(cè)和右側(cè)視覺(jué)皮層的主要視覺(jué)區(qū)域的獨(dú)立成分(分別用紅色和藍(lán)色表示)與適當(dāng)?shù)拇碳ひ恢?。一個(gè)大的區(qū)域(用綠色描繪)包括枕部區(qū)域并延伸到頂葉區(qū)域,似乎對(duì)視覺(jué)刺激的變化很敏感。此外,一些視覺(jué)關(guān)聯(lián)區(qū)域(用白色表示)有與任務(wù)無(wú)關(guān)的時(shí)間序列。正如我們稍后討論的,可以通過(guò)對(duì)ICA圖像或時(shí)間序列執(zhí)行統(tǒng)計(jì)來(lái)執(zhí)行組推斷或組比較。
圖3。fMRI組水平ICA結(jié)果(來(lái)自Calhoun等人,2001b):ICA識(shí)別出空間上不同的時(shí)間相干網(wǎng)絡(luò)。在一個(gè)相對(duì)簡(jiǎn)單的視覺(jué)刺激范式中,ICA識(shí)別出強(qiáng)烈的任務(wù)相關(guān)網(wǎng)絡(luò)(藍(lán)色、紅色)以及短暫和非任務(wù)相關(guān)網(wǎng)絡(luò)(綠色、白色、粉色)
【用于數(shù)據(jù)融合的ICA】
許多研究目前正在收集來(lái)自同一批被試的多種類(lèi)型的成像數(shù)據(jù)。每種成像方法都報(bào)告一個(gè)有限的域,通常提供有關(guān)問(wèn)題的普遍而又獨(dú)特的信息。成像數(shù)據(jù)結(jié)合的方法可以概括為:一端在分析頻譜上進(jìn)元分析(高度精煉)檢查收斂,另一端進(jìn)行大尺度(高度展開(kāi))計(jì)算建模。而介于兩者之間的是嘗試執(zhí)行直接數(shù)據(jù)融合的方法。一種很有前景的數(shù)據(jù)融合方法是先單獨(dú)對(duì)每種圖像類(lèi)型進(jìn)行處理,然后從不同的模式中提取特征。再在組層面上檢查這些特征在不同數(shù)據(jù)之間的關(guān)系(即個(gè)體之間或患者與對(duì)照之間的變化)。這種方法允許我們利用數(shù)據(jù)類(lèi)型之間的“交叉”信息,并且在執(zhí)行多模式融合時(shí),在不同的數(shù)據(jù)類(lèi)型之間提供了一個(gè)自然的鏈接。
執(zhí)行數(shù)據(jù)融合的一組自然工具包括將數(shù)據(jù)矩陣轉(zhuǎn)換為更小的模式或組件集的工具。這些方法包括基于奇異值分解(SVD)的方法(Friston等人,1996;McIntosh等人,1996)以及ICA的方法(McKeown等人,1998)。與基于方差的SVD或PCA方法相比,ICA的一個(gè)優(yōu)點(diǎn)是使用高階統(tǒng)計(jì)量來(lái)揭示隱藏的結(jié)構(gòu)。本文介紹了兩種數(shù)據(jù)融合方法:聯(lián)合ICA和并行ICA。我們展示兩個(gè)例子,第一個(gè)涉及事件相關(guān)電位(ERP)和功能磁共振成像數(shù)據(jù),第二個(gè)涉及功能磁共振成像和基因數(shù)據(jù)。
【理論與實(shí)施】
在本節(jié)中,我們將回顧組水平ICA(group ICA)、串聯(lián)ICA(joint ICA)和并行ICA(parallel ICA)背后的方法。
功能磁共振組水平的ICA
如前所述,在GIFT中實(shí)現(xiàn)的group ICA方法包含時(shí)間連接和反向重建。圖4(頂部)提供了GIFT方法的圖形表示,該方法主要涉及估計(jì)混合矩陣,該矩陣具有每個(gè)對(duì)象獨(dú)立的分區(qū)。一旦混合矩陣被估計(jì)出來(lái),就可以通過(guò)將單個(gè)對(duì)象的數(shù)據(jù)投影到與該對(duì)象相對(duì)應(yīng)的混合矩陣分區(qū)的逆上來(lái)計(jì)算每個(gè)對(duì)象的成分映射。最后,這提供了特定主題的時(shí)間進(jìn)程和圖像,可以用來(lái)進(jìn)行群體和群體間的推斷。
需要考慮的另一個(gè)方面是,GIFT通常使用PCA執(zhí)行多個(gè)數(shù)據(jù)縮減步驟,主要是出于計(jì)算原因,以減少所需的內(nèi)存量。用數(shù)學(xué)方法來(lái)說(shuō),我們假設(shè)Xi=Fi-1 Yi作為被試i的L×V簡(jiǎn)化數(shù)據(jù)矩陣,Yi是K×V的數(shù)據(jù)矩陣(包含預(yù)處理和空間標(biāo)準(zhǔn)化數(shù)據(jù)), Fi-1為L×K的還原矩陣(由PVC 確定),V代表體素?cái)?shù)量,K表示fMRI時(shí)間點(diǎn)數(shù),L是還原反應(yīng)后的時(shí)間維度的大小。所有被試的簡(jiǎn)化數(shù)據(jù)被連接到一個(gè)矩陣中,并使用PCA將其簡(jiǎn)化為N維(需要估算的成分?jǐn)?shù))。LM×V減小,被試M的連接矩陣為:
其中G-1是N×LM的簡(jiǎn)約矩陣(也由PCA分解確定),在右邊乘以M個(gè)被試的LM×V連續(xù)數(shù)據(jù)矩陣。根據(jù)ICA估計(jì),我們可以寫(xiě)成X=AS,A表示N×N混合矩陣,S表示N×V成分圖。將X的表達(dá)式代入公式(3)兩邊同時(shí)乘以G,就會(huì)得到公式(4)
圖4:GIFT軟件中Group ICA應(yīng)用的圖像說(shuō)明:在GIFT中將Group ICA合并了時(shí)序連接和反向重建步驟來(lái)生成單個(gè)被試的成像和時(shí)間序列。再將單個(gè)被試的數(shù)據(jù)投射到混合矩陣的特定分區(qū)上,進(jìn)而計(jì)算出相應(yīng)的單被試成分圖像。這些成分中哪些是感興趣的取決于研究的問(wèn)題,可利用成分圖像或時(shí)間序列的比較得出。Group ICA支持對(duì)成分圖像進(jìn)行體素測(cè)試或?qū)⒛P蛿M合到成分時(shí)間序列。
根據(jù)被試對(duì)矩陣G進(jìn)行分區(qū)得到了以下表達(dá)式:
然后作者通過(guò)只處理上述矩陣的劃分i中的元素來(lái)寫(xiě)出被試i的方程:
公式.(6)中的矩陣Si包含了被試 i的單被試圖像,由下式計(jì)算:將Eq.(6)的兩邊同時(shí)乘以Fi,得到:
提供來(lái)自被試i的數(shù)據(jù)的ICA分解,包含在矩陣Yi中。N×V矩陣Si包含N個(gè)源圖像,K×N矩陣FiGiA是單被試混合矩陣,包含N個(gè)分量的每個(gè)分量的時(shí)間序列。
通過(guò)分析被試的具體時(shí)間序列和空間圖,可以進(jìn)行Group inferences。圖4(底部)將這些分析分為三個(gè)主要方面。要從統(tǒng)計(jì)學(xué)上評(píng)估給定成分的空間屬性,可以對(duì)空間圖進(jìn)行體素測(cè)試(Fig. 4; bottom left)。時(shí)間序列可以通過(guò)擬合一個(gè)GLM來(lái)分析(與GLM分析使用的模型相同;例如,多元回歸),而不是擬合到體素的數(shù)據(jù),ICA的時(shí)間序列是因變量。然后,估計(jì)的參數(shù)可以進(jìn)入第二個(gè)層次的統(tǒng)計(jì)分析,以推斷出每個(gè)成分被給定的刺激影響了多少,是否一個(gè)成分被一個(gè)刺激影響得更多,是否一組比另一組表現(xiàn)出更強(qiáng)的任務(wù)調(diào)制,等等。這為推斷成分提供了一種強(qiáng)大的方法。最后,人們可能對(duì)與任務(wù)無(wú)關(guān)的成分(或處于靜息狀態(tài)研究中的成分)感興趣。在這種情況下,我們可以評(píng)估組間光譜功率的差異或計(jì)算額外的參數(shù),如被試分量時(shí)間序列的分形維數(shù)。
串行和并行ICA
接下來(lái),我們將介紹兩種使用ICA來(lái)執(zhí)行數(shù)據(jù)融合的方法,聯(lián)合獨(dú)立成分分析和并行獨(dú)立成分分析(這兩種方法都在基于Matlab的Fusion ICA分析工具箱中實(shí)現(xiàn))。
Joint ICA
Joint ICA使我們能夠同時(shí)分析在同一組被試中收集到的多種模式數(shù)據(jù)的方法。在我們的開(kāi)發(fā)中,我們主要考慮從每個(gè)被試的數(shù)據(jù)中提取的一組特征,這些數(shù)據(jù)在我們的組數(shù)據(jù)集中形成了垂直維度的多個(gè)觀察值。給定兩組數(shù)據(jù)(可以多于兩組,為了簡(jiǎn)單起見(jiàn),我們首先考慮兩組),XF和XG,我們將這兩個(gè)數(shù)據(jù)集連結(jié)起來(lái)形成XJ,將其似然寫(xiě)成
其中uJ=WxJ。我們用隨機(jī)變量來(lái)表示,這樣向量uJ和xJ中的每一項(xiàng)都對(duì)應(yīng)一個(gè)隨機(jī)變量,它被替換為每個(gè)樣本n=1,,N作為矩陣uJ和xJ的行。當(dāng)提出一個(gè)極大似然問(wèn)題時(shí),我們估計(jì)一個(gè)聯(lián)合解混合矩陣W,使其似然L(W)最大化。
假設(shè)這兩個(gè)數(shù)據(jù)集XF和XG的維數(shù)是N×V1和N×V2,那么我們有
根據(jù)所討論的數(shù)據(jù)類(lèi)型,上面的公式可以變得靈活地變化。
這個(gè)公式描述了基本的jICA(串行ICA)方法,并假設(shè)與這兩種數(shù)據(jù)類(lèi)型(F和G)相關(guān)聯(lián)的源以相同的方式跨N個(gè)被試進(jìn)行調(diào)制(見(jiàn)圖5)。兩種模態(tài)都具有相同的線性協(xié)變量的假設(shè),它具有提供一種簡(jiǎn)化方法來(lái)鏈接多個(gè)數(shù)據(jù)類(lèi)型的優(yōu)點(diǎn),并且在各種情況下都得到了有意義的結(jié)果的證明。有不同的方法來(lái)改變上述公式中的假設(shè),如不限制兩種類(lèi)型的源具有相同的混合系數(shù),例如為了在N個(gè)樣本中有相同的調(diào)制,我們可以要求來(lái)自兩種數(shù)據(jù)類(lèi)型的源的樣本中調(diào)制的形式是相關(guān)的,但不一定是相同的。下面我們將討論的方法稱(chēng)為并行ICA,它在建模中提供了這種額外的靈活性。
圖5:串行ICA和平行ICA模型圖解:Joint ICA(左) 假設(shè)這兩種模式有一個(gè)共同的貢獻(xiàn)矩陣。Parallel ICA(右)使用兩種模式的被試簡(jiǎn)況之間的相關(guān)性更新獨(dú)立的ICA進(jìn)程
圖6自然駕駛(Naturalistic driving)(來(lái)自Calhoun et al., 2002):在模擬駕駛(simulated driving)中識(shí)別出多個(gè)網(wǎng)絡(luò)。ICA使我們能夠研究在自然任務(wù)中發(fā)生的復(fù)雜和重疊的動(dòng)態(tài)網(wǎng)絡(luò)
Parallel ICA
如前所述,可以通過(guò)多種方式改變jICA框架強(qiáng)制規(guī)范化,以便在估算成分過(guò)程中有更高的靈活性。作者還開(kāi)發(fā)的一種方法叫做并行獨(dú)立成分分析(paraICA)。作為一個(gè)研究整合兩種成像方式數(shù)據(jù)的框架,該方法通過(guò)增強(qiáng)內(nèi)在的相互關(guān)系來(lái)識(shí)別兩種成像方式的組成成分以及它們之間的聯(lián)系(見(jiàn)圖. 5b)。目前已經(jīng)應(yīng)用這種方法連接fMRI/ERP數(shù)據(jù)以及fMRI和遺傳數(shù)據(jù)。結(jié)果表明,paraICA提供了穩(wěn)定的結(jié)果,能夠較準(zhǔn)確地識(shí)別出連接成分。
在對(duì)paraICA的最初應(yīng)用中,作者定義基因獨(dú)立成分為一個(gè)特定的SNP關(guān)聯(lián),即一組SNPs有不同程度的貢獻(xiàn),部分決定了一個(gè)特定的表型或內(nèi)表型。這種關(guān)聯(lián)可以被建模為SNP基因型的線性組合
其中,snp是一個(gè)給定位點(diǎn)上的基因型而β是一個(gè)SNP對(duì)基因關(guān)聯(lián)的貢獻(xiàn)。除了獨(dú)立分量之外,權(quán)重本身也是值得關(guān)注的,其中隱含了影響因素和類(lèi)型,即抑制或興奮的表現(xiàn)型。假設(shè)367個(gè)SNP中每個(gè)成分都有獨(dú)立的分布模式,作者用被試SNP的方向構(gòu)建了SNP數(shù)據(jù)矩陣X。混合過(guò)程在公式12中給出。
其中,n為被試的人數(shù),m為組成部分的數(shù)量。xsi是一個(gè)有367個(gè)SNP基因型的載體。ssi是一個(gè)基因組分的367個(gè)SNP權(quán)重的載體。As為加載參數(shù)的矩陣,表示SNP各成分對(duì)參與者的影響。
在目前的公式,大腦功能之間的關(guān)系和計(jì)算遺傳因素之間的相關(guān)性fMRI Af的列矩陣和SNP矩陣(此處也可以使用其他標(biāo)準(zhǔn),如互信息定義,識(shí)別之間非線性耦合功能磁共振成像和SNP數(shù)據(jù))。從而得到了相關(guān)項(xiàng)和基于熵的最大化函數(shù)。平行ICA的過(guò)程如圖5b所示,其中數(shù)據(jù)1為fMRI數(shù)據(jù),數(shù)據(jù)2為SNP數(shù)據(jù)。該算法繼續(xù)進(jìn)行,使得兩個(gè)分層矩陣W分別矯正,在此期間,從每個(gè)模態(tài)選擇具有最高相關(guān)性的分量,并使用適當(dāng)?shù)耐V箺l件,根據(jù)相關(guān)值修改分層矩陣的矯正。
【實(shí)例】
作者在這節(jié)中舉例說(shuō)明先前使用組獨(dú)立分析方法、聯(lián)合獨(dú)立分析方法和并行獨(dú)立分析方法的結(jié)果。第一個(gè)例子是對(duì)模擬駕駛模式的分析,在這種情況下ICA特別有效,因?yàn)樗且豁?xiàng)很難在傳統(tǒng)的GLM分析中參數(shù)化的自然任務(wù)。通過(guò)10分鐘的范式收集了15名受試者的fMRI數(shù)據(jù),交替進(jìn)行1分鐘的注視點(diǎn)、模擬駕駛和觀看。首先分析ICA時(shí)間序列來(lái)評(píng)估任務(wù)相關(guān)性。六個(gè)成分被識(shí)別并進(jìn)入體素的單樣本t檢驗(yàn)。共有六個(gè)成分顯示對(duì)模擬駕駛不同的動(dòng)態(tài)響應(yīng)。在這種情況下,ICA是一種非常強(qiáng)大的分析方法,作者用它開(kāi)發(fā)一個(gè)模擬駕駛的神經(jīng)關(guān)聯(lián)模型,該模型與基于行為數(shù)據(jù)的現(xiàn)有模型很好地關(guān)聯(lián)(圖6)。
作者給出的第二個(gè)例子是對(duì)患者和健康對(duì)照組聽(tīng)覺(jué)異常任務(wù)收集的fMRI數(shù)據(jù)的分析。將反向重構(gòu)的成分圖導(dǎo)入兩個(gè)樣本t檢驗(yàn),以評(píng)估三組之間的兩兩差異。結(jié)果顯示每組兩個(gè)組成部分,一個(gè)在顳葉和默認(rèn)模式網(wǎng)絡(luò)(圖7左)。還進(jìn)行了包括目標(biāo)、新刺激和標(biāo)準(zhǔn)刺激在內(nèi)的多元回歸,估計(jì)beta參數(shù)的平均值如圖7右所示。利用這些結(jié)果可以準(zhǔn)確區(qū)分健康對(duì)照、精神分裂癥患者和雙相情感障礙患者。這個(gè)例子說(shuō)明了組水平上ICA區(qū)分組別的能力,也可以顯示空間圖和時(shí)程圖的比較。
圖 7:對(duì)照組、精神分裂癥組和雙相障礙組的兩兩比較(from Calhoun et al., 2008):采用雙樣本t檢驗(yàn)來(lái)說(shuō)明每個(gè)兩兩比較的最顯著差異(左)。注意,這些圖是由所有被試生成的,由于采用了leave-1-out方法,實(shí)際的分類(lèi)區(qū)域?qū)⒙杂胁煌?。右邊是分組刺激的平均beta權(quán)重。
下一個(gè)例子涉及使用joint ICA的ERP和fMRI數(shù)據(jù)的融合。fMRI數(shù)據(jù)和64通道ERP數(shù)據(jù)被錄入聯(lián)合ICA分析。不僅提供了ERP的時(shí)間剖面圖和fMRI的空間剖面圖, ERP數(shù)據(jù)的地形圖也解釋提供了額外的信息(圖8)。作者在此基礎(chǔ)上還開(kāi)發(fā)了一種并行空間和時(shí)間獨(dú)立成分分析方法,用于并行多被試單試驗(yàn)?zāi)X電圖-功能磁共振成像,解決了兩種模式的混合問(wèn)題,并通過(guò)對(duì)恢復(fù)的功能磁共振成像圖和腦電圖時(shí)程的試驗(yàn)-試驗(yàn)調(diào)制的相關(guān)性來(lái)整合數(shù)據(jù)。該方法提供對(duì)應(yīng)于聽(tīng)覺(jué)起始響應(yīng)和隨后的低水平定向/改變檢測(cè)的先前錯(cuò)過(guò)的時(shí)間序列的提取。
圖8:ERP和fMRI數(shù)據(jù)的融合(from Eichele et al., 2008);EEG-TIC1標(biāo)準(zhǔn)期和目標(biāo)期腦電的時(shí)程和地形圖,以及它們之間的差異波。對(duì)差異波進(jìn)行逐點(diǎn)單樣本t檢驗(yàn),黑點(diǎn)表示時(shí)間框架,在p<.05處與零有顯著差異,Bonferroni校正512次測(cè)試(t>6.93)。雙側(cè)顳葉激活連接的fMRI成分顯示在表面(右上)。下半部分中的其他部分說(shuō)明了整個(gè)空間模式。該圖譜的閾值為錯(cuò)誤發(fā)現(xiàn)率1%,聚類(lèi)范圍為5個(gè)體素。正相關(guān)用紅色表示,負(fù)相關(guān)用藍(lán)色表示。
最后一個(gè)例子是精神分裂癥患者和健康對(duì)照者的聽(tīng)覺(jué)異常核磁共振數(shù)據(jù)和367個(gè)SNPs進(jìn)行平行ICA分析的結(jié)果。研究選取了43名健康對(duì)照組和20名精神分裂癥患者(均為白種人),發(fā)現(xiàn)一個(gè)fMRI成分和一個(gè)SNP成分之間的相關(guān)性為0.38。此功能核磁共振組成成分包括頂葉、右顳葉和雙側(cè)額葉。相關(guān)的SNP成分是由位于基因中的10個(gè)SNP顯著貢獻(xiàn)的,這些基因包括編碼煙堿α-7膽堿能受體、芳香氨基酸脫羧酶的基因,這些在精神病分裂癥都被破壞了。精神分裂癥組和對(duì)照組的fMRI和SNP分量在負(fù)荷參數(shù)上均有顯著差異(fMRI成分p=0.0006;SNP成分p=0.001)。并行ICA框架使我們能夠識(shí)別大腦功能和遺傳信息之間的相互作用;作者的發(fā)現(xiàn)提供了一個(gè)概念驗(yàn)證,即基因組SNP因子可以通過(guò)使用多變量形式的內(nèi)表型成像結(jié)果來(lái)研究。
圖9. fMRI和基因(SNP)數(shù)據(jù)融合:并行ICA提供了fMRI部分(左)和SNP部分(右下),以及fMRI和SNP數(shù)據(jù)的相關(guān)受試者簡(jiǎn)況(右上)
【總結(jié)】
ICA是一個(gè)強(qiáng)大的數(shù)據(jù)驅(qū)動(dòng)的方法,可以用來(lái)分析組fMRI數(shù)據(jù)或分析多模態(tài)數(shù)據(jù),包括fMRI, ERP,和遺傳數(shù)據(jù)。這些例子說(shuō)明了基于ICA的方法對(duì)腦成像數(shù)據(jù)的分析的效用和多樣性。
原文:A review of group ICA for fMRI data and
ICA for joint inference of imaging, genetic, and ERP data
如需原文及補(bǔ)充材料請(qǐng)加思影科技微信:siyingyxf 或者18983979082(楊曉飛)獲取,如對(duì)思影課程及服務(wù)感興趣也可加此微信號(hào)咨詢。覺(jué)得對(duì)您的研究有幫助,請(qǐng)給個(gè)轉(zhuǎn)發(fā),以及右下角點(diǎn)擊一下在看,是對(duì)思影科技莫大的支持。
微信掃碼或者長(zhǎng)按選擇識(shí)別關(guān)注思影
非常感謝轉(zhuǎn)發(fā)支持與推薦
如對(duì)思影課程感興趣也可微信號(hào)siyingyxf或18983979082咨詢。覺(jué)得有幫助,給個(gè)轉(zhuǎn)發(fā),或許身邊的朋友正需要。請(qǐng)直接點(diǎn)擊下文文字即可瀏覽思影科技其他課程及數(shù)據(jù)處理服務(wù),歡迎報(bào)名與咨詢,目前全部課程均開(kāi)放報(bào)名,報(bào)名后我們會(huì)第一時(shí)間聯(lián)系,并保留名額。
第九屆腦電數(shù)據(jù)處理入門(mén)班(重慶,9.22-27)
第二十一屆腦電數(shù)據(jù)處理中級(jí)班(南京,9.7-12)
第二十二屆腦電數(shù)據(jù)處理中級(jí)班(南京,11.12-17)
第七屆腦電信號(hào)數(shù)據(jù)處理提高班(南京,11.18-23)
第八屆眼動(dòng)數(shù)據(jù)處理班(重慶,10.26-30)
第九屆近紅外腦功能數(shù)據(jù)處理班(上海,11.24-29)
第三十二屆磁共振腦影像基礎(chǔ)班(南京,9.21-26)
第六屆小動(dòng)物磁共振腦影像數(shù)據(jù)處理班(南京,9.1-6)
第十一屆腦影像機(jī)器學(xué)習(xí)班(南京,8.25-30)
第十三屆磁共振彌散張量成像數(shù)據(jù)處理班(南京,9.15-20)
第六屆任務(wù)態(tài)fMRI專(zhuān)題班(南京,10.16-21)
第二屆彌散磁共振成像數(shù)據(jù)處理提高班(南京,10.24-29)
第七屆磁共振ASL數(shù)據(jù)處理班(南京,10.12-15)
第十八屆磁共振腦網(wǎng)絡(luò)數(shù)據(jù)處理班(南京,11.6-11)
第三十四屆磁共振腦影像基礎(chǔ)班(南京,10.30-11.4)
第三十一屆磁共振腦影像基礎(chǔ)班(重慶,9.14-19)
第三十三屆磁共振腦影像基礎(chǔ)班(重慶,10.11-16)
第十七屆磁共振腦網(wǎng)絡(luò)數(shù)據(jù)處理班(重慶,10.20-25)
第十屆磁共振腦影像結(jié)構(gòu)班(重慶,11.2-7)
第十二屆腦影像機(jī)器學(xué)習(xí)班(重慶,11.11-16)
腦磁圖(MEG)數(shù)據(jù)處理學(xué)習(xí)班(預(yù)報(bào)名)
思影科技EEG/ERP數(shù)據(jù)處理業(yè)務(wù)
數(shù)據(jù)處理業(yè)務(wù)介紹:
思影科技功能磁共振(fMRI)數(shù)據(jù)處理業(yè)務(wù)
思影科技彌散加權(quán)成像(DWI/dMRI)數(shù)據(jù)處理
思影科技腦結(jié)構(gòu)磁共振成像數(shù)據(jù)處理業(yè)務(wù)(T1)
思影科技嚙齒類(lèi)動(dòng)物(大小鼠)神經(jīng)影像數(shù)據(jù)處理業(yè)務(wù)
思影數(shù)據(jù)處理業(yè)務(wù)三:ASL數(shù)據(jù)處理
思影科技腦影像機(jī)器學(xué)習(xí)數(shù)據(jù)處理業(yè)務(wù)介紹
思影科技腦電機(jī)器學(xué)習(xí)數(shù)據(jù)處理業(yè)務(wù)
思影數(shù)據(jù)處理服務(wù)五:近紅外腦功能數(shù)據(jù)處理
思影數(shù)據(jù)處理服務(wù)六:腦磁圖(MEG)數(shù)據(jù)處理
思影科技眼動(dòng)數(shù)據(jù)處理服務(wù)
招聘及產(chǎn)品:
招聘:腦影像數(shù)據(jù)處理工程師(重慶&南京)