呂慶研究組提出快速估計大基因型數據SNP遺傳度估計方法
復雜性狀的表型變異是遺傳因素和環(huán)境因素共同作用的結果,基因與環(huán)境因素對表型變異有著重要的影響。遺傳度是衡量群體中某一表型差異歸因于遺傳因素的比例。遺傳度估計可以量化表型在多大程度上受基因影響;給出用基因預測表型的上限,比較不同人群中同一表型的遺傳起源。大基因型數據能夠提高估計精度,但是要求的計算資源高,計算耗時長。
2022年4月5號,《生物信息學簡報》在線發(fā)表了Mingsheng Tang, Tingting Hou, Xiaoran Tong等人報道了基于最小范數二次無偏估計(MINQUE)和分批處理法(Batch)的SNP遺傳度快速估計方法。
對于非分批處理法,無論是單方差還是多方差分析,LMM.MNQ是無偏的遺傳度估計方法,且隨著樣本量的增加,估計越精確。對于分批處理法,無論單方差還是多方差分析,LMM.MNQ.BCH是無偏的估計方法,隨著批次樣本量和批次數目的增加,LMM.MNQ.BCH估計越精確。分批處理法是普遍適用的方法,可用于那些能給出無偏遺傳度估計的方法來減少計算負擔。對于計算時間,模擬和實例研究表明,LMM.MNQ.BCH的估計結果和現有的方法BOLT-REML估計的結果相近,但是明顯快于后者。
現已開發(fā)出以核矩陣或PLINK文件作為輸入數據的可執(zhí)行程序。小數據集時,LMM.MNQ為SNP遺傳度估計提供了另一種可行方法;大數據集時, LMM.MNQ.BCH要求的計算資源少,可以應用于個人計算機,而不依賴于計算集群。除了估計遺傳度,LMM.MNQ, LMM.MNQ.BCH也可進行關聯檢驗。