
密歇根理工大學的數學家開發了強大的新工具,用於篩選出人類一些最棘手的疾病背後的基因。
有了一個,他們可以追溯幾代人來查明遺傳疾病背後的基因。另外,他們在與 2 型糖尿病相關的基因中分離出 11 種變異,稱為單核苷酸多態性、SNP 或“剪斷”。
“對於像帕金森氏症、糖尿病和ALS [Lou Gehrig病]這樣的慢性複雜疾病,涉及多個基因,”數學科學助理教授沙秋英說。 “你需要一個強大的測試。”
該測試是集成學習方法(ELA),該軟件可以檢測一組對疾病有顯著影響的SNP。
對於復雜的遺傳疾病,包括2型糖尿病,單個基因可能會自行誘發疾病,而其他基因共同作用會導致疾病。在過去,找到這些基因-基因組合特別笨重,因為在人類基因組中匹配大約 500、000 個可疑基因所需的計算幾乎是不可能的。
ELA 迴避了這個問題,首先通過大幅縮小潛在危險基因的範圍,其次,通過應用統計方法來確定哪些 SNP 單獨作用以及哪些組合作用。 “我們覺得這很酷,”沙說。
為了在真實數據上測試他們的模型,Sha 的團隊分析了英國 1,000 多人的基因,其中一半患有 2 型糖尿病,一半沒有。他們確定了 11 個 SNP,它們單獨或成對與疾病相關的可能性很高。他們的工作已被遺傳流行病學雜誌接受。
ELA用於比較無關個體的基因組成,以梳理出與疾病相關的基因。該團隊還開發了另一種方法,該方法使用包含創始人表型的兩階段關聯測試,稱為 TTFP,可以檢查世代相傳的家庭成員的基因組。
“過去,研究人員研究過核心家庭、父母和孩子,但這可能要追溯到祖父母、曾祖父母。..想回多少就回多少。”
該團隊已在《歐洲人類遺傳學雜誌》上發表了他們的發現。摘要可在
現在他們已經開發了軟件,分析相對簡單,沙說。但讓基因數據發揮作用卻並非如此。 “我們還沒有可以使用的數據集,”她說,顯然很沮喪。 “這就是沒有醫學院的問題。”
然而,那些擁有數據集的人可以使用團隊的軟件來幫助找到一系列疾病的原因--並希望找到治療方法。
密歇根理工大學統計遺傳學組的其他成員還有張雙林副教授和博士後張兆功和馮濤。