在加州大學(xué)伯克利分校最近舉行的年度會議上,研究人員展示了他們在加速癌癥基因治療和擴展計算機理論領(lǐng)域方面的進展。
加州大學(xué)伯克利分校計算機科學(xué)系教授David A. Patterson呼吁業(yè)界聯(lián)合使用數(shù)百萬個基因庫來促進癌癥治療。
目前,獨立的基因庫只有不到10,000條基因信息,其中許多只是基因的部分片段。
“目前,可以說計算機科學(xué)用于建立快速而準(zhǔn)確的基因管道并促進個性化治療。
我希望以此來盡快幫助我和我的家人”。
帕特森還透露,目前的研究人員經(jīng)常在完成實驗后刪除遺傳數(shù)據(jù)。
計算機科學(xué)家大衛(wèi)·帕特森(David Patterson)希望通過海量數(shù)據(jù)分析方法來克服癌癥基因組問題。
Patterson協(xié)助開發(fā)了一個名為SNAP的工具,該工具顯然提供了更快,更準(zhǔn)確的遺傳分析,并且也已被癌癥研究人員廣泛使用。
他指出,然而,仍然需要基準(zhǔn)測試工具來改善目前在該領(lǐng)域仍然使用的高度主觀的方法。
此外,加州大學(xué)正準(zhǔn)備斥資6000萬美元建立一所新學(xué)院,希望在未來十年內(nèi)在計算機科學(xué)方面取得新的突破。
“我們希望開發(fā)一種新的作戰(zhàn)理論,該理論將遠(yuǎn)遠(yuǎn)超出當(dāng)前的研究范圍,并涵蓋其他領(lǐng)域中的問題”。
指導(dǎo)這項工作的理查德·卡普(Richard Karp)說。
他指出,“許多現(xiàn)象可以被視為具有計算特征”,如果我們仔細(xì)觀察活細(xì)胞的工作方法,我們可以將其想象為一種信息處理。
經(jīng)濟也是信息處理的活動。
"該校還將在今年5月舉辦一次學(xué)術(shù)研討會,以聚集各界專家,共同研究新理論的可能性。
使用大量數(shù)據(jù)治療癌癥Patterson的目標(biāo)是在開發(fā)Berkeley子校正中使用大量數(shù)據(jù)工具,以便它可以導(dǎo)入和分析大量遺傳數(shù)據(jù)以進行癌癥研究。
這些工具包包括Spark& mdash;這是一種用于計算機集群的編程語言,它提供的功能類似于Google搜索引擎使用的Map Reduce。
伯克利數(shù)據(jù)分析系統(tǒng)是基于Spark的開源引擎。
伯克利實驗室(Berkeley Lab)的科學(xué)家使用算法和計算管道來詳細(xì)分類大量圖像組合,并找出腫瘤的亞型。
它還可以不同程度地分析腫瘤中包含的異質(zhì)性或組織結(jié)構(gòu)。
然后,計算管道可以使用臨床數(shù)據(jù)對細(xì)胞特征進行分類,以預(yù)測患者的預(yù)后。
同時,它還使用大規(guī)?;蚪M數(shù)據(jù),通過海量數(shù)據(jù)分析來確定每種亞型的分子相關(guān)性。
研究人員已經(jīng)開發(fā)出一種可以自動分析大量腫瘤圖像以幫助預(yù)測對癌癥治療反應(yīng)的方法。
箭頭放大了腫瘤圖像的不同區(qū)域。
(資料來源:伯克利實驗室)當(dāng)前,海量數(shù)據(jù)研究面臨的挑戰(zhàn)是開發(fā)一種技術(shù),該技術(shù)可以及時,經(jīng)濟高效地解決海量數(shù)據(jù)問題。
伯克利研究小組正在采取多項行動來應(yīng)對這一挑戰(zhàn):開發(fā)基于統(tǒng)計機器學(xué)習(xí)的算法;在云中使用多臺計算機;并開發(fā)籌集資金的技術(shù),以結(jié)合人群的力量來幫助回答計算問題。
對于法律和機器來說,這個問題太困難了。
通過這些技術(shù),它將有助于在癌癥治療方面取得突破。
為了實現(xiàn)更快,更經(jīng)濟高效的基因組數(shù)據(jù)處理,需要一種可以同時使用云機的新基礎(chǔ)架構(gòu)。
當(dāng)癌癥基因的發(fā)現(xiàn)和診斷超過這些算法和機器時,也有必要收集每個人的資源和智慧,共同克服挑戰(zhàn)。