[email protected]

來自中國分布式計算總站
跳轉至: 導航搜索


[email protected]

Rosetta at home logo.png
[email protected] logo
Rosetta@home screenshot.png
[email protected] 的屏幕保護圖形
開發者 華盛頓大學貝克實驗室

Rosetta CommonsUnited States.gif

版本歷史 2005年6月26日
運算平臺 Windows.pngLinux.pngMacos.png64bits.png
項目平臺 BOINC
程序情況 查看計算程序情況
任務情況 查看計算任務情況
項目狀態 運行中/開放注冊
項目類別 生命科學類
優化程序 無 / 64位計算程序比32位有效率提升
計算特點 CPU密集:

支持0分享率

支持GPU計算

官方網址 [email protected]
http://boinc.bakerlab.org/rosetta/rss_main.php 通過 RSS 獲取項目新聞


[email protected] 是一個基于伯克利開放式網絡計算平臺 BOINC 的分布式計算項目。該項目由華盛頓大學貝克實驗室開發和維護,用于蛋白質結構預測、蛋白質-蛋白質對接和蛋白質設計的研究。截至 2009 年 2 月 8 日,全球共有 8.6 萬臺計算機是這一項目的活躍志愿者,平均執行速度達 78 萬億 FLOPS。[email protected] 還開發了一款電子游戲 Foldit,目的是通過眾包(crowdsourcing)途徑來實現上述研究目標。盡管這個項目很大程度上側重于進行提高蛋白質組學方法的精確性和穩固性的基礎研究,它也進行一些關于艾滋病、瘧疾、癌癥、阿茲海默病以及其他疾病的病理學的應用研究。

與其他 BOINC 項目一樣,[email protected] 使用志愿者的計算機中空閑的進程資源來執行單獨的單元計算。計算結果會被發送到項目的中央服務器,經驗證后存入數據庫中。這個項目是跨平臺的,支持多種不同的軟件和硬件環境。用戶可通過 [email protected] 的屏幕保護程序觀看正在自己計算機上進行的蛋白質結構預測的情況。

除了疾病相關研究,[email protected] 網絡還是結構生物信息學中新方法的一個測試框架。這些新方法經 [email protected] 龐大且多樣的用戶群體使用后,若運行效果穩定,將會被用于其他基于 Rosetta 的應用程序,例如 RosettaDock 和人類蛋白質組折疊項目。新方法測試中的兩個重要項目是蛋白質結構預測技術的關鍵測試(CASP)和交互作用預測的關鍵測試(CAPRI)。這兩項測試實驗分別用于評估蛋白質結構預測和蛋白質-蛋白質對接預測的最前沿技術。[email protected] 穩居最重要的對接預測器之一,并且是現有最好的蛋白質三級結構預測器之一。


如何加入項目

該項目基于 BOINC 平臺,簡要的加入步驟如下(已完成的步驟可直接跳過):

  1. 下載并安裝 BOINC 的客戶端軟件(官方下載頁面程序下載
  2. 點擊客戶端簡易視圖下的“Add Project”按鈕,或高級視圖下菜單中的“工具->加入項目”,將顯示向導對話框
  3. 點擊下一步后在項目列表中找到并單擊選中 [email protected] 項目(如未顯示該項目,則在編輯框中輸入項目網址:http://boinc.bakerlab.org/rosetta/ ),然后點擊下一步
  4. 輸入您可用的電子郵件地址,并設置您在該項目的登錄密碼(并非您的電子郵件密碼)
  5. 再次點擊下一步,如項目服務器工作正常(并且有適合自身操作系統的計算程序),即已成功加入項目

更詳細的加入方法說明,請訪問 BOINC 新手指南BOINC 使用教程

本站推薦您加入 Team China 團隊,請訪問項目官方網站的 團隊檢索頁面,搜索(Search)并進入 Team China 的團隊頁面,點擊頁面中的 Join 并輸入用戶登錄信息即可加入!

計算平臺

[email protected] 應用程序和 BOINC 均支持 Microsoft Windows、Linux 和蘋果機平臺。(BOINC 還可在更多平臺上運行,如 FreeBSD。)參與 [email protected] 的客戶端計算機需要有一個時脈速度至少達到 500 兆赫的中央處理器、400MB 空余的硬盤空間、512MB 的物理內存,以及因特網連接。截至2009年5月29日,Rosetta 應用程序的最新版本號是5.98,Rosetta Mini 應用程序的最新版本號是 1.71。用戶的 BOINC 客戶端與位于華盛頓大學的 [email protected] 服務器端之間使用標準 HTTP(80端口)進行通信,HTTPS(443端口)用于密碼交換。BOINC 客戶端使用 1043 和 31416 端口進行遠程和本地控制,這兩個端口可能需要在防火墻中被設置為“解除封禁”才可被使用。包含蛋白質數據的工作單元由服務器分配給志愿者的計算機(客戶端),然后客戶端對所分配得到的任務進行蛋白質預測運算。為了避免重復的預測,每個工作單元會得到一個初始的隨機種子。這使得每個預測具有獨一無二的沿蛋白質能量圖景(energy landscape)的下降軌道。對于給定的蛋白質能量圖景,[email protected] 的結構預測近似為整體極小值。這個整體極小值代表該蛋白質的能量最佳構造,即它的自然態。

[email protected] 屏幕保護程序,顯示了一個合成泛素蛋白質(PDB ID: 1ogw)的結構預測進行情況

[email protected] 的圖形用戶界面是一個屏幕保護程序,顯示了當前工作單元進行蛋白質折疊模擬的情況。屏幕左上方為當前蛋白質鏈正在嘗試的移動(即搜索的形狀)。緊鄰其右側是最新一個被接受的移動。再往右側分上下兩個小圖,上圖為當前最低能量形狀,下圖為實驗中得到的真實形狀(如果已知)。屏幕中部顯示的是被接受模型的自由能變化曲線。屏幕上方最右側是接受模型的均方根偏差(RMSD)曲線,體現了被接受模型與實驗中真實模型之間的相似度。在自由能變化曲線右側、RMSD 曲線下方,使用這兩項結果生成了一個能量 /RMSD 圖,伴隨著模型的不斷精確。

與所有其他 BOINC 項目類似,[email protected] 利用客戶端空閑資源,在后臺執行。執行過程可能發生在用戶登錄操作系統之前或之后。當其他應用程序需要時,[email protected] 會釋放資源,因此不會影響用戶對計算機的正常使用。為了使計算機的功耗或者放熱降到最低,用戶可以自行指定 [email protected] 使用 CPU 資源的最大比例。此外,[email protected] 每天最多運行次數,以及更多選項也都可以通過用戶的賬戶選項來進行設置。

[email protected] 網絡所使用的 Rosetta 軟件最早用 Fortran 編寫,后改用 C++ 重新編寫,以利于進一步的開發。新版本于2008 年 2 月 8 日發布,實現了面向對象。Rosetta 代碼由 Rosetta Commons 開發。這個軟件對學術使用免費,對制藥公司則收取費用。


項目意義

通過一系列的基因組測序計劃,科學家能夠判定許多種在細胞內發揮作用的蛋白質的氨基酸序列或者一級結構。為了更好地了解蛋白質的功能,以及向合理化藥物設計提供輔助,科學家們需要知道蛋白質的三級結構。

CASP6 的目標蛋白質 T0281:首個接近原子級精度的 ab initio 蛋白質結構預測。Rosetta 生成了 T0281(洋紅色)的一個模型,與實驗測定的晶體結構(藍色)之間的 RMSD 為 1.5 埃

蛋白質的三維結構目前主要通過X射線晶體學或核磁共振技術來進行實驗確定。這個過程十分耗時,例如可能花費數星期或者幾個月才能首次研究出如何使一種蛋白質結晶;而成本又非常高,每種蛋白質耗費約 10 萬美元。更重要的是,發現新序列的速度遠超確定結構的速度:美國國家生物技術信息中心非冗余蛋白質數據庫中存在的超過 740 萬個蛋白質序列中,僅有不到 5.2 萬已被確定結構并被存入蛋白質數據庫中。[email protected] 的一個主要目標是在顯著降低時間和金錢成本的情況下,預測蛋白質結構,并且達到與現有實驗方法同樣的精度。[email protected] 還開發了確定膜蛋白(如G蛋白偶聯受體)結構和對接的方法。膜蛋白是現代藥物設計的主要目標,但通過X射線晶體學、核磁共振等傳統技術卻極難獲得其結構。

蛋白質結構預測的進展通過兩年一屆的蛋白質結構預測技術的關鍵測試(CASP)實驗來進行評估。在這項實驗中,來自全球各地的研究人員嘗試從氨基酸序列中得到蛋白質結構。這項實驗有時競爭十分激烈,得分高的小組被認為是最高端蛋白質結構預測研究的事實上的標準制定者。[email protected] 所基于的 Rosetta 程序,自 1998 年的 CASP3 實驗上開始被使用。在 2004年的 CASP6 上,Rosetta 創造了歷史,在它為 CASP 目標蛋白質 T0281 提供的模型中,首次生成了接近原子級精度的 ab initio 蛋白質結構預測。Ab initio 不使用結構同源的信息,而必須依賴于序列同源信息以及蛋白質內的模擬物理交互,因此被認為是一類特別難以預測的蛋白質結構。[email protected] 自2006年 CASP7 上開始被使用。在 CASP7 上,它在每個類別的預測中都成為最好的預測器之一。而高質量的預測需要來自 [email protected] 眾多志愿者提供計算資源。不斷增多的計算資源使[email protected] 能夠對構象空間(一個蛋白質可以被假設具有的可能的形狀)更多的區域進行取樣,根據“黎文索爾佯謬”(Levinthal paradox),采樣數量會隨著蛋白質長度的增長而呈指數增長。

[email protected] 也被用于蛋白質-蛋白質對接預測。這項預測確定蛋白質復合體結構或者四級結構。這一類型的蛋白質交互作用影響到許多細胞功能,包括抗原-抗體、酶-抑制劑捆綁等。確定這些交互作用在藥物設計中十分關鍵。Rosetta 被用于交互作用預測的關鍵測試(CAPRI)實驗。這項實驗評估當前最前沿的蛋白質對接技術,評估模式與 CASP 類似。Rosetta 在這項實驗中得到的結果屬最精確、最完整之一,而志愿者提供的計算資源被認為是 Rosetta 獲得成功的主要因素之一。

2008年初,Rosetta 被用來推算設計一種具有在自然界中從未被觀察到功能的蛋白質。這個靈感源自2004年一篇引起關注的、被撤稿的論文,那篇論文中描述了一種蛋白質的推算設計,這種蛋白質與天然的蛋白質相比提高了酶活力。2008年,大衛·貝克的研究組發表了論文,描述了這種蛋白質的制造過程。論文指出 [email protected] 為其提供計算資源,作為這種蛋白質設計方法的一項重要的概念論證。這一類型的蛋白質設計將來可能在藥物設計、綠色化學、生物修復等領域得到應用。

與類似的分布式計算項目的比較

目前有多個分布式計算項目與 [email protected] 具有類似的研究方向,但研究方法上存在差異。

[email protected]

斯坦福大學開發的 [email protected] 是與蛋白質研究相關的主要分布式計算項目中唯一不使用 BOINC 平臺的。[email protected][email protected] 都研究蛋白質錯誤折疊疾病(如阿茲海默病),但 [email protected] 還進行其他研究,而 [email protected] 則主要集中于這類研究。[email protected] 并不采用基于結構或者基于設計的方法來預測淀粉體行為,而是采用分子動力學方法來構建蛋白質折疊活動(以及可能的錯誤折疊和聚合)的模型。換言之,[email protected] 的優勢在于模擬蛋白質折疊活動,而 [email protected] 的優勢則在于蛋白質運算設計以及蛋白質結構和對接的預測。這兩個項目在計算資源和主機分布上也存在顯著差異。[email protected] 的主機群體基于 PC,平均執行速度為 78 萬億 FLOPS;而 [email protected] 的主機群體包括了 PlayStation 3 和圖形處理器,平均執行速度達 4769 萬億 FLOPS,大約是 [email protected] 的 61 倍。

World Community Grid

World Community Grid(世界公共網格)的子項目人類蛋白質組折疊項目(HPF)1 期和 2 期均使用 Rosetta 程序來為不同的基因組添加結構和功能注解。人類蛋白質組折疊項目的首席科學家里夏爾·博諾在華盛頓大學貝克實驗室攻讀博士學位期間積極參與了 Rosetta 的早期開發,但他現在主要使用 Rosetta 來為生物學家創建數據庫。他的個人網站上設置了關于 HPF1、HPF2 的信息布告板。

[email protected]

[email protected] 相似,蛋白質結構預測也是 [email protected] 的研究重點。[email protected] 還計劃在其分布式計算平臺上開發蛋白質設計與對接的新研究領域(采用分子動力學的 CHARMM 軟件包)。這將使它與 [email protected] 更加相似。進行結構預測時,[email protected] 使用的是 Rosetta 程序,而 [email protected] 則使用 dTASSER 方法。

其他

BOINC 平臺上其他的蛋白質相關分布式計算項目包括 [email protected][email protected][email protected]SIMAPTANPAKU[email protected][email protected] 的 alpha 版本,用來進行新應用程序、工作單元以及更新被添加到 [email protected] 之前的測試工作。[email protected] 也在 BOINC 平臺上運行。


志愿者的貢獻

[email protected] 的研究依賴于大量志愿者提供的計算資源。截至 2009 年 1 月 9 日,[email protected] 的活躍用戶超過 4.5 萬人,分布在 168 個國家,總共提供了 8.2 萬臺計算機的空閑資源,使 [email protected] 的平均執行速度達到 73 萬億FLOPS。[3]

用戶的貢獻通過 BOINC 積分來度量。一個用戶從某一工作單元得到的積分是他在這個工作單元上產生的“誘餌”數量與所有用戶在該工作單元獲得的積分均值的乘積。[email protected] 對 CPU 每秒工作所給的積分低于絕大多數其他 BOINC項目。盡管如此,[email protected] 仍在所有 BOINC 項目中名列總積分值第 5 位。

預測的蛋白質結構被提交到 CASP 實驗的用戶,也在相關的學術出版物中被致謝。而預測出指定工作單元最低能量結構的用戶及其所在隊伍則會在 [email protected] 的主頁上被列為“當日預測者”(Predictor of the Day)。每天還有一名隨機選出的用戶會被列在主頁上,成為“當日用戶”(User of the Day)。


繼續閱讀


相關鏈接


Boinc Icon.png伯克利開放式網絡計算平臺BOINC
· ·
生命科學類項目 Computational Structural Biology · [email protected] · GPUGRID · Malariacontrol.net · [email protected] (Alpha內測項目)· RNA World · [email protected] · The Lattice Project
地球科學類項目 Climateprediction.net · Quake-Catcher Network Seismic Monitoring
人工智能類項目 [email protected]
天文學項目 Astropulse · [email protected] · [email protected] · [email protected] · [email protected]/AstroPulse Beta (Beta公測項目)· [email protected]
物理化學類項目 [email protected] · [email protected] · Leiden Classical · [email protected] · [email protected]
數學類項目 Collatz Conjecture · [email protected] · primaboinca · PrimeGrid · SZTAKI Desktop Grid · WEP-M+2 Project
密碼類項目 [email protected] · Moo! Wrapper
藝術類項目 BURP
多種應用的項目 [email protected] · World Community Grid · [email protected]
與 BOINC 平臺相關的項目 BOINC Alpha Test · [email protected] · [email protected]
已結束/暫停/合并的項目 [email protected] · AlmereGrid Boinc Grid · [email protected] · [email protected] · BBC Climate Change Experiment · Biochemical Library · [email protected] · [email protected] · [email protected] · CPDN Beta · DepSpid · DistrRTgen · [email protected] · [email protected] · [email protected] · [email protected] · DynaPing · [email protected] · eOn: Long timescale dynamics · [email protected] · Eternity2.fr · [email protected] · Goldbach's Conjecture Project · Ibercivis · [email protected] · [email protected] · [email protected] · MilestoneRSA · [email protected] · [email protected] · NQueens Project · [email protected] · Open Rendering Environment · [email protected] · PicEvolvr.com] · [email protected] · QuantumFIRE alpha · [email protected] ·RamseyX · Rectilinear Crossing Number · Renderfarm.fi · RSA Lattice Siever (2.0) · Seasonal Attribution Project · SHA-1 Collision Search Graz · SIMAP · [email protected] · [email protected] · [email protected] · [email protected] · TANPAKU · Virtual Prairie · Virus Respiratorio Sincitial · XtremLab · Zivis
BOINC 相關的工具 BOINCstats BAM! · BOINC Translation Services · BOINC TThrottle