日前,總部位于美國紐約的Simons基金會(huì )日前宣布其制作的世界最大自閉癥數據庫SSC上線(xiàn)。SimonsSimplexCollection(SSC)是全球最大的自閉癥數據庫,包含來(lái)自自閉癥患兒家庭的1萬(wàn)個(gè)外顯子數據可通過(guò)普通的網(wǎng)絡(luò )連接查詢(xún)。
同時(shí),SSC數據能與世界上其他主要數據庫無(wú)縫對接。目前已有來(lái)自美國、加拿大、中國、法國、冰島、澳大利亞、愛(ài)爾蘭、巴西和卡塔爾等17國家相關(guān)機構的自閉癥研究人員,通過(guò)云端查詢(xún)等方式使用了這一數據庫。
SSC包含近2600個(gè)家庭的基因組序列數據和詳細的臨床表型數據,所有這些家庭均包含有一個(gè)患一種自閉癥(ASD的兒童、正常的父母和兄弟姐妹。它是深化理解ASDs的重要資源,也是全球最大的專(zhuān)業(yè)性基因組序列數據庫。明碼生物科技憑借其優(yōu)秀的數據庫架構計算效率,使得如此大規模的數據運算成為可能。SSC用戶(hù)可直接查詢(xún)個(gè)人基因組數據、家系數據或者整個(gè)數據庫。人們不需要移動(dòng)或下載數據文件,就可以挖掘所有樣本的GATK和FreeBayes突變;可以通過(guò)由歸一化的全球標準序列數據在后臺支持的、始終處于運行狀態(tài)的可視化工具查看運算結果;或者與同行開(kāi)展合作。數據存儲于可彈性擴展的兼容HIPAA規則的明碼生物科技云端,由DNAnexus提供后臺技術(shù)支撐。SSC包含接近2600個(gè)ASD先征者以及他們的父母和表型正常的兄弟姐妹的全外顯子測序數據和大于2000種表現型數據。
這是大基因組學(xué)投資促進(jìn)我們理解自閉癥和其他種類(lèi)復雜疾病的正確方式。由于我們以及越來(lái)越多的合作者擁有GOR格式的研究和診斷數據,我們已經(jīng)感受到了大規模虛擬隊列對于加快研究進(jìn)度的影響,并且我們正在邀請我們的合作者也加入進(jìn)來(lái)。
SimonsSimplexCollection(SSC)是設計用于支持發(fā)現增加自閉癥風(fēng)險的罕見(jiàn)及新生遺傳事件的專(zhuān)業(yè)、嚴謹的數據庫,包括2,600個(gè)“單一”家系,所有這些家系均包括一名自閉癥孩子、正常的父母以及至少一名表現正常的兄弟姐妹。經(jīng)過(guò)批準的研究者可以通過(guò)SFARIBase來(lái)獲得SSC生物學(xué)樣本和表現型數據和遺傳數據。SSC測序數據已經(jīng)獲得了100種自閉癥候選基因。
SSC由SFARI(SimonsFoundationAutismResearchInitiative)提供支持。SFARI的使命是通過(guò)為最高質(zhì)量的相關(guān)創(chuàng )新研究提供基金支持來(lái)改進(jìn)對于自閉癥的理解、診斷和治療。SSC的建立是為了改進(jìn)對于自閉癥的理解、診斷和治療,目前已有近2600個(gè)家庭的基因組序列數據和詳細的臨床表型數據,希望以后能有更多的數據資源,讓我們更接近自閉癥真相!