中國科學家設計出二代測序自動化軟件處理流程

時間:2014-07-02

來源:網絡轉載

導語:二代測序技術(Next-generation sequencing)大幅度降低了測序的時間和成本,使得大規(guī)模測序逐漸成為常規(guī)的實驗室研究和臨床檢測手段。

二代測序技術的發(fā)展對測序數據的處理分析提出了很高的要求。目前二代測序數據分析軟件很多,但是絕大多數軟件僅能完成單一的分析功能(例如:僅進行序列比對或變異讀取或功能注釋等),如何能正確高效地選擇整合這些軟件已成為迫切需求。

來自中國醫(yī)學科學院,北京協(xié)和醫(yī)學院等處的研究人員設計了一套基于perl語言和SGE資源管理的自動化處理流程來分析Illumina平臺基因組測序數據。該流程通過自動化并行腳本控制流程的高效運行,一站式輸出分析結果和報告,簡化了數據分析過程中的人工操作,大大提高了運行效率。相關文章公布在《遺傳》雜志上。

二代測序技術(Next-generationsequencing)大幅度降低了測序的時間和成本,使得大規(guī)模測序逐漸成為常規(guī)的實驗室研究和臨床檢測手段。測序產生的數據量急劇增加,如何高效地分析這些數據,已成為迫切需要解決的問題。目前,分析序列信息的生物信息學軟件紛繁復雜,但基本上每個軟件只能完成單一的分析功能,實現一個完整的分析流程則需要對眾多軟件進行整合,而手動串聯(lián)的效率往往不盡人意;同時,這些軟件需要在Linux工作環(huán)境下以命令行運行,要求用戶具備較好的計算機背景;另外,即便一些實驗室完成了分析流程的構建,他們往往不會公開許多細節(jié),新用戶仍然要從頭建起。

針對這一問題,研究人員希望能通過構建經典的二代測序數據分析流程,并實現各個環(huán)節(jié)的高效自動化管理和分析,減輕研究者前期的工作負擔,促進相關領域進一步對基因組測序研究項目的順利開展。

研究人員為此設計了一套基于perl語言和SGE資源管理的自動化處理流程來分析Illumina平臺基因組測序數據。該流程以測序原始序列數據作為輸入,調用業(yè)界標準的數據處理軟件(如:BWA,Samtools,GATK,ANNOVAR等),最終生成帶有相應功能注釋、便于研究者進一步分析的變異位點列表。

這一流程通過自動化并行腳本控制流程的高效運行,一站式輸出分析結果和報告,簡化了數據分析過程中的人工操作,大大提高了運行效率。用戶只需填寫配置文件或使用圖形界面輸入即可完成全部操作,為廣大研究者分析二代測序數據提供了便利的途徑。

目前測序數據處理軟件很多,研究人員綜合考慮了適用性和效率,整合出了一套標準的數據處理流程。具體來說,獲得FASTQ格式的原始測序數據后,需要數據進行以下處理:(1)使用BWA軟件把這些短序列和參考基因組進行對比,確定短序列在基因組上的位置,把短序列組裝成完整的人類參考基因組;(2)使用Samtools軟件把這些短序列調整成按一定順序(1-22,X,Y,其他)排列的序列,并進行數據格式的轉換;(3)使用Picard軟件把測序產生的冗余信息和噪聲去掉;(4)使用GATK尋找樣本測序數據與參考基因組的差異,列出這些差異點;(5)使用Annovar對這些變異位點進行功能注釋,得到一個易于理解的變異位點列表。

這一項目成功整合了一系列二代測序數據分析軟件,形成了一套經典的數據分析流程。這一流程通過并行化設計和自動化處理,一方面簡化了操作成本、縮短了數據分析周期,另一方面也使本流程可以引入更完善的數據校驗步驟,增強結果的可信度。

流程針對Illumina平臺雙端測序數據開發(fā),滿足了大部分處理需求,并對其他用戶提供了一個很好的參考,后續(xù)研究人員還將根據用戶需求對該自動化流程進行持續(xù)維護。

隨著二代測序技術的逐步發(fā)展,二代測序已經廣泛應用于科研和臨床研究。這一流程提高了二代測序數據分析的入門和運轉效率,其必將在二代測序相關基因組學研究中,促進廣大科研人員工作的高效進行。

更多資訊請關注自動化軟件頻道

中傳動網版權與免責聲明:

凡本網注明[來源:中國傳動網]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(m.u63ivq3.com)獨家所有。如需轉載請與0755-82949061聯(lián)系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”,違反者本網將追究其法律責任。

本網轉載并注明其他來源的稿件,均來自互聯(lián)網或業(yè)內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內容、版權等問題,請在作品發(fā)表之日起一周內與本網聯(lián)系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0