Key points are not available for this paper at this time.
動機:DNAデータベース検索の出力において、反復配列へのマッチは通常望ましくありません。反復配列はデータベース内でマスクできる場合、クエリにマッチさせる必要はありません。現在最も広く使用されているDNA配列マスキングソフトウェアであるRepeatMasker/Maskeraid(RM)は遅く、手動でキュレーションされたRepBaseライブラリなどの反復テンプレート配列のライブラリが必要であり、新たに配列決定されたゲノムには存在しない場合があります。結果:我々はWindowMasker(WM)と呼ばれるソフトウェアツールを開発しました。これはゲノム配列のみを用いてゲノム内の高度に反復的なDNA配列を特定しマスクします。WMはゲノム配列のリニアタイムスキャンを数回行うだけで、各ライブラリ配列とゲノムの各部分を比較する局所アライメント法を用いるRMよりも桁違いに高速です。WMを用いてマスクしたゲノムとRMでマスクしたゲノムという同一ゲノムの2バージョンに対し大量のクエリセットを適用したBLAST出力を比較することでWMの有効性を検証しました。RepBaseライブラリが良好に利用可能なヒトゲノムのようなゲノムでも、WMでマスクされたデータベースを検索すると、明らかに非反復的なマッチがより多く、反復配列へのマッチはより少なく得られます。これらの結果は転写領域にも当てはまることを示しました。WMは解析当時ドラフト形式の配列が多く含まれていたゲノムに対しても良好に機能します。入手方法:WMはNCBI C++ツールキットに含まれています。ツールキット全体のソースコードはftp://ftp.ncbi.nih.gov/toolbox/ncbi_tools++/CURRENT/で入手可能です。ツールキットのソースコードを展開した後、UNIX環境でWindowMaskerアプリケーションを構築する手順はsrc/app/winmasker/README.buildファイルに記載されています。補足情報:補足データはftp://ftp.ncbi.nlm.nih.gov/pub/agarwala/windowmasker/windowmasker_suppl.pdfで入手可能です。
Building similarity graph...
Analyzing shared references across papers
Loading...
Aleksandr Morgulis
E. Michael Gertz
Alejandro A. Schäffer
Bioinformatics
National Institutes of Health
National Center for Biotechnology Information
Building similarity graph...
Analyzing shared references across papers
Loading...
Morgulisら(火曜日)はこの問題を研究しました。
www.synapsesocial.com/papers/6a0165a16018b8d0892dfd37 — DOI: https://doi.org/10.1093/bioinformatics/bti774
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: