[出典] "MAFFT-DASH: integrated protein sequence and structural alignment" Rozewicki J, Li Songling, Amada KM, Standley D, Katoh K. Nucleic Acods Res. 2019-05-07.
- 2002年にClustalWやT-Coffeeよりも高速であり、今やClustalWのオリジナルWebサイトでも'For DNA alignments we recommend trying MUSCLE or MAFFT'と紹介されているマルチプル配列アライメント (multiple sequence alignment, MSA)ツール、MAFFT (Multiple Alignment using Fast Fourier Transform)を発表した加藤和貴 (当時 京大、現 阪大微研)らは、今回、MAFFTに構造アライメントを統合した解析環境MAFFT-DASHを公開 (https://mafft.cbrc.jp/alignment/server/)するに至った。
- DASHは、Protein Data Bankに登録されている全てのタンパク質を対象としたドメインとチェインの構造アライメントの結果を蓄積したWebベースのデータベース (web-based Databae Aligned Structural Homologs)である。2019年4月4日更新時の規模が、441,111チェイン, 56,848,571のチェイン・アライメント, 169,937ドメインおよび94,062,584ドメイン・アライメント、となっている。
- MAFFT-DASHの検証は、ベンチマークデータセットを提供しているBAliBase、HomFam、OXFam、MattbenchおよびSISY- PHUSから選択した878セットに基づいて行われい、MAFFT-DASHのMAFFTからの性能向上が実証された。すなわち、参照アライメント結果との一致度を見る指標 Sum-of-Pairs(SP)にて、類似性が弱い配列間でのアライメントについて、MAFFT-DASHはMAFFTから10-20%の向上を示した。
- また、MAFFTアライメントに相同配列を加えると、アライメント結果がさらに改善された。
- MAFFT-DASHを利用することで、リモートホモロジーの検出を介して、タンパク質構造のホモロジーモデリングのテンプレートとして利用可能な構造既知タンパク質の範囲が広がる。
- 下図は、MAFFT単独のアライメントでは検出できなかったリモートホモロジーから構造上保存されていた触媒アミノ酸をMAFFT-DASHアライメントによって同定した事例 (Figure 1から引用)
コメント