[出典]
[論文から]

 タンパク質工学の可能性は、化学、エネルギー、医学の分野にほぼ無限に広がっているが、機能が向上したあるいは新規な機能を帯びたタンパク質を創出する過程は、多大な時間と労力を要し、非効率的である。著者らは今回、完全に自律的なタンパク質工学のためのSelf-driving Autonomous Machines for Protein Landscape Exploration (SAMPLE)プラットフォームGH1 FIG. 1を開発した。SAMPLEは、比較的シンプルな機械学習 (ガウス過程動的モデル) を介してタンパク質の配列と機能の関係を学習し新たなタンパク質を設計するエージェントと、エージェントからの設計をもとにタンパク質を生成しその結果をエージェントにフィードバックする環境を提供する完全自動ロボットシステムとで、構成される [Figure 1の a と fを引用した右図参照]。

 エージェントは、GH1 FIG.2DNAアセンブリーグラフを用いてコンビナトリアル配列空間を定義し、どの配列要素を結合すれば有効な遺伝子配列を生成できるかを明らかにしていく [Fig. 2 引用右図 a 参照]。GH1のコンビナトリアル配列空間は、天然のGH1ファミリーメンバーの配列要素、タンパク質設計ツールRosettaを用いて設計した要素、および進化情報を用いて設計した要素から設計した。この空間には、1,352のユニークなGH1配列が含まれ [右図 b 参照]、GH1 TIMバレルフォールド全体に多様性が導入され、各部位で最大6個のユニークなアミノ酸がサンプリングされている [右図 c 参照]。

 GH1 FIG. 3実証実験として、糖質加水分解酵素 ( glycoside hydrolase family 1: GH1)の耐熱性向上を目指して、4種類のSAMPLEエージェントによる設計を試みた。エージェントによって、タンパク質の適応度ランドスケープを探索の経路が異なったが [Fig.3 引用右図参照]、20回の実験ラウンドの後、いずれのエージェントも少なくとも12℃高い温度で機能する酵素を作り出した。

[NEWS記事から]
  • 研究チームは、カリフォルニアにあるクラウドベースのラボ (コンピューターコードで遠隔操作できるロボット装置を備えた既存の施設) を利用し、エージェントの指示をそこに送るような設定で実験を進めた。輸送の遅れによる2カ月半の中断を含め、実験全体には約6カ月を要し、20ラウンドの実験にはそれぞれ約5,200米ドルの費用がかかったと見ている。また、同じ作業を従来のタンパク質工学の手法で行えば1年はかかると見ている。
  • 筆頭著者のコメント: (研究者を削減するのが目的では無く) 単調な繰り返し作業を置き換えるのです。そうすることで、興味深い部分により集中できるようになるのです。
  • Héctor García Martín (Lawrence Berkeley National Laboratory) のコメント:「自動運転ラボ」の高度化を進めるには、新世代のハードウェアが必要になるかもしれない。これまでの自動化された研究室設備は、人間が監督することを念頭に作られている傾向があるからだ。より根本的な課題は、人間だけでなく機械も解釈できる知識を生み出すことができる自動運転ラボを作ることである。
  • Huimin Zhao (University of Illinois Urbana–Champaign):タンパク質をより熱に安定させることは比較的簡単だ。自動運転ラボが、酵素の他の特性を変化させるのにどれだけ簡単に適応できるかは不明である。