この記事の要点は？

Preferred Networks、100億規模ライブラリを効率的に探索するP-ULVS受託サービスを提供 Active Learning活用により全数計算比で時間を約1/1,500に短縮し、上位化合物の約80%を取得 5-HT2AR等の標的で72〜81%の再現率を達成し、実験コストと時間の削減を実現

Preferred Networks、100億規模の大規模バーチャルスクリーニング受託サービス提供

•Preferred Networks、100億規模ライブラリを効率的に探索するP-ULVS受託サービスを提供
•Active Learning活用により全数計算比で時間を約1/1,500に短縮し、上位化合物の約80%を取得
•5-HT2AR等の標的で72〜81%の再現率を達成し、実験コストと時間の削減を実現

Preferred Networks (PFN)は、創薬研究の初期段階であるヒット探索を加速させるため、大規模な化合物ライブラリを対象としたバーチャルスクリーニング受託サービス「P-ULVS」を展開している。従来の創薬プロセスでは、1,000万規模のライブラリが主流であったが、近年ではEnamine REALのような100億規模に達する超大規模ライブラリの活用がデファクトスタンダードとなっている。P-ULVSは、機械学習モデルを用いて有望な化合物を効率的に特定する「Active Learning」とドッキングシミュレーションを組み合わせることで、膨大な化合物空間からの高速な候補探索を可能にする。

大規模なライブラリ探索の有効性は、過去の多くの研究で実証されている。ライブラリサイズを1億から100億規模へと拡張することで、高活性アゴニストの発見率向上や、標準的手法と比較して約2〜5倍のヒット率改善が報告されている。特に、100億規模のライブラリを用いた場合、CB2Rで33%、ROCK1で28.5%という高いヒット率を達成した実績がある。P-ULVSは、こうした探索において、機械学習による選択とドッキング計算を反復するサイクルを繰り返すことで、全数計算では数百年を要する大規模シミュレーションを、計算リソースを最適化しつつ短時間で実行する。

実際のベンチマークテストでは、セロトニン受容体5-HT2ARを標的として、100億規模のライブラリから400万化合物（全体の0.04%）を評価した。その結果、ドッキングスコア上位の化合物の約80%を発見することに成功した。計算時間はNVIDIA V100 1枚を用いた場合と比較して、約1/1,500となる約2,000時間まで短縮されている。同様の性能はCB2R、JAK3、ROCK1といった他のターゲットタンパク質においても確認されており、いずれも72〜81%という高い再現率で上位化合物を取得した。

プロジェクトの要件に応じて、機械学習モデルが有望と予測した化合物を優先する「ML Best（Greedy）」戦略や、未知のケミカルスペースを広く探索する「Uncertainty Sampling」戦略など、柔軟な化合物選択が可能です。P-ULVSは、実験的なハイスループットスクリーニング（HTS）と比較してコストと時間を大幅に削減できるだけでなく、新規骨格の発見を強力に支援する。PFNは、この技術をさらに高度化させ、創薬プロセスの生産性向上を目指す方針である。

Preferred Networks (PFN)は、創薬研究の初期段階であるヒット探索を加速させるため、大規模な化合物ライブラリを対象としたバーチャルスクリーニング受託サービス「P-ULVS」を展開している。従来の創薬プロセスでは、1,000万規模のライブラリが主流であったが、近年ではEnamine REALのような100億規模に達する超大規模ライブラリの活用がデファクトスタンダードとなっている。P-ULVSは、機械学習モデルを用いて有望な化合物を効率的に特定する「Active Learning」とドッキングシミュレーションを組み合わせることで、膨大な化合物空間からの高速な候補探索を可能にする。

大規模なライブラリ探索の有効性は、過去の多くの研究で実証されている。ライブラリサイズを1億から100億規模へと拡張することで、高活性アゴニストの発見率向上や、標準的手法と比較して約2〜5倍のヒット率改善が報告されている。特に、100億規模のライブラリを用いた場合、CB2Rで33%、ROCK1で28.5%という高いヒット率を達成した実績がある。P-ULVSは、こうした探索において、機械学習による選択とドッキング計算を反復するサイクルを繰り返すことで、全数計算では数百年を要する大規模シミュレーションを、計算リソースを最適化しつつ短時間で実行する。

実際のベンチマークテストでは、セロトニン受容体5-HT2ARを標的として、100億規模のライブラリから400万化合物（全体の0.04%）を評価した。その結果、ドッキングスコア上位の化合物の約80%を発見することに成功した。計算時間はNVIDIA V100 1枚を用いた場合と比較して、約1/1,500となる約2,000時間まで短縮されている。同様の性能はCB2R、JAK3、ROCK1といった他のターゲットタンパク質においても確認されており、いずれも72〜81%という高い再現率で上位化合物を取得した。

プロジェクトの要件に応じて、機械学習モデルが有望と予測した化合物を優先する「ML Best（Greedy）」戦略や、未知のケミカルスペースを広く探索する「Uncertainty Sampling」戦略など、柔軟な化合物選択が可能です。P-ULVSは、実験的なハイスループットスクリーニング（HTS）と比較してコストと時間を大幅に削減できるだけでなく、新規骨格の発見を強力に支援する。PFNは、この技術をさらに高度化させ、創薬プロセスの生産性向上を目指す方針である。