Fundamentalが表形式データ専用モデルNEXUSをAWS上で公開
- •Fundamentalは、表形式データの予測に特化した基盤モデルNEXUSをAmazon SageMaker JumpStartで公開した。
- •100億行以上のデータで事前学習済みであり、自動特徴量エンジニアリングと決定論的出力を実現する。
- •ユーザーは8基のNVIDIA H200 GPUを搭載したAmazon SageMaker上でNEXUSを展開し、安全な大規模分析を実行できる。
Fundamentalは、構造化データ分析向けの大規模表形式モデルNEXUSを開発し、Amazon SageMaker JumpStartを通じて提供を開始した。この基盤モデルは100億行以上の表形式データで事前学習されており、従来の機械学習で必要とされていた手動での特徴量エンジニアリングを介さずに、企業データを用いた予測を可能にする。決定論的アーキテクチャを採用することで、標準的な大規模言語モデルのような不確定性を排除し、一貫性のある再現可能な結果を出力する。
NEXUSは、列の順序に関わらず性能が安定する順序不変性と、異なるテーブル間を関連付けるクロススキーマ推論など、構造化データに特化した機能を備える。また、自律的なデータクリーニング機能により、データの切り捨てなしで大規模データセットの処理に対応する。本システムは、取引頻度や経済指標に基づいた顧客離脱予測といった、複数テーブルにわたる多次元的な相関関係の把握に最適化されている。
Amazon SageMaker AIでの利用にあたっては、AWS Marketplace経由でモデルパッケージをサブスクライブし、8基のNVIDIA H200 GPUを搭載したml.p5en.48xlargeインスタンスにデプロイする。FundamentalのPython SDKはscikit-learn互換のインターフェースを提供し、学習や推論をサポートする。Amazon S3にデータをアップロードし、clf.fitやclf.predictといった標準的なPythonコマンドを用いることで、自動クリーニングから特徴抽出までを一元管理できる。
NEXUSはベースモデルのほか、金融、ヘルスケア、製造、小売向けの業界特化型バリアントが提供される。金融分野では不正検知や信用リスク分析、ヘルスケアでは臨床試験マッチングやリスク層別化などに活用可能だ。AWSの環境下では、データはシングルテナントでネットワークから隔離された環境に留まり、GDPR、HIPAA、SOC 2といったセキュリティ要件に準拠する。SageMaker AIの管理インフラを活用することで、企業はパイプラインを通じた自動再学習と、ペタバイト規模のワークロードへの予測スケーリングが可能となる。