Midjourney、次世代モデルに向けた人間主導のランク付けを開始
- •Midjourneyが次世代v8.1/v8.2モデルの開発に向け、2K解像度でのユーザー参加型ランキングを開始した。
- •人間によるフィードバックループを活用し、生成される画像の「ネイティブ」な高精細品質の向上を目指す。
- •ユーザーは提示された画像を評価またはスキップするシンプルな操作で、モデルの美学的判断の学習に貢献する。
Midjourneyはコミュニティに対して新たな呼びかけを行い、次世代モデルの開発プロセスに転換をもたらそうとしている。現在、同社は2K解像度の画像出力に特化した「ランキングパーティー」への参加を募っている。この取り組みの目的は、次期モデルであるv8.1およびv8.2の開発において、人間の好みを反映させた精緻な美学的基準を確立することにある。
評価プロセスを高解像度に移すことで、事後的なアップスケーリングに依存するのではなく、モデル自身の出力として「ネイティブ」な高精細さを備えさせる狙いがある。生成AIの軌跡を追う学生にとって、この動きはAIの性能におけるデータキュレーションの重要性を如実に示している。高品質な出力は計算資源だけでなく、何が美しいかを定義する人間の繊細な感性に大きく依存するのだ。
コミュニティをフィードバックループに巻き込むことは、クラウドソーシングによるモデルの洗練といえる。これはHuman-in-the-loopの典型的な手法であり、人間の主観的な評価を通じて、自動システムを特定の創造的な成果へと誘導するものである。
このプロセス自体は非常に直感的で、ユーザーは提示された二つの画像から優れている方を選択するか、あるいはスキップするかを選ぶだけでよい。このシンプルな操作の裏には、モデルの品質解釈を人間の期待値にピクセルレベルで同期させるという複雑な課題が隠されている。解像度と視覚的忠実度を高める進化の中で、こうした共同作業は生データの生成とプロ級の美的出力とを繋ぐ重要な架け橋となる。
今回の2K解像度へのフォーカスは、生成メディア界における視覚的忠実度を巡る激しい競争を浮き彫りにしている。生成モデルが高度化するにつれ、各ツール間の差別化は、質感や光の表現、構図をいかに高解像度で理解できるかという点に収束していくだろう。ユーザーとの直接的な対話を通じて、同社は自社の技術を、実際のクリエイティブな現場で求められる美的水準へと最適化しようとしている。