Midjourney 5 は、AI で生成された画像のほぼすべての側面を改善します
よくなっている:最近のニュースはすべて ChatGPT やその他の大規模な言語モデルを中心に展開しているため、それらのいとこである AI 画像ジェネレーターがまだ改良中であることは忘れられがちです。 被写体を悪夢のようなものにせずに目と手をレンダリングする方法を見つけた人もいるかもしれません。 しかし、この結果を見て不快に思う人もいます。
今週初め、研究所 Midjourney は、自社の名前を冠した AI イメージング ソフトウェアのバージョン 5 のベータ版をリリースしました。 Twitter での発表によると、最新バージョンでは、より高画質、より「多様な」結果、より幅広いスタイル、シームレスなテクスチャなどが追加されています。
本日より、私たちのコミュニティは Midjourney V5 をテストできるようになりました。 はるかに高い画質、より多様な出力、より広いスタイル範囲、シームレスなテクスチャのサポート、より広いアスペクト比、より優れた画像プロンプト、より広いダイナミック レンジなどを備えています。 探検してみよう!
ユーザーはすでに何百もの素晴らしい結果を投稿しており、改善に対する感情はさまざまです。 画像処理 AI は影、反射、目、手などの要素を生成するのに苦労しているため、ほとんどの人が感銘を受けています。 以下は、マシンに問題がある場所の例として、OpenAI の Dall-E を使用して作成した画像です。
構図が少しずれていて、全体的に漫画っぽい雰囲気になっています。 照明が全部ダメなんです。 目と手がひどく変形しています。 ポップコーンの容器や被験者の隣の座席と同様に、脚は人工物で汚れています。 この結果は、さまざまな程度で同様の問題が発生した 4 件のうちの 1 件です。
Midjourney のバージョン 5 は、少なくとも他の人が共有した例からすると、この点で改善されているようです。 単純なプロンプトからの結果は不気味の谷に隣接しており、多くの場合プロの写真として通用するほど現実的ですが、それでもその奇妙な品質では完全に評価することはできません。 信じられないほどリアルですが、多くの人がこの画像を不気味だと評しています。
ミッドジャーニーv5が登場! (今回は本当です、笑)ここに、私のプロンプト、v4 と v5 をいくつか並べて示します。また、いくつかの新しいプロンプトと群衆のショットも示します。 実験しながらこれにさらに追加します。𧵠pic.twitter.com/qSEZWQBXou
私たち自身の Kishalaya Kundu は、ほぼ完璧な一連のミッドジャーニー V5 の写真を見た後、「正直に言うと、感動するよりも怖いです」と言いました。 懸念されるのは、簡単に偽の画像を作成し、それを本物のように偽装してしまう可能性があるということです。
クリープ要因は別として、V4 と比較して、Midjourney V5 は品質が劇的に向上しています。 グラフィック デザイナーの Julie Wieland 氏は、Midjourney V4 (昨年 11 月リリース) をしばらく使用しており、バージョン 5 には「信じられないほどリアルな」肌テクスチャがあると述べています。 反射、グレア、影などの照明効果も大幅に向上しています。 おそらく最も重要なことは、AI がほとんどの場合自然に見える手と目を生成することです。
「MJ ヒント: 窓越しのショットが V5 でついに可能になりました。Dalle2 を初めて試したとき (そしてうまくいきました) 以来、私は「My Blueberry Nights」の美しさを切望していましたが、v5画像の ALT テキストでプロンプトを見つけてください #synthography #midjourneyv5 pic.twitter.com/kAOagopucG
「目はほぼ完璧で、もう不安定ではありません」とヴィーランド氏はArs Technicaに語った。 「ほとんどの場合、手は正しく、片手で 7 ~ 10 本の指ではなく 5 本の指を使います。MJ v5 は、視力の悪さを少し長い間無視しすぎて、ようやくメガネを手に入れたような気分です。突然、すべてが 4K で見えるようになります。奇妙に圧倒的な気がするが、同時に驚くべきことだ。」
若い女性の 1960 年代のストリート スタイルの写真、座っている、ヨット、グリーン ディオール ドレス、シルク グリーン ドレス、グリーン ドレス、シルク、パール ネックレス、ティファニーの真珠、ティファニーのパール ネックレス、夕日、海、Agfa Vista 200 で撮影、4k --ar 16:9v4(左)v5(右) pic.twitter.com/wz7GbI3fvA
Midjourney では、ネイティブ解像度も 512x512px から 1024x1024px に向上しました。 この増加により、Dall-E と一致します。 ただし、バージョン 4 では、スーパーサンプリングしてネイティブ解像度を 2 倍にすることができます。 V5 が同じ技術を使用して 2048x2048 の画像を生成すると期待するのも無理はありませんが、それはさらに先のアップデートのための話です。
肝心なのは、MidJourney が AI シーンに登場したのは 1 年前だということです。 今週Twitterフィードに溢れたこれらの画像の多く(すべてではない)は手つかずのままだ。 以前、Weiland 氏は、Dall-E による「アウトペイント」や Photoshop でのタッチアップなど、さまざまなテクニックを組み合わせて Midjourney 4 のビジュアル品質を向上させていました。 バージョン 5 では、生成後の編集が少なくなり、おそらく想像よりも早く写真のように完璧な画像が提供されることが約束されています。 この見通しは確かに刺激的であると同時に恐ろしいものでもあります。
よくなっている: