Apple、オープンソースの AI 画像エディター MGIE を発表

デジタル画像編集の分野では、Apple が最近発表した MGIE (Multimodal Large Language Model-Guided Image Editing) システムは重要な一歩を踏み出しました。この最先端の AI ツールは、大規模な言語モデルの機能を活用して、複雑な命令ベースの画像編集を解釈して実行し、ユーザーに前例のないレベルの制御と柔軟性を提供します。 MGIE の革新的なアプローチは、テキスト入力とビジュアル入力の力を組み合わせて、Photoshop のような調整、グローバルな写真の強化、および驚くべき効率での正確なローカル編集を容易にします。

アップルMGIE

MGIE の開発は、テクノロジーと創造性の限界を押し広げ、高度な編集作業を簡素化するだけでなく、オープンソース コミュニティ内でのコラボレーションとイノベーションを促進するプラットフォームを提供するという Apple の取り組みを体現しています。マルチモーダル学習技術を統合することにより、MGIE は以前の画像編集システムを大幅に改善し、ユーザーの指示をより表現力豊かで正確に解釈できるようになります。 OpenAI の Midjourney や DallE 3 などのシステムにオープンソースの競争を提供します。

オープンソースの画像エディター

近年、人工知能とクリエイティブ ツールの交差点により、デジタル メディアとのやり取りの方法が革命的に進歩しました。 Apple による MGIE システムの導入は、この継続的な変革の証しであり、AI を活用した創造性の新たな標準を確立しています。

MGIE (MLLM-Guided Image Editing) は、カリフォルニア大学の研究者と共同で開発されたオープンソース AI モデルです。このモデルは、自然言語命令に基づいて複雑な画像操作を実行できる機能が特徴で、マルチモーダル大規模言語モデル (MLLM) に依存してユーザーのリクエストを正確に解釈します。 MGIE を使用すると、明るさやコントラストの調整などの全体的な写真の補正から、トリミング、サイズ変更、フィルターの追加などのローカル編集や Photoshop のような編集まで、幅広い編集を実行できます。

iOSの18

ピザをよりヘルシーにする、写真の焦点を変更するなどのコマンドを理解し、実行する彼の能力は、彼の高度な常識と手レベルの操作スキルの証拠です。 2024 年の学習表現国際会議 (ICLR) で発表され、GitHub で入手できる MGIE の開発は、Apple にとって AI 研究における大きな前進を表しており、他の重要な AI プロジェクトや iOS 18 での生成 AI 機能の期待に密接に続いています。

MGIE は高度な AI 機能とユーザーフレンドリーな画像編集の間の架け橋となり、明るさ、コントラスト、シャープネスの調整などの全体的な写真の補正から、形状、サイズ、画像内の特定の要素の色またはテクスチャ。さらに、トリミング、サイズ変更、回転、さまざまなフィルターの適用など、Photoshop のような操作に優れており、ユーザーはデジタル環境を前例のないレベルで制御できます。

拡張言語モデルに基づいたマルチモーダルな画像編集

MGIE の最も注目すべき側面の 1 つは、常識に基づいて推論する能力です。これにより、ピザに野菜のトッピングを追加してより健康的に見せたり、写真のコントラストを改善して追加の光をシミュレートしたりするなどのタスクを実行できます。このレベルの直感的な操作により、よりクリエイティブでパーソナライズされた画像編集への道が開かれ、AI テクノロジーで達成できる限界が押し広げられます。

カリフォルニア大学とのコラボレーション、および 2024 年の学習表現国際会議 (ICLR) での MGIE のプレゼンテーションは、Apple の AI 研究努力における重要なマイルストーンを示します。 GitHub で利用できる MGIE は、そのコード、データ、事前トレーニングされたモデルへのアクセスを科学コミュニティとクリエイティブ コミュニティ全体に提供することで、継続的な探索と開発を促します。

AI画像生成・加工に関する研究

この取り組みは、iPhone やメモリが限られたその他のデバイスに大規模な言語モデルを展開するという最近の成果で証明されているように、Apple の AI 研究に対する広範な取り組みの一環です。ライバルの「Apple GPT」と大規模言語モデル用の「Ajax」フレームワークの開発は、AI技術の進歩に対する同社の取り組みを強調している。さらに、ChatGPT のような機能を備えた Siri の強化版など、iOS 18 での生成 AI 機能の期待は、AI がすべてのデバイスに統合される方法に大きな変化をもたらすことを示唆しており、iPhone 史上「最大の」ソフトウェア アップデートとなる可能性があります。業界アナリストによると。

MGIE は単なるツールではなく、技術革新と芸術表現の間の橋渡しとなるため、デジタル クリエイティビティの未来の前触れでもあります。そのオープンソースの開発と配布は、テクノロジーが生産性の向上に役立つだけでなく、直観的でアクセスしやすい強力なツールを通じて創造性と個人の表現を促進する世界という Apple のビジョンを強調しています。 MGIE は進化するにつれて、画像編集の状況を再定義し、高度な AI 主導の画像操作をより幅広い視聴者が利用できるようにし、デジタル アートの新時代を促進することが期待されています。

続きを読むガイド:

コメントを残します

あなたのメールアドレスは公開されません。 必須フィールドは、マークされています *