アップルニュース

Apple の最新 AI ツールは、説明に基づいて画像をアニメーション化できます

Apple は、大規模言語モデル (LLM) を利用してユーザーのテキスト プロンプトに基づいて静的画像をアニメーション化するツールを作成し、拡大する AI レパートリーに新たな追加を加えま​​した。





iwatchでアプリを削除する方法
DALL・Eで作成したMacRumors画像
Apple は、「」というタイトルの新しい研究論文でこのイノベーションについて説明しています。 Keyframer: 大規模な言語モデルを使用してアニメーション デザインを強化します。

「Dall・E や Midjourney などの商用のテキストから画像へのシステムでは、ワンショット プロンプト インターフェイスが一般的ですが、アニメーションでは、タイミングや調整など、より複雑なユーザーの考慮事項が必要であり、完全に指定するのは困難であると私たちは主張します。したがって、特にアニメーションの場合、ユーザーが生成されたデザインを繰り返し構築および改良できる代替アプローチが必要になる場合があります。



「私たちは、デザイン成果物を言語ベースでプロンプトするための新たな設計原則と LLM のコード生成機能を組み合わせて、Keyframer と呼ばれる新しい AI を活用したアニメーション ツールを構築しました。Keyframer を使用すると、ユーザーは自然言語プロンプトを介して静的な 2D 画像からアニメーション イラストを作成できます。 GPT-4 3 を使用して、Keyframer は入力された Scalable Vector Graphic (SVG) をアニメーション化する CSS アニメーション コードを生成します。

アニメーションを作成するには、ユーザーは SVG 画像 (たとえば宇宙ロケットの画像) をアップロードし、「空がさまざまな色に変化し、星がきらめく 3 つのデザインを生成する」などのプロンプトを入力します。次に、キーフレーマーはアニメーション用の CSS コードを生成します。ユーザーはコードを直接編集するか、追加のテキスト プロンプトを入力して、コードを調整できます。

「Keyframer を使用すると、ユーザーは事前にデザイン全体を検討する必要がなく、逐次的なプロンプトを通じてデザインを繰り返し調整することができました」と著者らは説明します。 「この取り組みを通じて、私たちは、LLM の強力な生成機能を組み合わせた将来のアニメーション デザイン ツールにインスピレーションを与え、クリエイターがクリエイティブなコントロールを維持できる動的エディターでデザインのプロトタイピングを迅速化したいと考えています。」

同紙によると、この研究はプロのアニメーションデザイナーやエンジニアへのインタビューによって得られたという。 「これは私がこれまで行ってきた多くのことよりもはるかに速かったと思います」と論文に引用されている研究参加者の一人は語った。 「以前ならこのようなことをするのに何時間もかかっていたと思います。」


このイノベーションは、Apple による一連の AI の画期的な進歩の最新のものにすぎません。先週、Appleの研究者らは、 解放された マルチモーダル LLM の能力を利用して画像のピクセル レベルの編集を実行する AI モデル。

12月下旬にはAppleも 明らかにした 革新的なフラッシュ メモリ利用技術を発明することで、メモリが限られた iPhone やその他の Apple デバイスへの LLM の導入が前進したと発表しました。

両方 情報 そしてアナリストのジェフ・プー氏は、Apple が何らかの生成 AI 機能を利用できるようになるだろうと述べています。 iPhone そして iPad 年末に 、 いつ iOS18 解放されます。 Apple のモバイル ソフトウェアの次のバージョンには、 Siriの強化版 ChatGPT のような生成 AI 機能を備えており、「iPhone」史上「最大の」アップデートとなる可能性があるとのことです。 ブルームバーグ マーク・ガーマン記者

電話番号なしでFacetimeする方法

(経由 ベンチャービート 。)