フォーラム

M1 GPUの使用量がメモリプールを損なう?

NS

majormike

オリジナルポスター
2012年5月15日
  • 2021年1月31日
やあ、

GPUを実行するためにM1がメモリプールからどのくらいのRAMを使用しますか?

音楽制作用に入手したいのですが、16ギガで満足できますが、GPUが使用しているメモリの量、特に外部ディスプレイでのメモリ量がわかりません。

ワープ9

2017年6月8日
  • 2021年1月31日
ディスプレイの実行に必要なのは数メガバイトだけですが、GPUは機械学習、ピクセルアレイ、および特殊な計算にも使用されます。それは本当にあなたが使用しているソフトウェアに依存します。

設定を見て、GPU設定を見つけることができるかどうかを確認してください。たとえば、PhotoshopはGPUを多用できますが、無効にすることもできます。
反応:装甲

Wizec

2019年6月30日


  • 2021年1月31日
AAをオンにして、高から非常にグラフィックス設定で1080pでゲームを行うには、4GBから6GBのビデオメモリが必要です。

2021年のゲームにはどのくらいのビデオメモリ(VRAM)が必要ですか?

現代の最新のAAAゲームのさまざまな解像度とグラフィック設定でゲームをするためにグラフィックカードに必要なビデオメモリ(VRAM)の量を調べてください。ビデオメモリまたはVRAMは、ディスクリートグラフィックカードまたはビデオカードで使用される高速DRAM(ダイナミックRAM)です。これはバッファメモリです、ただ... graphicscardhub.com
ゲームをしていない場合は、モニターの解像度と色深度にもよりますが、おそらく数百MBしかありません。 4Kと数百万色に達すると、Webブラウジングなどのタスクの場合でも、はるかに高くなる可能性があります。

私たちが見つけた唯一の潜在的な問題は、4k Webブラウジングテスト中に発生しました。ログには、1,260MBものビデオメモリを使用しているビデオカードが示されていました。これを概観すると、これは、1080pモニターで同じタスクを実行した場合に使用されるビデオメモリの約3倍になります。

4Kモニターの要件と使用法

4kディスプレイは、標準の1080pディスプレイの約4倍のピクセル数を備えているため、画質が大幅に向上します。しかし、このテクノロジーはまだ比較的新しいため、4kモニターを実行するために何が必要かについて多くの質問や誤解があります。そうするには... www.pugetsystems.com最終編集日:2021年1月31日
反応:タグバート NS

レマン

2008年10月14日
  • 2021年2月1日
majormikeは言った:こんにちは、

GPUを実行するためにM1がメモリプールからどのくらいのRAMを使用しますか?

音楽制作用に入手したいのですが、16ギガで満足できますが、GPUが使用しているメモリの量、特に外部ディスプレイでのメモリ量がわかりません。

私はこれについて心配しません。すべてのシステムは、基本的な機能を処理するためにいくらかのメモリを予約しています。M1は、この点でIntelマシンとそれほど違いはありません。 GPUはRAMを共食いしません。言うまでもなく、音楽制作ソフトウェアはGPUを使用して処理を行う可能性があります。 NS

Modernape

2010年6月21日
  • 2021年2月1日
M1 GPUには、IntelマシンのようにRAMが割り当てられていません。この場合、GPUにはおそらく1.5 GBが割り当てられているため、CPUは使用できません。 GPUをそれほどハードに使用していない場合は、RAMのほとんどをCPUで使用できます。
反応:mds1256およびLeeW NS

レマン

2008年10月14日
  • 2021年2月1日
Modernapeは次のように述べています。M1GPUにはIntelマシンのようにRAMが割り当てられていないため、GPUにはおそらく1.5GBが割り当てられているため、CPUは使用できません。 GPUをそれほどハードに使用していない場合は、RAMのほとんどをCPUで使用できます。

どうやってこれを知っていますか? NS

Modernape

2010年6月21日
  • 2021年2月1日
レマンは言った:どうやってこれを知っていますか?
m1socユニファイドメモリアーキテクチャ - Google検索
反応:mds1256、chabigおよびconsumeritis NS

レマン

2008年10月14日
  • 2021年2月1日
Modernapeは言った: m1socユニファイドメモリアーキテクチャ - Google検索

それはあなたがしている主張をどのようにサポートすることになっていますか?私が求めているのは、GPUメモリ割り当てがIntelとApple GPUで異なる動作をするという事実の証拠、またはそのような事実の証拠を提示するソースへの参照がありますか?どちらも、CPUとGPU間で共有される最終レベルのキャッシュを備えたユニファイドメモリアーキテクチャを使用しています。 M1は確かにGPU用にいくらかのメモリを予約していますが、どれくらいかはわかりません。 NS

Modernape

2010年6月21日
  • 2021年2月1日
レマンは言った:それはあなたがしている主張をどのようにサポートすることになっていますか?私が求めているのは、GPUメモリ割り当てがIntelとApple GPUで異なる動作をするという事実の証拠、またはそのような事実の証拠を提示するソースへの参照がありますか?どちらも、CPUとGPU間で共有される最終レベルのキャッシュを備えたユニファイドメモリアーキテクチャを使用しています。 M1は確かにGPU用にいくらかのメモリを予約していますが、どれくらいかはわかりません。
うわー、あなたはそれらの記事をすぐに読んだに違いありません。あ、ちょっと待って。あなたはそれらを読んでいませんでした。
反応:mds1256、jerrykおよびchabig NS

レマン

2008年10月14日
  • 2021年2月1日
Modernapeは言った:うわー、あなたはそれらの記事をすぐに読んだに違いない。あ、ちょっと待って。あなたはそれらを読んでいませんでした。

私はそれらの中で最も関連性の高いものを読んだと確信しています。 12月にユニットを入手して以来、M1GPUのテクニカル分析と低レベルのベンチマークも行っています。それが私が尋ねている理由でもあります。おそらく、私がまだ気付いていない新しい技術情報がそこにあるのかもしれません。 NS

chabig

2002年9月6日
  • 2021年2月1日
あなたの質問に答えることは不可能です。テキストエディットがどれだけのメモリを使用しているかを尋ねるようなものです。それはすべてあなたがしていることに依存します。 CPUとGPUは、刻々と変化するニーズに応じてRAMを共有します。

これがAppleのリファレンスです:

AppleシリコンMacの新しいシステムアーキテクチャを探る-WWDC20-ビデオ-AppleDeveloper

Appleシリコンを搭載したMacが、AppleのSystem-on-Chip(SoC)アーキテクチャを使用して最新の利点をどのように提供するかをご覧ください。統一されたレバレッジ... developer.apple.com
見積もり、
すべてを1つのチップに組み込むことで、システムにユニファイドメモリアーキテクチャが提供されます。

これは、GPUとCPUが同じメモリ上で動作していることを意味します。テクスチャ、画像、ジオメトリデータなどのグラフィックリソースは、PCIeバスを介してデータをコピーする必要がないため、オーバーヘッドなしでCPUとGPU間で効率的に共有できます。

クリービック

2003年9月8日
  • 2021年2月1日
レマンは言った:私はそれらの中で最も関連性のあるものを読んだと確信しています。 12月にユニットを入手して以来、M1GPUのテクニカル分析と低レベルのベンチマークも行っています。それが私が尋ねている理由でもあります。おそらく、私がまだ気付いていない新しい技術情報がそこにあるのかもしれません。

IntelデスクトップおよびラップトップチップはUMAを使用せず、共有メモリを使用します。 Intelでは、GPUに使用するRAMのパーティションチャンクを割り当てる必要があります。 CPUはGPUに割り当てられたパーティションにアクセスできません。その逆も同様です。したがって、パーティション間でデータをコピーする必要があります。

ユニファイドメモリと共有メモリの全体的な違いは、パーティション分割がないことです。 GPUとCPUは同じメモリブロックにアクセスできます。 Intelと比較すると、2つの特定の利点があります。

1.ビデオメモリとして使用するRAMを事前に割り当てる必要がないため、ビデオメモリの特定の制限(前述の1.5 GB)に対処する必要がなく、CPUとGPUの需要のバランスをより簡単にとることができます。
2.バッファをコピーする必要がないということは、RAMをある程度節約し、メモリ帯域幅への負荷を減らし、レイテンシを少し増やすことを意味します。

これらの利点が、ゲーム機がUMAを使用する理由です。メモリとレイテンシの節約は、必要なGDDRのコストを抑えるのに役立ちます。
反応:装甲とjdb8167 NS

レマン

2008年10月14日
  • 2021年2月1日
Krevnik氏は次のように述べています。IntelデスクトップおよびラップトップチップはUMAを使用せず、共有メモリを使用します。 Intelでは、GPUに使用するRAMのパーティションチャンクを割り当てる必要があります。 CPUはGPUに割り当てられたパーティションにアクセスできません。その逆も同様です。したがって、パーティション間でデータをコピーする必要があります。

Intelのドキュメントはあなたに同意しません。

https://software.intel.com/sites/default/files/managed/db/88/The-Architecture-of-Intel-Processor-Graphics-Gen11_R1new.pdf#page19
私が補充する限り、Intelは少なくともSandy Bridge以来、おそらくそれ以前からユニファイドメモリを使用してきました。いくつかの制限があるかもしれませんが、100%確実ではありません。最終編集日:2021年2月1日
反応:AAPLGeek NS

荷物

2011年7月29日
  • 2021年2月1日
majormikeは次のように述べています。音楽制作用に入手したいのですが、16ギガで満足できますが、GPUが使用するメモリの量、特に外部ディスプレイではわかりません。
誰かが意図したワークロードに近い何かを実行している16GBM1マシンからのメモリ圧力の読み取り値を報告しない限り、誰もが推測します。 「音楽制作」は、最初は文字列の一部です(RAMの使用量は、使用している仮想楽器とプラグインの種類に完全に依存します)。一部の音楽アプリには非常に精巧なUIがあり、高解像度のディスプレイをいくつか実行するには、ビデオに割り当てるRAMを増やす必要があります。特に、すべてが内部バッファーにレンダリングされてからダウンサンプリングされるスケーリングモードを使用している場合はそうです。

たぶん、M1はあなたの仕事をするだけでなく、それがオールラウンドでより効率的であり、ラウンドアバウトで失ったものがスイングで得られるので、より速くそれをします-そしてそれが実行されていることを示すたくさんのYoutubeデモがありましたLogicProのトラックとインストゥルメントのシェッドロード。

ただし、安全な前提は、ワークフローが実際にIntelで16GBを超える必要がある場合、少なくとも 利点 Appleシリコンで16GB以上から、ハイエンドのAppleシリコンシステムが出るのを待つのが最善でしょう。 M1ができるとしても 現在 ハイエンドのInteliMacまたは16フィートMBPを上回り、6か月後には、その顔に砂が蹴られます。この奇妙な休止状態では、エントリーレベルのMacが、より高価なMacよりも明らかに優れています。長さ - Appleはそれを続ける余裕がない またはそれはハイエンドのMacの売上高に打撃を与えるだろう。

そうは言っても、あなたはあなたが 本当にします そもそもIntelMacのすべてのRAMが必要です(メモリ圧力を見てください)。

ビデオRAMに関しては、M1はIntel統合グラフィックスを搭載したMacBookやMiniよりも優れていることはほぼ間違いありません。対そのiMac それだけ 8GB以上のVRAMを搭載したディスクリートGPUを搭載しているため、わかりにくいです。

(また、必要なすべてのプラグイン、ドライバーなどが、M1はもちろん、Big Surと互換性があるかどうかを注意深く確認する必要があります...)

Modernapeは言った:うわー、あなたはそれらの記事をすぐに読んだに違いない。あ、ちょっと待って。あなたはそれらを読んでいませんでした。

インターネットが偽の情報と根拠のない憶測で泳いでいるとき、誰かに効果的に「グーグルに行く」ように言うことは特に役に立ちません。私が見たすべて Appleから 非常に曖昧で、技術情報よりもマーケティングが多く、RAMの割り当て方法については何も述べていない「デバイス間でデータをコピーする必要がないため、ユニファイドメモリの方が高速です」に要約されています。 Google検索で得られるのは、同じ限られたAppleデータを推測している多くの技術サイトだけです。同等のVRAMが「オンデマンド」で割り当てられる可能性は非常に妥当な推測ですが、誰かが Appleドキュメント その詳細、それ 投機。

現実はそのユニファイドメモリのようです より効率的ですが どうやって より効率的であるとテストするのは難しく、M1の他のパフォーマンスの向上から分離するのは難しいです(...ハイエンドのAppleシリコンMacが登場すると、それほど印象的ではないように見えるかもしれません)。

YouTubeのものの多くは、「使用されたメモリ」と「使用されたメモリ」または「使用されたスワップ」とスワップの違いを理解していない人々から来ているようです 割合 - または、IntelシステムでRAMに負担をかけないワークフローでRAM関連の高速化を探しています...
反応:装甲とmszilard

mi7chy

2014年10月24日
  • 2021年2月1日
クリービックは次のように述べています。ユニファイドメモリと共有メモリの全体的な違いは、パーティション分割がないことです。 GPUとCPUは同じメモリブロックにアクセスできます。 Intelと比較すると、2つの特定の利点があります。

1.ビデオメモリとして使用するRAMを事前に割り当てる必要がないため、ビデオメモリの特定の制限(前述の1.5 GB)に対処する必要がなく、CPUとGPUの需要のバランスをより簡単にとることができます。
2.バッファをコピーする必要がないということは、RAMをある程度節約し、メモリ帯域幅への負荷を減らし、レイテンシを少し増やすことを意味します。

Intelは、動的割り当てとゼロコピーバッファで別の言い方をします。 BS無視リストが大きくなっています。

https://www.intel.com/content/www/us/en/support/articles/000020962/graphics.html

https://software.intel.com/content/...uffer-copies-on-intel-processor-graphics.html 最終編集日:2021年2月1日
反応:AlumaMac、leman、AAPLGeek

thedocbwarren

2017年11月10日
サンフランシスコ、カリフォルニア州
  • 2021年2月1日
これが役立つと思います: https://developer.apple.com/videos/play/wwdc2020/10632/

これは、モバイル、コンソール、および低電力GPUで一般的なレンダリング方法を説明しています。これが、dGPUよりも必要なメモリが少ない理由です。タイルレンダリングは、小さなタイルで3Dを処理したり、変更をスキャンしたりする方法です。これは、コンソールだけでなく、新しいタブレット(iPad)でも長年にわたって行われてきました。

それを考えると、テクスチャや赤くするためにどれだけのメモリを使用するかは、カットして乾かすことはありません。これは、dGPUがフレームバッファでどのように機能するかとは異なります。

theluggageは次のように述べています。意図したワークロードに近いものを実行している16GBM1マシンからのメモリ圧力の読み取り値を誰かが報告しない限り、誰もが推測します。 「音楽制作」は、最初は文字列の一部です(RAMの使用量は、使用している仮想楽器とプラグインの種類に完全に依存します)。一部の音楽アプリには非常に精巧なUIがあり、高解像度のディスプレイをいくつか実行するには、ビデオに割り当てるRAMを増やす必要があります。特に、すべてが内部バッファーにレンダリングされてからダウンサンプリングされるスケーリングモードを使用している場合はそうです。

たぶん、M1はあなたの仕事をするだけでなく、それがオールラウンドでより効率的であり、ラウンドアバウトで失ったものがスイングで得られるので、より速くそれをします-そしてそれが実行されていることを示すたくさんのYoutubeデモがありましたLogicProのトラックとインストゥルメントのシェッドロード。

ただし、安全な前提は、ワークフローが実際にIntelで16GBを超える必要がある場合、少なくとも 利点 Appleシリコンで16GB以上から、ハイエンドのAppleシリコンシステムが出るのを待つのが最善でしょう。 M1ができるとしても 現在 ハイエンドのInteliMacまたは16フィートMBPを上回り、6か月後には、その顔に砂が蹴られます。この奇妙な休止状態では、エントリーレベルのMacが、より高価なMacよりも明らかに優れています。長さ - Appleはそれを続ける余裕がない またはそれはハイエンドのMacの売上高に打撃を与えるだろう。

そうは言っても、あなたはあなたが 本当にします そもそもIntelMacのすべてのRAMが必要です(メモリ圧力を見てください)。

ビデオRAMに関しては、M1はIntel統合グラフィックスを搭載したMacBookやMiniよりも優れていることはほぼ間違いありません。対そのiMac それだけ 8GB以上のVRAMを搭載したディスクリートGPUを搭載しているため、わかりにくいです。

(また、必要なすべてのプラグイン、ドライバーなどが、M1はもちろん、Big Surと互換性があるかどうかを注意深く確認する必要があります...)



インターネットが偽の情報と根拠のない憶測で泳いでいるとき、誰かに効果的に「グーグルに行く」ように言うことは特に役に立ちません。私が見たすべて Appleから 非常に曖昧で、技術情報よりもマーケティングが多く、RAMの割り当て方法については何も述べていない「デバイス間でデータをコピーする必要がないため、ユニファイドメモリの方が高速です」に要約されています。 Google検索で得られるのは、同じ限られたAppleデータを推測している多くの技術サイトだけです。同等のVRAMが「オンデマンド」で割り当てられる可能性は非常に妥当な推測ですが、誰かが Appleドキュメント その詳細、それ 投機。

現実はそのユニファイドメモリのようです より効率的ですが どうやって より効率的であるとテストするのは難しく、M1の他のパフォーマンスの向上から分離するのは難しいです(...ハイエンドのAppleシリコンMacが登場すると、それほど印象的ではないように見えるかもしれません)。

YouTubeのものの多くは、「使用されたメモリ」と「使用されたメモリ」または「使用されたスワップ」とスワップの違いを理解していない人々から来ているようです 割合 - または、IntelシステムでRAMに負担をかけないワークフローでRAM関連の高速化を探しています...

dmccloud

2009年9月7日
アラスカ州アンカレッジ
  • 2021年2月1日
レマンは言った:それはあなたがしている主張をどのようにサポートすることになっていますか?私が求めているのは、GPUメモリ割り当てがIntelとApple GPUで異なる動作をするという事実の証拠、またはそのような事実の証拠を提示するソースへの参照がありますか?どちらも、CPUとGPU間で共有される最終レベルのキャッシュを備えたユニファイドメモリアーキテクチャを使用しています。 M1は確かにGPU用にいくらかのメモリを予約していますが、どれくらいかはわかりません。

x86は、システムRAMに統合メモリを使用しません。 UMAは、CPUキャッシュではなく、システムのRAMセットアップを指します。 x86プラットフォームでは、システムはRAMをCPUとiGPUセクションに分割します。 iGPUの場合、システムは通常、GPU操作に約2GBを割り当てます。つまり、CPUに使用できるのは6GBのみです。データをCPUとiGPUの両方で操作する必要がある操作の場合、データはシステムバスを介してRAMに2回コピーされ(パーティションごとに1回)、RAMから返される2つのデータセットを調整する必要があります。追加の処理時間を追加します。 M1が使用するUMAセットアップでは、CPUとiGPUの両方が同時にフルシステムRAMにアクセスできます(つまり、CPUとGPUの間でRAMのパーティション化はありません)。つまり、データは一度だけRAMにコピーされます。操作は同時に発生する可能性があり、RAMからCPUに戻された同じデータの2つのバージョンの調整に関連するオーバーヘッドはありません。
反応:装甲とchabig

dmccloud

2009年9月7日
アラスカ州アンカレッジ
  • 2021年2月1日
レマン氏は次のように述べています。Intelのドキュメントはあなたに同意しません。

https://software.intel.com/sites/default/files/managed/db/88/The-Architecture-of-Intel-Processor-Graphics-Gen11_R1new.pdf#page19
私が補充する限り、Intelは少なくともSandy Bridge以来、おそらくそれ以前からユニファイドメモリを使用してきました。いくつかの制限があるかもしれませんが、100%確実ではありません。

理解しなければならないことの1つは、Intelによる「UMA」という用語の使用は誤解を招く可能性があるということです。 Intelの目的のために、彼らはIntel HDの名前をUMAに変更しただけで、基盤となるアーキテクチャに変更を加えていません。一方、Appleのアプローチは、基本的に、AMDがRyzenシリーズCPU用のInfinityFabricテクノロジーの開発で何年にもわたって試みてきたものです。 AppleのアプローチがIntelのアプローチと同じではない理由を比較的簡単に説明します。

M1プロセッサのメモリは、プロセッサの任意の部分からアクセスできる単一のプールです。システムがグラフィックス用により多くのメモリを必要とする場合、システムはそれを割り当てることができます。同様に、ニューラルエンジン用により多くのメモリが必要な場合。さらに良いことに、プロセッサのすべての側面がすべてのシステムメモリにアクセスできるため、グラフィックコアが以前にプロセッサコアによってアクセスされていたものにアクセスする必要がある場合でも、パフォーマンスが低下することはありません。 他のシステムでは、データをメモリのある部分から別の部分にコピーする必要がありますが、M1ではすぐにアクセスできます。

上記の「割り当て」についての言及でさえ、誤解を招き、x86プラットフォームのアーティファクトです。 AppleのUMAはGPUとCPUの間でRAMを分割しないため、CPUとGPUの間でRAMを実際に割り当てることはありません。

M1 Macの場合、メモリは以前の状態ではありません

Appleは、コンピュータでのRAMの使用方法を変更しました。そして、私たちの考え方を変える時が来ました。
反応:装甲、chabig、mds1256

クリービック

2003年9月8日
  • 2021年2月1日
dmccloudによると:Intelが「UMA」という用語を使用していることは誤解を招く可能性があることを認識しておく必要があります。 Intelの目的のために、彼らはIntel HDの名前をUMAに変更しただけで、基盤となるアーキテクチャに変更を加えていません。

私は正直に言うと、lemanとmi7chyは(派手な態度にもかかわらず)、Intelが少なくともゼロコピーと動的パーティションサイジングをサポートしているという優れた情報源を示しています。

あなたが主張するようにそれが本当のUMAでなくても、私がこれまで読んだドキュメントからは、少なくともゼロコピーに使用されるメモリページを割り当てることができるように見えます。両側で同じRAMページを使用できます。

時間が増えたらドキュメントが答えてくれることを期待している質問は、それらのページがより詳細に処理される方法と、これを最大限に活用するためにOSがどのような統合を行う必要があるかです。しかし、その答えがあっても、OS APIがGPUにページの管理方法を通知する必要がある場合、Appleはそこでどの程度の最適化を行ったのでしょうか。

レマン氏は次のように述べています。Intelのドキュメントはあなたに同意しません。

https://software.intel.com/sites/default/files/managed/db/88/The-Architecture-of-Intel-Processor-Graphics-Gen11_R1new.pdf#page19
私が補充する限り、Intelは少なくともSandy Bridge以来、おそらくそれ以前からユニファイドメモリを使用してきました。いくつかの制限があるかもしれませんが、100%確実ではありません。

ウェルプ、インテルのGPUアーキテクチャに関する私の理解は時代遅れであることが証明されています。実際、その場合、大きな違いはないはずです。

私の理解では、まだいくつかの固定パーティションが進行中であるということでしたが、Googleがこれに関する古い記事を浚渫しているようで、間違った道をたどりました。

thedocbwarrenは言った:これが役立つと思う: https://developer.apple.com/videos/play/wwdc2020/10632/

これは、モバイル、コンソール、および低電力GPUで一般的なレンダリング方法を説明しています。これが、dGPUよりも必要なメモリが少ない理由です。タイルレンダリングは、小さなタイルで3Dを処理したり、変更をスキャンしたりする方法です。これは、コンソールだけでなく、新しいタブレット(iPad)でも長年にわたって行われてきました。

それを考えると、テクスチャや赤くするためにどれだけのメモリを使用するかは、カットして乾かすことはありません。これは、dGPUがフレームバッファでどのように機能するかとは異なります。

ビデオを再スキミングした後の私の理解(最後にビデオを視聴してから数か月が経ちました)は、これが必ずしも必要なビデオメモリの量に影響を与えるわけではなく、メモリ帯域幅にかかる圧力に影響を与えるということです。

どちらのデザインでも、特定のサイズのテクスチャにはX MBが必要であり、フレームバッファにはXMBが必要です。ただし、TBDRは、特に複数のパスを作成する必要がある状況で、(V)RAMに到達する必要がある頻度を減らします。中間バッファーを少し減らす可能性がありますが、使用中の他のバッファーと比較して、中間バッファーが顕著に寄与することを前提としています。私の理解では、バックバッファ自体が中間バッファとして使用されていたので、そこに大きなメリットがあるのではないかと少し懐疑的です。最近ではテクスチャへの描画が一般的であるように思われるため、これらのシナリオがすべてテクスチャではなくタイルレベルで実行できると仮定すると、予想以上に多くなる可能性があります。最終編集日:2021年2月1日

dmccloud

2009年9月7日
アラスカ州アンカレッジ
  • 2021年2月1日
Intelは引き続きCPUとGPURAMを分割しているため、CPU側からGPU側に、またはその逆にデータをコピーする必要があります(太字のセクションはAppleのアプローチ、斜体のセクションはIntelのアプローチです)。

最後のポイントであるオンチップメモリ​​について詳しく見ていきましょう。 M1では、これもSoCの一部です。 M1のメモリは、CPU、GPU、およびその他のコアが相互に情報を交換できるようにする「ユニファイドメモリアーキテクチャ」(UMA)と呼ばれるものであり、ユニファイドメモリを使用して CPUとGPUは、ある領域と別の領域の間でデータをコピーするのではなく、同時にメモリにアクセスできます 。エリックは続けます…

長い間、低価格のコンピューターシステムでは、CPUとGPUが同じチップ(同じシリコンダイ)に統合されてきました。以前は、「統合グラフィックス」と言うことは「遅いグラフィックス」と言うことと本質的に同じでした。これらはいくつかの理由で遅かった:
このメモリの個別の領域は、CPUとGPU用に予約されています。 CPUにGPUが使用したいデータのチャンクがある場合、ここに私のメモリの一部があるとは言えません。いいえ、CPUは、GPUによって制御されるメモリ領域にデータのチャンク全体を明示的にコピーする必要がありました。


「予算のコンピュータシステム」に関する部分は、インテルが今日まで統合グラフィックスに使用しているものです。 Intelがアーキテクチャと呼んでいるものに関係なく、それは変わっていません。


AppleM1チップが非常に高速である理由-開発者が説明|プロダクションエキスパート

なぜAppleM1チップがこんなに速いのか疑問に思われたかもしれません。この記事では、開発者から、これらのエントリーレベルのMacでさえも非常に高速になる理由について学びます。 www.pro-tools-expert.com
Johnny Sroujiは、WWDC中にこれに直接対処しました。

「メモリの複数のプール間でデータをコピーせずに同じデータにアクセスする」

AppleのM1:最新のMac内部のチップを詳しく見る

「OneMoreThing」と名付けられたアップルのイベントで、同社は視聴者にM1チップとその160億個のトランジスタの仮想ツアーを提供しました。 www.techrepublic.com
反応:chabigとthedocbwarren

thedocbwarren

2017年11月10日
サンフランシスコ、カリフォルニア州
  • 2021年2月1日
確かに時代遅れです。彼らがIrisXeのディスクリートバージョンを(OEMに)販売するようになるという事実に、私はさらに恐ろしいです。アーキテクチャからますます広がっています。このような混乱。
クリービック氏は次のように述べています。正直なところ、lemanとmi7chyは(大げさな態度にもかかわらず)、Intelが少なくともゼロコピーと動的パーティションサイジングをサポートしているという優れた情報源を示しています。

あなたが主張するようにそれが本当のUMAでなくても、私がこれまで読んだドキュメントからは、少なくともゼロコピーに使用されるメモリページを割り当てることができるように見えます。両側で同じRAMページを使用できます。

時間が増えたらドキュメントが答えてくれることを期待している質問は、それらのページがより詳細に処理される方法と、これを最大限に活用するためにOSがどのような統合を行う必要があるかです。しかし、その答えがあっても、OS APIがGPUにページの管理方法を通知する必要がある場合、Appleはそこでどの程度の最適化を行ったのでしょうか。



ウェルプ、インテルのGPUアーキテクチャに関する私の理解は時代遅れであることが証明されています。実際、その場合、大きな違いはないはずです。

私の理解では、まだいくつかの固定パーティションが進行中であるということでしたが、Googleがこれに関する古い記事を浚渫しているようで、間違った道をたどりました。



ビデオを再スキミングした後の私の理解(最後にビデオを視聴してから数か月が経ちました)は、これが必ずしも必要なビデオメモリの量に影響を与えるわけではなく、メモリ帯域幅にかかる圧力に影響を与えるということです。

どちらのデザインでも、特定のサイズのテクスチャにはX MBが必要であり、フレームバッファにはXMBが必要です。ただし、TBDRは、特に複数のパスを作成する必要がある状況で、(V)RAMに到達する必要がある頻度を減らします。中間バッファーを少し減らす可能性がありますが、使用中の他のバッファーと比較して、中間バッファーが顕著に寄与することを前提としています。私の理解では、バックバッファ自体が中間バッファとして使用されていたので、そこに大きなメリットがあるのではないかと少し懐疑的です。最近ではテクスチャへの描画が一般的であるように思われるため、これらのシナリオがすべてテクスチャではなくタイルレベルで実行できると仮定すると、予想以上に多くなる可能性があります。

dmccloud

2009年9月7日
アラスカ州アンカレッジ
  • 2021年2月1日
thedocbwarrenは言った:確かに時代遅れです。彼らがIrisXeのディスクリートバージョンを(OEMに)販売するようになるという事実に、私はさらに恐ろしいです。アーキテクチャからますます広がっています。このような混乱。


Iris Xeは、リブランドされたIntel UHD iGPU(それ自体がIntel HDからリブランドされたもの)にすぎません。まるで、外装を塗り替えるだけで、シェベルを真新しい車として提示しようとしているようです...

thedocbwarren

2017年11月10日
サンフランシスコ、カリフォルニア州
  • 2021年2月1日
dmccloudによると:Iris Xeは、ブランド変更されたIntel UHD iGPU(Intel HDからブランド変更されたもの)にすぎません。まるで、外装を塗り替えるだけで、シェベルを真新しい車として提示しようとしているようです...
確かに、彼らが第11世代のためにこれらのディスクリートカードを作っているとは信じられません。

robco74

2020年11月22日
  • 2021年2月1日
何らかの音楽を作成する場合、新しいM1 Macを検討するときは、RAMを懸念事項のリストの下位に置く必要があります。 BigSurはドライバーに大きな変更を加えました。最初にすべての機器メーカーに問い合わせて、BigSurとAppleSiliconをサポートしていることを確認してください。まだすべてではありません。
反応:デュエルボ NS

quarkysg

2019年10月12日
  • 2021年2月1日
レマン氏は次のように述べています。Intelのドキュメントはあなたに同意しません。

https://software.intel.com/sites/de...tel-Processor-Graphics-Gen11_R1new.pdf#page19
Gen 11 iGPUのみを説明しているようですか?以前の世代のiGPUにも適用されますか?