Stable Diffusion WebGPUデモは、ウェブブラウザを使用して簡単に画像を生成するのに役立つ便利なオンラインツールです。.
このウェブアプリケーションはcreate-react-appフレームワークに基づいており、機能するためにJavaScriptに依存しています。始めるには、最新のChromeバージョンを使用していることと、JavaScriptが有効になっていることを確認してください。また、ブラウザ設定で「Experimental WebAssembly」と「Experimental WebAssembly JavaScript Promise Integration (JSPI)」といういくつかの実験的機能をオンにする必要があります。.
すべての設定が完了したら、このツールは一連のステップを通じて画像を生成します。各ステップは約1分かかり、画像を完成させるためにVAEデコーダーに追加で10秒が必要です。注意しておいてください—アプリケーションを実行中にDevToolsを開いていると、すべてが約2倍遅くなる可能性があります!
画像を生成する重い作業を行うUNETモデルは、CPUで動作します。この選択は、GPUで実行するよりもパフォーマンスが向上し、より正確な結果が得られるためです。良好な結果を得るには少なくとも20ステップを経ることをお勧めしますが、試してみるだけなら3ステップで十分です。.
このアプリケーションは、モデルを簡単に読み込み、画像生成を開始し、結果を表示できるユーザーフレンドリーなインターフェースを備えています。使用中に何か問題が発生した場合でも心配しないでください。トラブルシューティングのヒントが含まれたFAQセクションがあります。.
GPUを使用しているとはいえ、onnxruntimeのWebGPU実装はまだ初期段階にあります。これは、データがCPUとGPUの間で継続的に転送される必要があるため、パフォーマンスに影響を与える可能性がある不完全な操作に遭遇する可能性があることを意味します。現在、マルチスレッドはサポートされておらず、WebAssemblyの特定の制限により、SharedArrayBufferを使用して64ビットメモリを作成することはできません。.
良いニュースは、開発者がこれらの問題を認識しており、提案された変更やパッチを通じて解決策に積極的に取り組んでいることです。ツールを自分で試してみたい場合は、ソースコードがGitHubで入手可能です。また、transformers.jsを通じて大規模言語モデルを扱うことを可能にするonnxruntimeのパッチ版もありますが、その信頼性は状況によって異なる場合があります。さらに、開発者はonnxruntimeリポジトリにプルリクエストを提出して、さらなる改善を図る予定です。.
∞