
GPU で PDF から HTML への変換を実行したいと考えていました。
統合グラフィック カードの場合、独自の RAM はありません。そのため、転送オーバーヘッドは発生しません。したがって、PDF から HTML への変換の場合は、並列処理とファイル サイズが考慮の対象となります。ファイル サイズが大きすぎることはありません。専用カードを使用する場合、転送オーバーヘッドが問題になる場合があります。統合カードを使用する場合、この問題は発生しません。
並列処理を考慮すると、ページ単位で並列化を実現できると思います。うまくいくでしょうか?
PDF から HTML への変換のための並列または GPU 実装はありますか? (今のところ、私は何も見つけられませんでした)
すでに投稿していますhttps://stackoverflow.com/questions/36199864/how-to-parallelize-pdf-to-html-conversion-on-gpu
投稿では、それは実現不可能であると書かれています。しかし、なぜそれが実現不可能なのかはわかりません。ページ単位で並列化できます。なぜこれができないのでしょうか?
なぜこの変換を GPU で実行できないのでしょうか?
これに関して NVIDIA が公開したホワイト ペーパーはありますか? (1 つも見つかりませんでした)
現時点でのアイデアは非常に役立ちます
前もって感謝します
答え1
OCR は GPU で実行できますが、他のコンポーネントは GPU を使用しても必ずしも高速になるわけではありません。GPU は SIMD (Single Instruction Multiple Data) プロセッサです。つまり、大量のデータに対して同じ操作を一度に実行できます。CPU (マルチコアの場合) は MIMD (Multiple Instruction Multiple Data) プロセッサです。つまり、異なるデータに対して同時に多くの異なる操作を実行できます。