GPU で PDF から HTML への変換を行うにはどうすればいいですか?

GPU で PDF から HTML への変換を行うにはどうすればいいですか?

GPU で PDF から HTML への変換を実行したいと考えていました。

統合グラフィック カードの場合、独自の RAM はありません。そのため、転送オーバーヘッドは発生しません。したがって、PDF から HTML への変換の場合は、並列処理とファイル サイズが考慮の対象となります。ファイル サイズが大きすぎることはありません。専用カードを使用する場合、転送オーバーヘッドが問題になる場合があります。統合カードを使用する場合、この問題は発生しません。

並列処理を考慮すると、ページ単位で並列化を実現できると思います。うまくいくでしょうか?

PDF から HTML への変換のための並列または GPU 実装はありますか? (今のところ、私は何も見つけられませんでした)

すでに投稿していますhttps://stackoverflow.com/questions/36199864/how-to-parallelize-pdf-to-html-conversion-on-gpu

投稿では、それは実現不可能であると書かれています。しかし、なぜそれが実現不可能なのかはわかりません。ページ単位で並列化できます。なぜこれができないのでしょうか?

なぜこの変換を GPU で実行できないのでしょうか?

これに関して NVIDIA が公開したホワイト ペーパーはありますか? (1 つも見つかりませんでした)

現時点でのアイデアは非常に役立ちます

前もって感謝します

答え1

OCR は GPU で実行できますが、他のコンポーネントは GPU を使用しても必ずしも高速になるわけではありません。GPU は SIMD (Single Instruction Multiple Data) プロセッサです。つまり、大量のデータに対して同じ操作を一度に実行できます。CPU (マルチコアの場合) は MIMD (Multiple Instruction Multiple Data) プロセッサです。つまり、異なるデータに対して同時に多くの異なる操作を実行できます。

関連情報