如何在GPU中進行pdf到html的轉換?

如何在GPU中進行pdf到html的轉換?

我想在 GPU 中進行 pdf 到 html 的轉換。

對於整合式顯示卡,它沒有自己的 RAM。因此,在這些情況下,傳輸開銷將永遠不會存在。因此,在將 pdf 轉換為 html 的情況下,並行處理和檔案大小是需要考慮的因素。文件的大小永遠不會太大。儘管如果我們使用專用卡,傳輸開銷可能會成為一個問題。如果我們使用整合卡,就不會出現這個問題。

考慮到並行處理,我認為可以逐頁實現並行化。它會起作用嗎?

是否有 pdf 到 html 轉換的平行或 GPU 實作? (到現在我還沒找到)

我已經發文在https://stackoverflow.com/questions/36199864/how-to-parallelize-pdf-to-html-conversion-on-gpu

貼文描述的,這是不可行的。但我不清楚為什麼它不可行。我們可以按頁並行化。為什麼我們不能這樣做?

為什麼我們不能在 GPU 中進行這種轉換?

NVIDIA 是否發布過相關的白皮書? (我連一個都沒找到)

此時任何想法都會非常有用

先致謝

答案1

OCR 可以在 GPU 中完成,但其他元件使用 GPU 不一定會更快。您的 GPU 是單指令多資料處理器 (SIMD),這意味著它可以同時對大量資料執行相同的操作。您的 CPU(假設它是多核心)是一個多指令多資料處理器 (MIMD),這意味著它能夠同時對不同資料執行許多不同的操作。

相關內容