嘗試將頁面列印為 PDF 時，Headless Chrome 掛起

Question

該問題是由底層 websocket API 實作 Tyrus 引起的。它有一個預設最大訊息大小為 4MB。此 URL 以及許多其他 URL（特別是如果您啟用列印背景）會導致 PDF（編碼為 Base 64 時）大於 4MB 限制。在這種情況下，websocket 被關閉緩衝區溢位錯誤，但是我們不認為它是chrome-devtools-java-client 不監聽 websocket 的onClose事件。

您可以透過串流列印結果來解決此問題...

PrintToPDFTransferMode.RETURN_AS_STREAM將參數傳遞transferMode給Page.printToPdf流，然後從緩衝區讀取明顯小於 4MB 限制的流（即使在由於基數 64 而增加之後）。我用的是1MB：

private static final int READ_BUFFER_SIZE = 1048576;

final PrintToPDF printToPDF = page.printToPDF(..., PrintToPDFTransferMode.RETURN_AS_STREAM);

final IO io = devToolsService.getIO();
int offset = 0;
try (FileOutputStream fos = new FileOutputStream(outputFile)) {
    do {
        final Read read = io.read(printToPDF.getStream(), offset, READ_BUFFER_SIZE);
        if (read.getBase64Encoded() == Boolean.TRUE) {
            byte[] decode = Base64.getDecoder().decode(read.getData());
            offset += decode.length;
            fos.write(decode);
        } else {
            byte[] decode = read.getData().getBytes(StandardCharsets.UTF_8);
            offset += decode.length;
            fos.write(decode);
        }

        if (read.getEof() == Boolean.TRUE) {
            break;
        }
    } while (true);
}
io.close(printToPDF.getStream());

我不確定offset結果不是 Base 64 編碼的情況下的處理方式，但我認為我們在列印時不會看到這種情況！

Answer 1

該問題是由底層 websocket API 實作 Tyrus 引起的。它有一個預設最大訊息大小為 4MB。此 URL 以及許多其他 URL（特別是如果您啟用列印背景）會導致 PDF（編碼為 Base 64 時）大於 4MB 限制。在這種情況下，websocket 被關閉緩衝區溢位錯誤，但是我們不認為它是chrome-devtools-java-client 不監聽 websocket 的onClose事件。

您可以透過串流列印結果來解決此問題...

PrintToPDFTransferMode.RETURN_AS_STREAM將參數傳遞transferMode給Page.printToPdf流，然後從緩衝區讀取明顯小於 4MB 限制的流（即使在由於基數 64 而增加之後）。我用的是1MB：

private static final int READ_BUFFER_SIZE = 1048576;

final PrintToPDF printToPDF = page.printToPDF(..., PrintToPDFTransferMode.RETURN_AS_STREAM);

final IO io = devToolsService.getIO();
int offset = 0;
try (FileOutputStream fos = new FileOutputStream(outputFile)) {
    do {
        final Read read = io.read(printToPDF.getStream(), offset, READ_BUFFER_SIZE);
        if (read.getBase64Encoded() == Boolean.TRUE) {
            byte[] decode = Base64.getDecoder().decode(read.getData());
            offset += decode.length;
            fos.write(decode);
        } else {
            byte[] decode = read.getData().getBytes(StandardCharsets.UTF_8);
            offset += decode.length;
            fos.write(decode);
        }

        if (read.getEof() == Boolean.TRUE) {
            break;
        }
    } while (true);
}
io.close(printToPDF.getStream());

我不確定offset結果不是 Base 64 編碼的情況下的處理方式，但我認為我們在列印時不會看到這種情況！

嘗試將頁面列印為 PDF 時，Headless Chrome 掛起

答案1

相關內容