fix bug in UTF-16BE conversion

2025-06-07 09:52:40 +08:00 · 2015-08-10 21:22:20 +02:00 · 2015-08-10 21:22:20 +02:00 · 85f8a98c93
commit 85f8a98c93
parent 41918a452a
1 changed files with 1 additions and 1 deletions
--- a/api/pdfrenderer.cpp
+++ b/api/pdfrenderer.cpp
@ -419,7 +419,7 @@ char* TessPDFRenderer::GetPDFTextObjects(TessBaseAPI* api,
        for (int i = 0; i < unicodes.length(); i++) {
          int code = unicodes[i];
          // Convert to UTF-16BE https://en.wikipedia.org/wiki/UTF-16
-          if ((code > 0xD7FF && code < 0xE0000) || code > 0x10FFFF) {
+          if ((code > 0xD7FF && code < 0xE000) || code > 0x10FFFF) {
                tprintf("Dropping invalid codepoint %d\n", code);
                continue;
          }