PDF 解析器。
您需要安装两个库才能使用此解析器:
GCS_OUTPUT_PATH 应该是 GCS 上文件夹的路径(以 gs:// 开头),PROCESSOR_NAME 应该类似于 projects/PROJECT_NUMBER/locations/LOCATION/processors/PROCESSOR_ID 或 projects/PROJECT_NUMBER/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION_ID。您可以通过编程方式获取它,或从 Google Cloud Console 的 Processor details 选项卡的 Prediction endpoint 部分复制。
DocAIParser。
lazy_parse() 方法以