作者:横戈跃马2012 | 来源:互联网 | 2022-12-06 18:39
我正在使用Google OCR API,并且正在读取图像和PDF文件,可以读取和处理图像文件,但是对于PDF文件,根据Google OCR API文档,他们提到我们需要将文档存储到Google Cloud服务。
话虽如此,由于数据机密性,我无法将数据存储到Google Cloud中,并希望从本地系统上载PDF以便从PDF文件读取文本。我需要您的输入,是否可以从本地磁盘上传PDF,然后进行处理,而不是将文件上传到Google Cloud?在这方面,您的合作将受到高度赞赏。
此致Zeeshan
1> 小智..:
如您所说,这不可能在本地完成。我代表您提交了功能请求[1],以便您跟踪那里的更新。
无论如何,我有一个可能的解决方法,可以满足您的数据机密性意识。它包括使用Cloud Storage Client库[2]上传和删除这些文件:
您在本地拥有PDF文件,没有包含它的存储桶。
将其上传到存储桶[3]
使用该存储桶+文件URI通过Cloud Vision API读取它,并将结果存储在存储桶中
将结果文件下载到本地计算机中[4]
从存储桶中删除PDF文件和结果文件[5]
只要您不介意在短时间内将这些文件存储在存储桶中,此方法就应该起作用。