最新消息: 电脑我帮您提供丰富的电脑知识,编程学习,软件下载,win7系统下载。

[使用node.js在pdf中获取特定信息

IT培训 admin 8浏览 0评论

[使用node.js在pdf中获取特定信息

[大规模地,我试图从api获取大量合同,这些合同包含pdf文件,其中包含合同的详细信息。提取这些文件后,我正在使用“ pdf-parse”()node.js库读取pdf的文本。

现在我的问题是:我如何设法从那些文件中读取某些值?例如,在pdf的开头,应该有合同双方的简介。我想获取签名方的名称和电子邮件,其格式如下,几乎在pdf的开头。属性名称为偶数,并且信息以偶数点开头。

Name          Mark Jackson 
Address       Winston Street 13 
Email         Mark@[email protected] 
Etc...        ABCD...

什么样的方法会让我得到这些,并且只有合同的这些属性?

回答如下:a = `Name Mark Jackson Address Winston Street 13 Email Mark@[email protected] Etc... ABCD... `;

您可以像这样轻松地提取您的姓名和电子邮件:

const name = a.match(/Name\s+(.*?)\n/, 'm')[1].trim();
const email = a.match(/Email\s+(.*?)\n/, 'm')[1].trim();

[使用node.js在pdf中获取特定信息

[大规模地,我试图从api获取大量合同,这些合同包含pdf文件,其中包含合同的详细信息。提取这些文件后,我正在使用“ pdf-parse”()node.js库读取pdf的文本。

现在我的问题是:我如何设法从那些文件中读取某些值?例如,在pdf的开头,应该有合同双方的简介。我想获取签名方的名称和电子邮件,其格式如下,几乎在pdf的开头。属性名称为偶数,并且信息以偶数点开头。

Name          Mark Jackson 
Address       Winston Street 13 
Email         Mark@[email protected] 
Etc...        ABCD...

什么样的方法会让我得到这些,并且只有合同的这些属性?

回答如下:a = `Name Mark Jackson Address Winston Street 13 Email Mark@[email protected] Etc... ABCD... `;

您可以像这样轻松地提取您的姓名和电子邮件:

const name = a.match(/Name\s+(.*?)\n/, 'm')[1].trim();
const email = a.match(/Email\s+(.*?)\n/, 'm')[1].trim();
发布评论

评论列表 (0)

  1. 暂无评论