使用 php 阅读 pdf 文件

2022-08-30 09:36:00

我有一个大的PDF文件,是建筑物的楼层地图。它具有所有办公家具的图层,包括座位位置的文本框。

我的目标是使用PHP读取此文件,在文档中搜索文本图层,在文件中获取其内容和坐标。通过这种方式,我可以绘制出座位位置->x / y坐标。

有没有办法通过PHP做到这一点?(甚至Ruby或Python,如果这是必要的)


答案 1

查看 FPDF(使用 FPDI):

http://www.fpdf.org/

http://www.setasign.de/products/pdf-php-solutions/fpdi/

这些将允许您打开PDF并在PHP中添加内容。我猜你也可以使用他们的功能在现有内容中搜索你需要的值。

另一个可能的库是TCPDF:https://tcpdf.org/

更新以添加更现代的库:PDF解析器


答案 2

有一个php库(pdfparser)可以完全按照你的意愿去做。

项目网站

http://www.pdfparser.org/

github

https://github.com/smalot/pdfparser

演示页面/应用程序接口

http://www.pdfparser.org/demo

在项目中包含pdfparser后,您可以从以下位置获取所有文本:mypdf.pdf

<?php
$parser = new \installpath\PdfParser\Parser();
$pdf    = $parser->parseFile('mypdf.pdf');  
$text = $pdf->getText();
echo $text;//all text from mypdf.pdf

?>

模拟,您可以从pdf中获取元数据,就像获取pdf对象(例如图像)一样。


推荐