使用 php 阅读 pdf 文件
我有一个大的PDF文件,是建筑物的楼层地图。它具有所有办公家具的图层,包括座位位置的文本框。
我的目标是使用PHP读取此文件,在文档中搜索文本图层,在文件中获取其内容和坐标。通过这种方式,我可以绘制出座位位置->x / y坐标。
有没有办法通过PHP做到这一点?(甚至Ruby或Python,如果这是必要的)
我有一个大的PDF文件,是建筑物的楼层地图。它具有所有办公家具的图层,包括座位位置的文本框。
我的目标是使用PHP读取此文件,在文档中搜索文本图层,在文件中获取其内容和坐标。通过这种方式,我可以绘制出座位位置->x / y坐标。
有没有办法通过PHP做到这一点?(甚至Ruby或Python,如果这是必要的)
查看 FPDF(使用 FPDI):
http://www.setasign.de/products/pdf-php-solutions/fpdi/
这些将允许您打开PDF并在PHP中添加内容。我猜你也可以使用他们的功能在现有内容中搜索你需要的值。
另一个可能的库是TCPDF:https://tcpdf.org/
更新以添加更现代的库:PDF解析器
有一个php库(pdfparser)可以完全按照你的意愿去做。
项目网站
github
https://github.com/smalot/pdfparser
演示页面/应用程序接口
在项目中包含pdfparser后,您可以从以下位置获取所有文本:mypdf.pdf
<?php
$parser = new \installpath\PdfParser\Parser();
$pdf = $parser->parseFile('mypdf.pdf');
$text = $pdf->getText();
echo $text;//all text from mypdf.pdf
?>
模拟,您可以从pdf中获取元数据,就像获取pdf对象(例如图像)一样。