apache-tika
-
从Zip文件中的文件读取内容 我正在尝试创建一个简单的java程序,该程序从zip文件中的文件读取并提取内容。Zip文件包含3个文件(txt,pdf,docx)。我需要阅读所有这些文件的内容,并且我正在使用Apache Tika来实现此目的。
-
-
如何从 Java 中的 MIME 类型确定适当的文件扩展名 我正在将文件上传到 Amazon s3 存储桶,并且有权访问 InputStream 和包含文件的 MIME 类型但不包含原始文件名的字符串。在将文件推送到S3之前,由我实际创建文件名和扩展名。是否有库或方便的方
-
如何从内容类型获取文件扩展名? 我正在使用Apache Tika,并且我有特定内容类型的文件(没有扩展名),需要重命名以具有反映内容类型的扩展名。 任何想法,如果有一些东西,我可以使用,而不是从头开始编程,从头开始基于
-
-
使用 Apache tika 获取 MimeType 子类型 我需要获取 iana.org MediaType而不是appplication/zip或appplication/x-tika-msoffice,如odt,ppt,pptx,xlsx等文档。 如果你看一下 mimetypes.xml有 mimeType 元素由 iana.org mime-type 和 “sub-class-of” 组成。 有没有办
-
标签