Postgresql、JDBC 和 streaming BLOB

2022-09-02 04:11:00

我正在尝试使用jdbc驱动程序从postgres数据库中检索blob。它太大而无法在内存中拥有,因此我想将其流式传输为下载。我尝试在ResultSet上使用getBinaryStream方法,但事实证明,此方法实际上将其全部读取到内存中,因此不适用于大文件。

显然,可以在结果集上使用getBlob方法,并且可以推测从blob获取输入流并从那里开始,但这就是我遇到问题的地方。

PreparedStatement ps = con.prepareStatement("select data from file_data WHERE ID = ?");
ps.setLong(1,file.fileData.id)
ResultSet rs = ps.executeQuery()
if(rs.next()){
        rs.getBlob("data")

这就是我正在运行的代码。当它到达最后一行时,它会抛出一个我无法理解的错误......

org.postgresql.util.PSQLException: type long : xxxxxx

“xxxxxx”是文件的内容。你可以想象这很长,但并不是重点。

我被困在这里。有没有人对正在发生的事情有任何想法?哎呀,我甚至会采用替代方法将大型 Blob 作为下载进行流式处理。


答案 1

我的猜测是,你混淆了OID和BYTEA风格的斑点。大型二进制对象与 Postgres 中的 OID 列间接存储。实际的文件数据由Postgres存储在数据库表之外的某个位置。该列仅包含一个在内部与 Blob 关联的对象标识符。例如:

janko=# CREATE TABLE blobtest1 (name CHAR(30), image OID);
CREATE TABLE                                              
janko=# INSERT INTO blobtest1 VALUES ('stackoverflow', lo_import('/tmp/stackoverflow-logo.png'));
INSERT 0 1
janko=# SELECT * FROM blobtest1;
              name              | image
--------------------------------+-------
 stackoverflow                  | 16389
(1 row)

如果使用该方法,则需要 OID 样式列。 从列中读取数据并将其转换为 .然后,它尝试从其内部存储中读取关联的二进制数据。ResultSet#getBlob(String)getBlobLong

另一方面,使用BYTEA,您可以将小块二进制数据直接放在数据库中。例如:

janko=# CREATE TABLE blobtest2 (name CHAR(30), image BYTEA);
CREATE TABLE
janko=# INSERT INTO blobtest2 VALUES ('somebinary', E'\\336\\255\\276\\357\\336\\255\\276\\357');
INSERT 0 1
janko=# SELECT * FROM blobtest2;
              name              |              image
--------------------------------+----------------------------------
 somebinary                     | \336\255\276\357\336\255\276\357
(1 row)

此处,数据列直接包含二进制数据。如果您尝试在此类列上使用,数据仍将被解释为 OID,但显然它不适合 .让我们在数据库上尝试一下,我们刚刚创建了:getBlobLong

groovy:000> import java.sql.*
===> [import java.sql.*]
groovy:000> Class.forName("org.postgresql.Driver");
===> class org.postgresql.Driver
groovy:000> db = DriverManager.getConnection("jdbc:postgresql:janko", "janko", "qwertz");
===> org.postgresql.jdbc4.Jdbc4Connection@3a0b2c64
groovy:000> ps = db.prepareStatement("SELECT image FROM blobtest2 WHERE name = ?");
===> SELECT image FROM blobtest2 WHERE name = ?
groovy:000> ps.setString(1, "somebinary")
===> null
groovy:000> rs = ps.executeQuery()
===> org.postgresql.jdbc4.Jdbc4ResultSet@66f9104a
groovy:000> rs.next()
===> true
groovy:000> rs.getBlob("image")
ERROR org.postgresql.util.PSQLException: Bad value for type long : \336\255\276\357\336\255\276\357
        at org.postgresql.jdbc2.AbstractJdbc2ResultSet.toLong (AbstractJdbc2ResultSet.java:2796)
        at org.postgresql.jdbc2.AbstractJdbc2ResultSet.getLong (AbstractJdbc2ResultSet.java:2019)
        at org.postgresql.jdbc4.Jdbc4ResultSet.getBlob (Jdbc4ResultSet.java:52)
        at org.postgresql.jdbc2.AbstractJdbc2ResultSet.getBlob (AbstractJdbc2ResultSet.java:335)
        at groovysh_evaluate.run (groovysh_evaluate:3)
        ...

答案 2

用于“存储二进制数据”的PostgreSQL文档是否有帮助?

http://jdbc.postgresql.org/documentation/head/binary-data.html

标题为“从大型对象中检索图像”的部分(位于页面底部)可能会有所帮助。


推荐