如何使用休眠将数据流式传输到数据库 BLOB(没有内存中存储在 byte[]中)

2022-09-04 22:36:34

我正在寻找一种将二进制数据流式传输到/从数据库流式传输的方法。如果可能的话,我希望用Hibernate(以数据库不可知的方式)完成它。我找到的所有解决方案都涉及将二进制数据作为byte[]显式或隐式加载到内存中。我需要避免它。假设我希望我的代码能够从数据库(存储在 BLOB 列中)写入 2GB 视频到本地文件,或者相反,使用不超过 256Mb 的内存。这显然是可以实现的,并且不涉及巫毒教。但是我找不到办法,现在我试图避免调试Hibernate。

让我们看一下示例代码(请记住 -Jmx=256Mb)。

实体类:

public class SimpleBean {
    private Long id;
    private Blob data;
    // ... skipping getters, setters and constructors.
}

休眠映射片段:

<class name="SimpleBean" table="SIMPLE_BEANS">
    <id name="id" column="SIMPLE_BEAN_ID">
        <generator class="increment" />
    </id>
    <property name="data" type="blob" column="DATA" />
</class>

测试代码片段:

Configuration cfg = new Configuration().configure("hibernate.cfg.xml");
ServiceRegistry serviceRegistry = new ServiceRegistryBuilder()
                                      .applySettings(cfg.getProperties())
                                      .buildServiceRegistry();

SessionFactory sessionFactory = cfg.buildSessionFactory(serviceRegistry);
Session session = sessionFactory.openSession();
session.beginTransaction();

File dataFile = new File("movie_1gb.avi");
long dataSize = dataFile.length();
InputStream dataStream = new FileInputStream(dataFile);

LobHelper lobHelper = session.getLobHelper();
Blob dataBlob = lobHelper.createBlob(dataStream, dataSize);

session.save( new SimpleBean(data) );
session.getTransaction().commit(); // Throws java.lang.OutOfMemoryError
session.close();

blobStream.close();
sessionFactory.close();

运行该代码段时,我会收到 OutOfMemory 异常。查看堆栈跟踪显示了Hibernate尝试在内存中加载流并获取OutOfMemory(应该如此)。下面是堆栈跟踪:

java.lang.OutOfMemoryError: Java heap space
at java.util.Arrays.copyOf(Arrays.java:2271)
at java.io.ByteArrayOutputStream.grow(ByteArrayOutputStream.java:113)
at java.io.ByteArrayOutputStream.ensureCapacity(ByteArrayOutputStream.java:93)
at java.io.ByteArrayOutputStream.write(ByteArrayOutputStream.java:140)
at org.hibernate.type.descriptor.java.DataHelper.extractBytes(DataHelper.java:183)
at org.hibernate.type.descriptor.java.BlobTypeDescriptor.unwrap(BlobTypeDescriptor.java:121)
at org.hibernate.type.descriptor.java.BlobTypeDescriptor.unwrap(BlobTypeDescriptor.java:45)
at org.hibernate.type.descriptor.sql.BlobTypeDescriptor$4$1.doBind(BlobTypeDescriptor.java:105)
at org.hibernate.type.descriptor.sql.BasicBinder.bind(BasicBinder.java:92)
at org.hibernate.type.AbstractStandardBasicType.nullSafeSet(AbstractStandardBasicType.java:305)
at org.hibernate.type.AbstractStandardBasicType.nullSafeSet(AbstractStandardBasicType.java:300)
at org.hibernate.type.AbstractSingleColumnStandardBasicType.nullSafeSet(AbstractSingleColumnStandardBasicType.java:57)
at org.hibernate.persister.entity.AbstractEntityPersister.dehydrate(AbstractEntityPersister.java:2603)
at org.hibernate.persister.entity.AbstractEntityPersister.insert(AbstractEntityPersister.java:2857)
at org.hibernate.persister.entity.AbstractEntityPersister.insert(AbstractEntityPersister.java:3301)
at org.hibernate.action.internal.EntityInsertAction.execute(EntityInsertAction.java:88)
at org.hibernate.engine.spi.ActionQueue.execute(ActionQueue.java:362)
at org.hibernate.engine.spi.ActionQueue.executeActions(ActionQueue.java:354)
at org.hibernate.engine.spi.ActionQueue.executeActions(ActionQueue.java:275)
at org.hibernate.event.internal.AbstractFlushingEventListener.performExecutions(AbstractFlushingEventListener.java:326)
at org.hibernate.event.internal.DefaultFlushEventListener.onFlush(DefaultFlushEventListener.java:52)
at org.hibernate.internal.SessionImpl.flush(SessionImpl.java:1214)
at org.hibernate.internal.SessionImpl.managedFlush(SessionImpl.java:403)
at org.hibernate.engine.transaction.internal.jdbc.JdbcTransaction.beforeTransactionCommit(JdbcTransaction.java:101)
at org.hibernate.engine.transaction.spi.AbstractTransactionImpl.commit(AbstractTransactionImpl.java:175)
at ru.swemel.msgcenter.domain.SimpleBeanTest.testBasicUsage(SimpleBeanTest.java:63)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at org.junit.runners.model.FrameworkMethod$1.runReflectiveCall(FrameworkMethod.java:45)
at org.junit.internal.runners.model.ReflectiveCallable.run(ReflectiveCallable.java:15)

使用休眠 4.1.5.SP1。确切的问题是:在使用 Hibernate 将 blob 存储在数据库中时,如何避免将流加载到内存中,而是使用直接流式处理。我想避免偏离为什么将视频存储在数据库列中而不是将其存储在某些内容存储库和链接中的主题。请将其视为与问题无关的模型。

似乎在不同的方言上可能存在某种功能,而Hibernate可能会尝试在内存中加载所有内容,因为底层数据库不支持流式处理 blob 或类似的东西。如果是这样的话 - 我希望在处理斑点方面看到不同方言之间的某种比较表。

非常感谢您的帮助!


答案 1

对于那些寻找同样东西的人。

我的坏处是,对于PostgreSQL(可能还有很多其他代码),代码可以正常工作(流而无需尝试复制到内存)。Hibernate的内部工作取决于所选的方言。我首先使用的那个覆盖了流的直接使用,有利于由byte[]支持的BinaryStream。

性能也没有问题,因为它在PostgreSQL的情况下只加载OID(数字),并且在其他方言(包括byte[]实现)的情况下可能延迟加载数据。刚刚运行了一些脏测试,在有和没有二进制数据字段的10000个实体负载中没有明显的差异。

在数据库中存储数据似乎比将其作为外部文件保存在磁盘上要慢。但是,在备份或处理特定文件系统的限制或并发更新等时,它为您节省了很多麻烦。但这是一个跑题。


答案 2

使用 Hibernate 的 lobHelper 的解决方案应该可以正常工作,但您可能需要确保强制使用流。设置属性 hibernate.jdbc.use_streams_for_binary = true 这是一个系统级属性,因此必须在启动时设置它(我在测试期间在命令行上定义了它):

java -Dhibernate.jdbc.use_streams_for_binary=true blobTest

您可以证明它在代码中已更改:

Object prop = props.get("hibernate.jdbc.use_streams_for_binary");
System.out.println("hibernate.jdbc.use_streams_for_binary" + "/" + prop);

推荐