Spring Data MongoRepository save(T) 不工作...有时

2022-09-01 21:19:03

所以有这个小的Angular + Java + Spring Boot + MongoDB应用程序我正在使用。它最近得到了相当多的操作(阅读:代码修改),但数据访问类基本上没有受到影响的AFAIK。
但是,似乎突然决定停止坚持我对DB的更改。MongoRepositorysave()

检查这是我在工作时看到的:mongod.logsave()

2018-04-11T15:04:06.840+0200 I COMMAND  [conn6] command pdfviewer.bookData command: find { find: "bookData", filter: { _id: "ID_1" }, limit: 1, singleBatch: true } planSummary: IDHACK keysExamined:1 docsExamined:1 idhack:1 cursorExhausted:1 keyUpdates:0 writeConflicts:0 numYields:1 nreturned:1 reslen:716 locks:{ Global: { acquireCount: { r: 4 } }, Database: { acquireCount: { r: 2 } }, Collection: { acquireCount: { r: 2 } } } protocol:op_query 102ms
2018-04-11T17:30:19.615+0200 I WRITE    [conn7] update pdfviewer.bookData query: { _id: "ID_1" } update: { _class: "model.BookData", _id: "ID_1", config: { mode: "normal", offlineEnabled: true }, metadata: { title: "PDFdePrueba3pag   copia  6 ", ...}, downloaded: false, currentPageNumber: 2, availablePages: 3, bookmarks: [], stats: { _id: "c919e517-3c68-462c-8396-d4ba391762e6", dateOpen: new Date(1523460575872), dateClose: new Date(1523460575951), timeZone: "+2", ... }, ... } keysExamined:1 docsExamined:1 nMatched:1 nModified:1 keyUpdates:0 writeConflicts:1 numYields:1 locks:{ Global: { acquireCount: { r: 2, w: 2 } }, Database: { acquireCount: { w: 2 } }, Collection: { acquireCount: { w: 2 } } } 315ms
2018-04-11T17:30:19.615+0200 I COMMAND  [conn7] command pdfviewer.$cmd command: update { update: "bookData", ordered: false, updates: [ { q: { _id: "ID_1" }, u: { _class: "model.BookData", _id: "ID_1", config: { mode: "normal", offlineEnabled: true }, metadata: { title: "PDFdePrueba3pag   copia  6 ", ...}, downloaded: false, currentPageNumber: 2, availablePages: 3, bookmarks: [], stats: { _id: "c919e517-3c68-462c-8396-d4ba391762e6", dateOpen: new Date(1523460575872), dateClose: new Date(1523460575951), timeZone: "+2", ... }, ... }, upsert: true } ] } keyUpdates:0 writeConflicts:0 numYields:0 reslen:55 locks:{ Global: { acquireCount: { r: 2, w: 2 } }, Database: { acquireCount: { w: 2 } }, Collection: { acquireCount: { w: 2 } } } protocol:op_query 316ms

这就是我看到的,当它没有:

2018-04-11T18:13:21.864+0200 I NETWORK  [initandlisten] connection accepted from 127.0.0.1:64271 #1 (1 connection now open)
2018-04-11T18:18:51.425+0200 I NETWORK  [initandlisten] connection accepted from 127.0.0.1:64329 #2 (2 connections now open)
2018-04-11T18:19:06.967+0200 I NETWORK  [initandlisten] connection accepted from 127.0.0.1:64346 #3 (3 connections now open)

通过在调试时对日志文件执行 1,我看到这些连接在我的代码调用时显示,或者 ,因此看起来应用可以访问数据库。tail -ffindById()save()

这是(或多或少)相关的Java代码:

/* BookData.java */
@Document
public class BookData {

    @Id private String id;
    // Some more non-Id Strings...
    private Config config;
    private Metadata metadata;
    private Boolean downloaded;
    private Integer currentPageNumber;
    private int availablePages;
    private List<Bookmark> bookmarks;
    private StatsModel stats;

    @Transient private byte[] contents;

    public BookData() {}

    // getters and setters
}

/* BookDataRepository.java */
// MongoRepository comes from spring-boot-starter-parent-1.4.5.RELEASE
public interface BookDataRepository extends MongoRepository<BookData, String> {
    BookData findById(String id);
}

/* BookDataServiceImpl.java */
public BookData updateBookData(String id, BookData newData) {
    final BookData original = bookDataRepository.findById(id);
    if (original == null) {
        return null;
    }
    original.setCurrentPageNumber(Optional.ofNullable(newData.getCurrentPageNumber()).orElseGet(original::getCurrentPageNumber));
    // similar code for a couple other fields

    return bookDataRepository.save(original);
}

在调试时,我已经逐步完成了该部分一百次,一切似乎都很好:

  • findById(id)正确返回预期的对象:检查 ✓BookData original
  • newData包含用于更新的预期值:选中 ✓
  • 就在调用之前,已使用值正确修改:检查 ✓save(original)originalnewData
  • save()执行无错误:检查 ✓
  • save()返回一个具有正确更新值的新值:令我自己惊讶的是,检查✓BookData
  • 返回后,Mongo Shell 中的查询显示值已更新:失败save()db.bookData.find()
  • 返回后,由新调用检索到的对象包含更新的值:失败(有时失败,有时不失败)。save()BookDatafindById()

看起来MongoDB正在等待某种,但这不是一个可以调用的JPA存储库。flush()saveAndFlush()

任何想法为什么会发生这种情况?

编辑:版本(根据要求):

  • 爪哇 8
  • 弹簧靴 1.4.5
  • MongoDB 3.2.6
  • 视窗 10

我也包括上面。BookData


答案 1

问题解决了。
从 JS 客户端到 Java 后端中不同端点的不同异步调用正在用原始值覆盖不同线程中的更新文档。

两个更新操作在保存之前都在调用。问题是他们同时这样做,所以他们得到的是相同的原始值。
然后,每个线程继续更新其相关字段并在最后调用,从而导致另一个线程有效地覆盖我的更改。
每个调用都只记录了相关的修改字段,所以我没有意识到其中一个正在覆盖另一个字段的更改。findByIdsave

一旦我添加到MongoDB中,它记录了所有操作,很明显,2个不同的写操作同时发生(大约相隔500毫秒),但使用不同的值。
然后,只需将 findById 移动到更靠近保存的位置,并确保 JS 调用按顺序完成(通过使其中一个承诺依赖于另一个承诺)。systemLog.verbosity: 3config.cfg

事后看来,如果我使用 or ,这可能不会发生,它提供了单字段和方法,也允许单字段操作,而不是我被迫在 3 个步骤中完成它(,修改返回的实体,)并处理完整的文档。MongoOperationsMongoTemplateupdatefindAndModifyMongoRepositoryfindsave


编辑:我并不喜欢我的第一个“向右走”的方法,所以最后我做了我认为正确的事情,并实现了使用MongoTemplate的细粒度更新API的自定义保存方法。最终代码:findByIdsave

/* MongoRepository provides entity-based default Spring Data methods */
/* BookDataRepositoryCustom provides field-level update methods */
public interface BookDataRepository extends MongoRepository<BookData, String>, BookDataRepositoryCustom {

    BookData findById(String id);

}

/* Interface for the custom methods */
public interface BookDataRepositoryCustom {

    int saveCurrentPage(String id, Integer currentPage);
}

/* Custom implementation using MongoTemplate. */
@SuppressWarnings("unused")
public class BookDataRepositoryImpl implements BookDataRepositoryCustom {
    @Inject
    MongoTemplate mongoTemplate;

    @Override
    public int saveCurrentPage(String id, Integer currentPage) {
        Query query = new Query(Criteria.where("_id").is(id));
        Update update = new Update();
        update.set("currentPage", currentPage);

        WriteResult result = mongoTemplate.updateFirst(query, update, BookData.class);

        return result == null ? 0 : result.getN();
    }
}

// Old code: get entity from DB, update, save. 3 steps with plenty of room for interferences.
//        BookData bookData = bookDataRepository.findById(bookDataId);
//        bookData.setCurrentPage(currentPage);
//        bookDataRepository.save(bookData);
// New code: update single field. 1 step, 0 problems.
        bookDataRepository.saveCurrentPage(bookDataId, currentPage);

通过这样做,每个端点都可以根据需要根据需要使用,而不必担心覆盖不相关的字段,并且我仍然保留基于实体的方法,例如新实体创建,方法,注释等。updateMongoTemplateMongoRepositoryfindBy@Query


答案 2

MongoDB本质上是一个缓存存储,我的意思是,内容不能保证是最新的或必然正确的。我无法找到刷新时间的配置选项(但它们将在DB本身中配置),但是MongoDB添加了功能,以便您可以选择fast+dirty或slow+clean。如果您看到这种问题,这种“新鲜度”因素很可能是您的问题。(即使您没有运行分布式,请求确认和请求提交之间也存在时间差异)

这是关于“干净阅读”的帖子链接(以下引文中的关键点)

http://www.dagolden.com/index.php/2633/no-more-dirty-reads-with-mongodb/

我鼓励MongoDB用户将自己(或至少是他们的应用程序活动)放入以下组之一:

“我想要低延迟” - 只要事情很快,脏读就可以了。使用 w=1 并读取关注“本地”。(这些是默认设置。“我想要一致性” - 脏读是不行的,即使以延迟或数据略微过时为代价。使用 w=“多数”并阅读关注“多数”。使用MongoDB v1.2.0;

my $mc = MongoDB->connect(
    $uri,
    {
        read_concern_level => 'majority',
        w => 'majority',
    }
);

进一步阅读,可能有用,也可能没有用

更新

如果在多线程环境中运行,请确保您的线程不会践踏他人的更新。您可以通过将系统或查询日志记录级别配置为 5 来验证是否发生这种情况。https://docs.mongodb.com/manual/reference/log-messages/#log-messages-configure-verbosity