Java,MongoDB:如何在迭代一个巨大的集合时更新每个对象?

2022-09-03 12:55:14

我收集了大约 100 万条记录,每条记录有 20 个字段。我需要更新每条记录(文档)中的整数字段,为此字段随机分配1或2。如何在迭代光标覆盖整个集合时执行此操作?为了能够更新它而第二次搜索MongoDB已经找到的对象似乎不是一个好主意:flagflag

  DBCursor cursor = coll.find();
  try {
     while(cursor.hasNext()) {
    BasicDBObject obj = (BasicDBObject) cursor.next();
    ...
    coll.update(query,newObj)

     }
  } finally {
     cursor.close();
  }

如何有效地更新具有不同值的巨大MongoDB集合的每个文档中的字段?


答案 1

你的方法基本上是正确的。但是,我不认为这样的集合是“巨大的”,您可以从shell中运行类似的东西:

coll.find({}).forEach(function (doc) {
    doc.flag = Math.floor((Math.random()*2)+1);
    coll.save(doc);
 });

根据您的MongoDB版本,配置和负载,这可能需要几分钟到几个小时

如果要批量执行此更新,请在查询文档中使用某些条件,例如coll.find({"aFiled" : {$gt : minVal}, "aFiled" : {$lt : maxVal}})


答案 2

我对自己问题的解决方案,受到@orid启发:

public void tagAll(int min, int max) {
    int rnd = 0;
    DBCursor cursor = this.dataColl.find();
    try {
        while (cursor.hasNext()) {
            BasicDBObject obj = (BasicDBObject) cursor.next();
            rnd = min + (int) (Math.random() * ((max - min) + 1));
            obj.put("tag", rnd);
            this.dataColl.save(obj);
        }
    } finally {
        cursor.close();
    }
}