python - mongodb 命令很慢

我有 3 个这样的文件:

{
_id: ObjectId("..."),
_details: {
    _session: ObjectId("example_1"),
},
{
_id: ObjectId("..."),
_details: {
    _session: ObjectId("example_1"),
},
{
_id: ObjectId("..."),
_details: {
    _session: ObjectId("example_2"),
}

我正在尝试检索和分组 _details._session 的 ID。上述示例数据集的预期输出为:

['example_1', 'example_2']

我尝试了以下 Python 脚本:

cursor = mycol.find({}, {"_details.session": 1})
sessions = []
for doc in cursor:
    if doc['_details']['_session'] not in sessions:
        sessions.append(doc['_details']['_session'])

问题是 500 个文档大约需要 1 分钟。

有什么方法可以加快该命令的速度吗?我需要它以最快的方式运行。

回答1

https://mongoplayground.net/p/n-63ixhVkdn

db.collection.aggregate([
  {
    "$group": {
      "_id": null,
      "uniqueSessions": {
        "$addToSet": "$_details._session"
      }
    }
  }
])

您不需要遍历每个文档。您可以使用 mongo 聚合框架轻松高效地完成许多事情。

您可以添加一个 $project 阶段以避免在输出中出现 _id:null 如果它真的很麻烦。

相似文章

随机推荐

最新文章