The reason for the threaded performance you are seeing is due to Python’s Global 
Interpreter Lock <>, 
which allows only one thread to perform a computation.

In your code, the “computation” is the line

d = list(db.app_login_logout_log.find())

where the GIL is held by the thread that is converting BSON into Python 
data structure.

The GIL is not held for IO, but since the mongod you’re connected to is 
in localhost, comparatively little time is spent doing IO.

Using the multiprocessing module allows the program to scale up a bit 
better. For example, by modifying the code a little to be:

import pymongo
import sys
import time
from multiprocessing import Process

def xx(i):
    conn = pymongo.MongoClient('localhost',27017)
    db = conn.test
    print i, 'started'
    a = time.time()
    d = list(db.test.find().limit(100000))
    print i,'finished. time:',time.time() - a

procs = [Process(target=xx, args=(i,)) for i in range(int(sys.argv[1]))]

start = time.time()
for p in procs:

for p in procs:

print 'all done: %.2f' % (time.time() - start)

The output shows better scaling vs. using threads:

$ python 1
0 started
0 finished. time: 0.338715076447
all done: 0.35
$ python 10
0 started
1 started
2 started
3 started
4 started
5 started
6 started
7 started
8 started
9 started
4 finished. time: 1.09985303879
5 finished. time: 1.10895490646
0 finished. time: 1.11398696899
8 finished. time: 1.12296009064
3 finished. time: 1.13394904137
6 finished. time: 1.13271999359
2 finished. time: 1.13802504539
9 finished. time: 1.13268995285
7 finished. time: 1.13850402832
1 finished. time: 1.15410399437
all done: 1.17

For more information, please see Thread State and the Global Interpreter 

Best regards,

