У Greenplum сыровато с resource management'ом, он не умеет считать фактическое потребление памяти, только планируемое. Он умеет выделять по квоте памяти на каждый запрос. Если квоты на кластере больше нет, запрос становится в очередь. Таким образом, действительно, можно настроить кластер так, что он не сможет выполнять больше N параллельных запросов. А можно настроить с оверкоммитом по памяти, так что N будет сильно больше, но тогда иногда запросы будут забавно массово падать. Научить его относительному квотированию, preemption'у и анализу фактического потребления пока нельзя.