Несколько процессоров, многопоточная производительность

Моя программа: на 100% основанная на CPU и RAM, выполняет математические вычисления, вначале считывает данные с жесткого диска в RAM. Нет связи между потоками. Потоки, все занимают то же самое время также (почти).

Вопрос:

Если моя программа использует потоки, равные количеству потоков процессора, какую производительность я могу ожидать от системы с 2 процессорами?

Скажем, я использую два 8-ядерных xeon, каждый с 16 потоками, так что 16x2 = 32 потока. Если моя программа использует 32 потока, все с 100% использованием, получу ли я двойную производительность по сравнению с одним и тем же процессором?

3 ответа

Решение

На самом деле, лучший ответ, который вы можете дать, - "вероятно, нет, но это зависит". У вас есть в два раза больше мощности процессора, но:

  1. У вас не будет вдвое большей пропускной способности памяти.

  2. Потребуется время для "пинг-понга" между строками кеша между процессорами.

  3. Иногда одному потоку придется ждать другого, и чем больше у вас потоков, тем больше это происходит.

  4. Иногда, даже если у вас много работы, вы не можете сделать все сразу.

И так далее.

В очень редких случаях вы можете получить более чем в два раза больше производительности. Если операция ограничена в кеше, наличие большего количества ядер может означать, что поток может работать дольше (потому что ядру не нужно будет заниматься другими делами, потому что другие ядра делают это), что позволяет кешам ЦП оставаться горячим дольше.

Окончательный ответ на вопросы о производительности - не угадай, проверь!

Похоже, вы работаете над смущающей параллельной вычислительной задачей, и в этом случае ответ положительный, ваша пропускная способность будет масштабироваться почти линейно с общим количеством используемых потоков ЦП.

Другие вопросы по тегам