RHEL7 — высокая загрузка процессора при записи на NAS
Я не понимаю, в чем причина очень высокой «средней нагрузки», о которой сообщает топ.
Это RHEL 7. Проблема повторяется. У нас есть один удаленный NAS, и когда один процесс пользовательского пространства начинает записывать туда файлы очень большого размера (например, размером 15 ГБ), то очень часто (но не всегда) мы получаем следующее:
top - 19:04:38 up 43 days, 11:39, 3 users, load average: 54,92, 53,82, 47,17
Tasks: 302 total, 1 running, 301 sleeping, 0 stopped, 0 zombie
%Cpu0 : 0,3 us, 0,3 sy, 0,0 ni, 99,3 id, 0,0 wa, 0,0 hi, 0,0 si, 0,0 st
%Cpu1 : 0,3 us, 0,3 sy, 0,0 ni, 99,3 id, 0,0 wa, 0,0 hi, 0,0 si, 0,0 st
KiB Mem : 1881412 total, 145084 free, 762644 used, 973684 buff/cache
KiB Swap: 4194300 total, 4127484 free, 66816 used, 840376 avail Mem
Средняя нагрузка больше 50. Оба процессора простаивают, статистика не ведется. Это не просто краткосрочная ситуация. Мы можем заниматься этим 10 минут и больше. Мы добавили «ionice -n 7» перед командой копирования, и проблема, кажется, появляется немного реже, но все равно сохраняется.
Вопрос, по сути, таков: что еще можно наблюдать, что поможет нам объяснить и решить задачу. В чем может быть проблема?
РЕДАКТИРОВАТЬ: Фактически, эта высокая нагрузка приходится на сервер A, но проблемное копирование на NAS выполняется на сервере B. На обоих серверах установлен один и тот же NAS.
РЕДАКТИРОВАТЬ 2: На сервере B (где выполняется копирование) NAS монтируется как:
//10.105.10.123/abc on /abc type cifs (rw,relatime,vers=3.0,cache=strict,username=nas,domain=myorg.com,uid=1346600026,forceuid,gid=1346600027,forcegid,addr=10.105.10.123,file_mode=0775,dir_mode=0775,soft,persistenthandles,nounix,mapposix,rsize=1048576,wsize=1048576,echo_interval=60,actimeo=1)
На сервере А (где наблюдается высокая нагрузка при попытке использования NAS):
//10.105.10.123/abc/ABC on /ABC type cifs (rw,relatime,vers=3.0,cache=strict,username=nas,domain=myorg.com,uid=1346600026,forceuid,gid=1346600027,forcegid,addr=10.105.10.123,file_mode=0775,dir_mode=0775,soft,persistenthandles,nounix,mapposix,rsize=1048576,wsize=1048576,echo_interval=60,actimeo=1)