Как заставить ядро Linux «замерзнуть» (или почти замереть) на несколько сотен миллисекунд

Question 1

Одним из вариантов проведения быстрого теста может быть использование ядра с поддержкой KGDB, останов ядра вручную и тестирование.см. эту ссылку.

С другой стороны, вот что я помню и что могло вызвать у вас паузу:

cpufreq cat /sys/devices/system/cpu/cpu0/cpufreq/cpuinfo_transition_latency, значение в нс (4000 в моем восьмиядерном процессоре AMD FX(tm)-8120) не должно быть проблемой, но проверьте
Тепловое регулирование либо самого процессора, либо модуля регулятора напряжения.
NAPI и/или большой сетевой трафик
PCIe ASPM ( cat /sys/module/pcie_aspm/parameters/policy)
Конфликт в буферах вашего целевого устройства (жесткий диск, сетевая карта...)
Ошибка в прошивке какого-либо устройства на шине PCIe (даже если вы его не используете), вы можете попробовать отключить его с помощью/sys/bus/pci/devices/$DEVICE/power/control

Answer

Одним из вариантов проведения быстрого теста может быть использование ядра с поддержкой KGDB, останов ядра вручную и тестирование.см. эту ссылку.

С другой стороны, вот что я помню и что могло вызвать у вас паузу:

cpufreq cat /sys/devices/system/cpu/cpu0/cpufreq/cpuinfo_transition_latency, значение в нс (4000 в моем восьмиядерном процессоре AMD FX(tm)-8120) не должно быть проблемой, но проверьте
Тепловое регулирование либо самого процессора, либо модуля регулятора напряжения.
NAPI и/или большой сетевой трафик
PCIe ASPM ( cat /sys/module/pcie_aspm/parameters/policy)
Конфликт в буферах вашего целевого устройства (жесткий диск, сетевая карта...)
Ошибка в прошивке какого-либо устройства на шине PCIe (даже если вы его не используете), вы можете попробовать отключить его с помощью/sys/bus/pci/devices/$DEVICE/power/control

Question 2

Можно ли получить более подробную информацию о том, как ваше приложение взаимодействует с FPGA? Это приложение считывает буфер из FPGA или FPGA отправляет прерывание ядру (как сетевые карты)?

Я ожидаю, что он откроет блок/символ в /dev и затем свяжется с ним. Это означает, что он использует драйвер для связи между приложением и файлом /dev/XXX.

Я хотел бы получить вывод: cat /proc/interrupts; lsmod;ls -al /dev/yourmod

Вот идеи:

Если это прерывание, вы можете настроить PIC ЦП на отключение соответствующего IRQ, а затем снова включить его. Это приведет к игнорированию всех запросов карты (без того, чтобы карта знала об этом).
если это похоже на чтение буфера, вы можете:
- Переведите приложение в спящий режим, чтобы данные из ПЛИС не считывались, а буфер заполнялся, затем разбудите приложение и продолжите чтение.
- Используйте «crash» или «kgdb», чтобы изменить значение «read» на «noop» на несколько секунд, а затем верните его к функции по умолчанию.

Пожалуйста, предоставьте всю информацию, которая может оказаться полезной.

Answer

Можно ли получить более подробную информацию о том, как ваше приложение взаимодействует с FPGA? Это приложение считывает буфер из FPGA или FPGA отправляет прерывание ядру (как сетевые карты)?

Я ожидаю, что он откроет блок/символ в /dev и затем свяжется с ним. Это означает, что он использует драйвер для связи между приложением и файлом /dev/XXX.

Я хотел бы получить вывод: cat /proc/interrupts; lsmod;ls -al /dev/yourmod

Вот идеи:

Если это прерывание, вы можете настроить PIC ЦП на отключение соответствующего IRQ, а затем снова включить его. Это приведет к игнорированию всех запросов карты (без того, чтобы карта знала об этом).
если это похоже на чтение буфера, вы можете:
- Переведите приложение в спящий режим, чтобы данные из ПЛИС не считывались, а буфер заполнялся, затем разбудите приложение и продолжите чтение.
- Используйте «crash» или «kgdb», чтобы изменить значение «read» на «noop» на несколько секунд, а затем верните его к функции по умолчанию.

Пожалуйста, предоставьте всю информацию, которая может оказаться полезной.

Question 3

Не уверен, поможет ли это. Но если вы можете написать модуль ядра, который вызывает suspendфункцию модуля ядра другого устройства, то это может сработать.

Каждое устройство PCI может быть приостановлено в соответствии с заголовочным файлом.http://www.cs.fsu.edu/~baker/devices/lxr/http/source/linux/include/linux/pci.h#L479

Например, вот функция приостановки сетевого адаптера Intel e1000.http://www.cs.fsu.edu/~baker/devices/lxr/http/source/linux/drivers/net/e1000e/netdev.c#L4643

Насколько я помню, эта функция в основном использовалась, когда система переходила в режим гибернации, драйверу устройства нужно было сохранить текущий рабочий статус и выключиться.

Answer

Не уверен, поможет ли это. Но если вы можете написать модуль ядра, который вызывает suspendфункцию модуля ядра другого устройства, то это может сработать.

Каждое устройство PCI может быть приостановлено в соответствии с заголовочным файлом.http://www.cs.fsu.edu/~baker/devices/lxr/http/source/linux/include/linux/pci.h#L479

Например, вот функция приостановки сетевого адаптера Intel e1000.http://www.cs.fsu.edu/~baker/devices/lxr/http/source/linux/drivers/net/e1000e/netdev.c#L4643

Насколько я помню, эта функция в основном использовалась, когда система переходила в режим гибернации, драйверу устройства нужно было сохранить текущий рабочий статус и выключиться.

Question 4

Я думаю, вы мыслите в неправильном направлении. Ваша цель ясна.

Способ заключается не в остановке остальных процессов, а в предоставлении вашим основным процессам приоритета планирования в режиме, близком к реальному времени. Используйтехорошийдля ваших важных процессов пользовательского пространства.

Более сложная проблема — обработка прерываний PCIe, которая находится в пространстве ядра.

Поскольку здесь задействовано аппаратное обеспечение, вам следует более внимательно изучить задействованную линию PCIe на вашей материнской плате и то, как она может быть подключена к определенному разъему ЦП.

irqbalanceобычно хорошо справляется с этой задачей, но вы можете настроить его поведение в соответствии со своими потребностями.

Answer

Я думаю, вы мыслите в неправильном направлении. Ваша цель ясна.

Способ заключается не в остановке остальных процессов, а в предоставлении вашим основным процессам приоритета планирования в режиме, близком к реальному времени. Используйтехорошийдля ваших важных процессов пользовательского пространства.

Более сложная проблема — обработка прерываний PCIe, которая находится в пространстве ядра.

Поскольку здесь задействовано аппаратное обеспечение, вам следует более внимательно изучить задействованную линию PCIe на вашей материнской плате и то, как она может быть подключена к определенному разъему ЦП.

irqbalanceобычно хорошо справляется с этой задачей, но вы можете настроить его поведение в соответствии со своими потребностями.

Как заставить ядро Linux «замерзнуть» (или почти замереть) на несколько сотен миллисекунд

решение1

решение2

решение3

решение4

Связанный контент