两种用于在Linux上监视Nvidia GPU的工具(GUI和命令行)

本文介绍了两种用于在Linux中监视Nvidia图形卡的工具。一个带有在控制台上运行的终端用户界面(TUI),另一个则使用图形用户界面。
这些用于监视Nvidia GPU的实用程序需要使用专有的Nvidia图形驱动程序。

终端用户界面,用于监控nvtop-Nvidia GPU


nvtop 它是一个任务监视器,例如Nvidia GPU的(h)顶部。使用ncurses在终端上绘制基于文本的用户界面,并使用NVIDIA Management Library(NVML)获取GPU信息。

此命令行工具使用NVML,因此不支持较早的Nvidia GPU。 GeForce 600,GeForce 800M和更高版本应该可以使用,但不支持较早的GPU。
nvtop功能:

  • 支持多个GPU
  • 显示在Nvidia GPU上运行的进程的列表,包括名称,pid,GPU使用率,内存,CPU等。可以从nvtop排序并终止进程
  • 显示GPU和内存使用情况的图表
  • 显示当前(活动)GPU和内存使用情况以及频率,风扇速度,电源使用情况和温度

nvtop最近被添加到Debian的破坏者和sid(contrib)存储库Ubuntu 19.04+中。但是,当与不在存储库中的驱动程序一起使用时(例如,在使用新驱动程序时),由于它取决于存储库中特定的驱动程序版本,因此未安装该驱动程序。在这种情况下,从源代码安装非常容易。
在nvtop自述文件中 使用说明 用于从Debian / Ubuntu,Fedora / RedHat / CentOS,openSUSE和Arch Linux的源构建工具,包括必需的依赖项。

适用于Linux的Nvidia系统监视器GUI

Nvidia Linux系统监视器
Nvidia系统监视器 一个新的图形工具,用于查看在GPU上运行的进程列表,并监视(使用图形)Nvidia图形卡的GPU和内存使用情况。使用nvidia-smi工具获取GPU信息。
这款适用于Linux的Nvidia任务管理器仅需12天,因此仍然需要工作。根据开发人员的说法,其他功能将在下一版本中添加,例如能够监视Nvidia GPU的温度的功能,并以其他语言提供该程序。
Nvidia系统监视器功能:

  • 进程:显示在GPU上运行的进程的列表,以及进程名称,pid,已用内存等。
  • GPU使用率:显示GPU使用率的图形,以及GPU的平均,最小和最大使用率
  • 内存使用率:显示Nvidia GPU内存使用情况的图表,包括平均,最小和最大内存使用情况。您还可以在此处查看总的,可用的和已使用的GPU内存。

默认情况下,Nvidia系统监视器每2秒(2000毫秒)更新一次。如果要更改此设置,请创建一个名为 nvidia-system-monitor~/.config 文件夹,然后添加 updateDelay 此文件的时间以毫秒为单位。例如 updateDelay 500 每500毫秒(0.5秒)更新NVIDIA系统监视器。
Nvidia Linux系统监视器

要安装NVIDIA System Monitor,您需要wxgtk3,wxgtk2和g ++。此外,还要安装Git并从Git获取应用程序的最新代码。它包含重要的修复程序,因为最新版本可能无法在Arch Linux以外的任何版本上运行。对于Debian,Ubuntu或Linux Mint,请使用以下命令安装这些软件包:

sudo apt install git g++ python-wxgtk3.0-dev libwxgtk3.0-gtk3-dev

要从Git获取,构建和安装Nvidia System Monitor,请使用:

git clone https://github.com/congard/nvidia-system-monitor
cd nvidia-system-monitor
./make.sh
sudo ./install.sh

在执行之前检查执行内容,因为安装脚本是使用sudo执行的。
如果要卸载,请使用 sudo ./uninstall.shnvidia-system-monitor 目录。

Sidebar