linux系统中常用的性能监控命令

    作者:课课家教育更新于: 2016-02-25 17:40:50

      一、Linux服务器性能关注点

      1)CPU

      -> load:表示cpu在一段时间内正在处理以及等待处理的任务之和统计信息,简单可理解为cpu正处理的线程数和能同时处理的线程数的比值。一般认为load值的安全上限为cpu的个数

      -> run queue:表示cpu维护的线程运行队列。在多核系统中,每个cpu都将维护这么一个队列,其长度值越大表明cpu负载越高,load指标便基于此统计而来

      -> utilization:cpu使用率,由如下部分组成。后面一般是cpu被充分利用的比值分布

      user 60%~70%

      system 30%~35%

      idle 0%~5%

      io wait 接近0%

      ->context switches:当可运行的线程数大于cpu资源时,系统为会强行换出正在执行的线程以保证其他线程得到运行的机会。对于被换出的线程,系统会保留其运行时上下文,以便在下次调度时恢复执行。

      ->nice:在用户空间内,通过nice或setpriority调用改变过优先级进程的cpu占用率。在同等情况下,优先级高(值越小)的进程会比优先级低的得到优先调度。nice不为0,表明发生了低优先级进程抢占高优先级进程的情况

      2)Memory

      ->buffer:针对IO读写设计而言的缓冲区,主要目的是保证不同外设之间的进程数据同步

      ->cache:把已读取的数据缓存起来,当下次需要同样的数据直接从缓存中获取(命中),以提高访问速度

      ->swap:对物理内存的扩展

      3)IO

      ->R/W:读/写流量

      ->rtps/wtps:每秒请求IO读/写的事务数

      4)Network

      ->in/out网络流量大小

      ->tcp/udp/sock/httpd的连接数

      二、linux常用命令

      1) 查看服务器基本配置

      cat /proc/cpuinfo 察看cpu信息

      grep processor /proc/cpuinfo | wc -l 统计cpu个数

      cat /proc/meminfo 察看memory信息

      uname -a 系统基本信息

      w 或者 who 察看用户登录

      sar 系统报告命令

      常用参数 -q : cpu load

      -u : cpu utilization

      -r : memory

      -b : io

      -n : network

      sar -q 1 5 察看cpu的load状况,每1s钟统计1次,共统计5次

      从上图中可以看出,load较低,5个cpu有3个runqsz为0,说明系统负载不高

      sar -u 2 3 察看cpu使用率,每2s统计1次,共统计3次

      cpu的idle占比达到了90%+,也说明系统很闲

      sar -r 察看当日内存占用情况(默认每10分钟统计一次)

      8G物理内存中,使用率达到90%以上,其中buffer有100m+,cache3G+(大量本地缓存造成),swap空间共有2G,基本没用

      sar -b 察看当日IO使用情况

      系统不断刷新日志文件,IO反映出以write为主

      sar -n SOCK 察看网络sock连接

      sar -n DEV 察看网络流量

      sar -u -f /var/log/sa/sa21 对历史数据察看,对比分析系统问题(sa21表明是本月21号的数据)

      vmstat 实时性能监控

      top 显示服务器任务

      常用参数 H :切换到显示所有线程

      1 :显示各个cpu运行情况(类似的命令还有mpstat )

      ps -ef 或 ps -aux 都是显示所有进程,区别在于不同的显示风格

      ps -eLf | grep java | wc -l 统计java线程数

      将java换成httpd可统计apache线程数

      find、df、 du、iostat 磁盘IO命令

      find /home/admin/ -name "hsf.log" 在/home/admin/路径下查找名为hsf.log的文件

      df -ha 察看文件系统的磁盘占用情况

      du -ak | sort -t$'\\t' -l1 -nr -k2 -r 对当前目前下所有文件按文件大小倒排序,大小相同按文件名字母倒排序

      iostat -x -d 磁盘IO流量实时统计

      ipconfig、ping、netstat 网络监控命令

      netstat -ano | grep 8787 察看8787端口的连接情况

      在windows下可以借助ip,通过nbtstat命令反查连接机器信息,这在排查团队成员谁远程debug服务器占用连接资源很有帮助

      另外,对于不太熟悉的命令可以使用man 查看,进一步对于某命令的参数不理解,可以对该命令使用-h 来查看如何使用

课课家教育

未登录