如何三招帮你排查Linux中的硬件问题

作者&投稿:厍岩 (若有异议请与网页底部的电邮联系)
~ 下列贴士帮助你更快速更轻松地为 Linux 中的硬件排查故障。许多不同的因素可能导致Linux硬件出现问题;在你开始尝试诊断之前,了解最常见的问题以及最有可能找到原因的环节是明智之举。

Linux服务器在许多不同类型的基础架构中运行关键任务型业务应用程序,包括物理机、虚拟机、私有云、公共云和混合云。对于 Linux系统 管理员来说,了解如何管理Linux硬件基础架构很重要,包括与网络和存储有关的软件定义功能、Linux容器和Linux服务器上的多个工具。

排查并解决Linux上与硬件有关的问题可能需要一些时间。连经验丰富的系统管理员有时也要花几小时来解决莫名其妙的软硬件问题。

下列贴士帮助你更快速更轻松地为Linux中的硬件排查故障。许多不同的因素可能导致Linux硬件出现问题;在你开始尝试诊断之前,了解最常见的问题以及最有可能找到原因的环节是明智之举。

1.快速诊断设备、模块和驱动程序

故障排查的第一步通常是显示Linux服务器上安装的硬件列表。你可以使用ls命令获取硬件的详细信息,比如lspci、lsblk、lscpu和lsscsi。比如说,这是lsblk命令的输出结果:

# lsblk

NAME    MAJ:MIN RM SIZE RO TYPE MOUNTPOINT

xvda    202:0    0  50G  0 disk

├─xvda1 202:1    0   1M  0 part

└─xvda2 202:2    0  50G  0 part /

xvdb    202:16   0  20G  0 disk

└─xvdb1 202:17   0  20G  0 part

如果ls命令没有显示任何错误,使用初始化进程(比如systemd)查看Linux服务器的运行状况。systemd是启动用户空间、控制多个系统进程的最流行的初始化进程。比如说,这是systemctl status命令的输出结果:

# systemctl status

● bastion.f347.internal

    State: running

     Jobs: 0 queued

   Failed: 0 units

    Since: Wed 2018-11-28 01:29:05 UTC; 2 days ago

   CGroup: /

           ├─1 /usr/lib/systemd/systemd --switched-root --system --deserialize 21

           ├─kubepods.slice

           │ ├─kubepods-pod3881728a_f2af_11e8_af77_06af52f87498.slice

           │ │ ├─docker-88b27385f4bae77bba834fbd60a61d19026bae13d18eb147783ae27819c34967.scope

           │ │ │ └─23860 /opt/bridge/bin/bridge --public-dir=/opt/bridge/static --config=/var/console-config/console-c

           │ │ └─docker-a4433f0d523c7e5bc772ee4db1861e4fa56c4e63a2d48f6bc831458c2ce9fd2d.scope

           │ │   └─23639 /usr/bin/pod

2.深入研究多个日志

dmesg让你可以搞清楚内核的最新信息中的错误和警示内容。比如说,这是dmesg | more命令的输出结果:

# dmesg | more

....

[ 1539.027419] IPv6: ADDRCONF(NETDEV_UP): eth0: link is not ready

[ 1539.042726] IPv6: ADDRCONF(NETDEV_UP): veth61f37018: link is not ready

[ 1539.048706] IPv6: ADDRCONF(NETDEV_CHANGE): veth61f37018: link becomes ready

[ 1539.055034] IPv6: ADDRCONF(NETDEV_CHANGE): eth0: link becomes ready

[ 1539.098550] device veth61f37018 entered promiscuous mode

[ 1541.450207] device veth61f37018 left promiscuous mode

[ 1542.493266] SELinux: mount invalid.  Same superblock, different security settings for (dev mqueue, type mqueue)

[ 9965.292788] SELinux: mount invalid.  Same superblock, different security settings for (dev mqueue, type mqueue)

[ 9965.449401] IPv6: ADDRCONF(NETDEV_UP): eth0: link is not ready

[ 9965.462738] IPv6: ADDRCONF(NETDEV_UP): vetheacc333c: link is not ready

[ 9965.468942] IPv6: ADDRCONF(NETDEV_CHANGE): vetheacc333c: link becomes ready

....

你还可以查看/var/log/messages文件中的所有Linux系统日志,在这里找到与特定问题有关的错误。如果你对硬件进行改动,比如挂载额外磁盘或添加以太网网卡,有必要通过tail命令实时密切关注信息。比如说,这是tail -f /var/log/messages命令的输出结果:

# tail -f /var/log/messages

Dec  1 13:20:33 bastion dnsmasq[30201]: using nameserver 127.0.0.1#53 for domain in-addr.arpa

Dec  1 13:20:33 bastion dnsmasq[30201]: using nameserver 127.0.0.1#53 for domain cluster.local

Dec  1 13:21:03 bastion dnsmasq[30201]: setting upstream servers from DBus

Dec  1 13:21:03 bastion dnsmasq[30201]: using nameserver 192.199.0.2#53

Dec  1 13:21:03 bastion dnsmasq[30201]: using nameserver 127.0.0.1#53 for domain in-addr.arpa

Dec  1 13:21:03 bastion dnsmasq[30201]: using nameserver 127.0.0.1#53 for domain cluster.local

Dec  1 13:21:33 bastion dnsmasq[30201]: setting upstream servers from DBus

Dec  1 13:21:33 bastion dnsmasq[30201]: using nameserver 192.199.0.2#53

Dec  1 13:21:33 bastion dnsmasq[30201]: using nameserver 127.0.0.1#53 for domain in-addr.arpa

Dec  1 13:21:33 bastion dnsmasq[30201]: using nameserver 127.0.0.1#53 for domain cluster.local

3.分析网络功能

你可能在复杂的网络环境中有成千上万个云原生应用程序为业务服务提供服务;这些可能包括虚拟化、多云和混合云。这意味着你应该分析网络连接是否正常运行,这是故障排查的一部分。分析Linux服务器中网络功能的实用命令包括ip addr、traceroute、nslookup、dig和ping等。比如说,这是ip addr show命令的输出结果:

# ip addr show

1:

lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000

    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00

    inet 127.0.0.1/8 scope host lo

       valid_lft forever preferred_lft forever

    inet6 ::1/128 scope host

       valid_lft forever preferred_lft forever

2:

eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 9001 qdisc mq state UP group default qlen 1000

    link/ether 06:af:52:f8:74:98 brd ff:ff:ff:ff:ff:ff

    inet 192.199.0.169/24 brd 192.199.0.255 scope global noprefixroute dynamic eth0

       valid_lft 3096sec preferred_lft 3096sec

    inet6 fe80::4af:52ff:fef8:7498/64 scope link

       valid_lft forever preferred_lft forever

3:

docker0: <NO-CARRIER,BROADCAST,MULTICAST,UP> mtu 1500 qdisc noqueue state DOWN group default

    link/ether 02:42:67:fb:1a:a2 brd ff:ff:ff:ff:ff:ff

    inet 172.17.0.1/16 scope global docker0

       valid_lft forever preferred_lft forever

    inet6 fe80::42:67ff:fefb:1aa2/64 scope link

       valid_lft forever preferred_lft forever

....

结束语

Linux硬件故障排查需要具备相当扎实的知识,包括如何使用功能强大的命令行工具、解读系统日志。你还应该知道如何诊断内核空间,可以在内核空间找到许多硬件问题的根本原因。请记住,Linux中的硬件问题可能由许多不同的方面引起,包括设备、模块、驱动程序、BIOS、网络,甚至是旧硬件故障。


CAD2014 li命令不弹出对话框,只在命令行显示数值。filedia=1无用。求...
1、打开电脑里的CAD。2、进入CAD2014的使用界面后,在左下角的命令栏里输入命令:HPDLGMODE。3、然后 回车或者空格 ,它会提示 HPDLGMODE的新值<0>。4、CAD2014里面,输入HPDLGMODE命令,设置为1是有对话框;设置为0是无对话框。5、最后,在随便输入一个有对话框的命令,现在就有了对话框。

为什么牛爸都可以中单我却不能玩蓝ez,为什么我都能蓝ez前期对线补刀稳压...
--答案:四十三 210、我们都知道把一只大象放进冰箱里分三步:1把冰箱门打开;2把大象放进去;3把冰箱门关上。那么,请你把长颈鹿放进冰箱里分几步?--答案:四步:1把冰箱门打开;2把大象拿出来;3把长颈鹿放进去;4把冰箱门关上。 211、有一天老张去集市买小鸡,转了半天买了10只公鸡10只母鸡,回家的路上,不知道...

街霸所有人物介绍
3、春丽(CHUN LI) 称号:穿梭于是非舞台的女中豪杰 流派:各种中国拳法+专属腿法 人物传记: 幼年时春丽就失去了父亲,而这起谋杀案与维加有着莫大的关联。为了报仇春丽勤练武艺,习得各种中国拳法,而且在国际射击大赛中获得第六名,具备很强的实力。她在父亲传授的中国拳法里加入自己的理解,并融入各种凌厉的腿技,最终...

关于各位淘宝卖家注意了。旺旺号叫lixiaofang21的是个无赖。专门给卖家...
差评师要的是钱,不是你的命;;;这帮流氓要的不是钱,为点小事就恨不得把你大卸八块。这不是卖家的悲哀,说穿了,这是淘宝的无耻,正因为保护这些人,淘宝正品卖家哪一个不是中差评一堆,黄花黑花飘飘,淘宝期望的就是正品卖家和假冒卖家混杂难分,而这些人正好能起到这样的效果。。算了,偶...

新手用本十八招 即刻告别菜鸟
电池的寿命一般按照完全充电次数计算,Li电池一般为300-400次。当然你不必担心接通电源对电池进行一次充电,哪怕只有一点就会被计算一次,电池的充电次数一般只有当电量累计充至80-90%才会增加一次,否则电池岂不是1个月就报废了。●十三、为什么笔记本电脑感觉慢很多?你也许会发出如此的疑问,我也是P4的机器,为什么就感觉...

Bruce Lee(李小龙)Jet Li(李连杰)Donnie Yen(甄子丹)Jack Chen(成龙...
母亲:何金棠(欧亚混血)师父:叶问(咏春宗师)姊姊:亚葛蕾丝、费芙 哥哥:彼得(忠探)弟弟:罗勃特 太太:莲达.爱美莉(Linda)儿子:李国豪(拍摄电影中意外丧生)女儿:李香凝(从影)李小龙有一兄、一弟、两姐 李小龙安息于美国西雅图湖景墓地,由儿子李国豪陪伴。所拍电影和电视剧:金门女(1940),富贵...

黑卡游戏机幽游白书youzhuzuili害的招怎麽用
浦饭幽助 故事的主角,三途川县皿屋敷中学头号不良少年,桑原和真眼中的最大对手和朋友。为救助小孩被车撞死,后来复活后成为灵界侦探,在与藏马和飞影争夺三大秘宝时结识了他们。接受指令在幻海门下修炼,战胜乱童,打倒妖魔街的四圣兽。去骨烂村救助雪菜时与户愚吕兄弟战斗,被户愚吕(弟)看中...

小学生必背古诗70首(谁能帮我排一排,排成三列,行数不问不超过五张纸...
小学生必背古诗70首(谁能帮我排一排,排成三列,行数不问不超过五张纸) http:\/\/zhidao.baidu.com\/question\/47666164.html这个网址,有人回答的是我想要得,只要把那个排一下就行了!如:小学生必背古诗70首1、江南汉乐府江南可采莲,莲叶何田田。鱼戏莲叶间... http:\/\/zhidao.baidu.com\/question\/47666164....

各大主流招聘网站的具体收费标准?
发布招聘可以多渠道进行招聘 使用 吉鹿力招聘发布招聘3个岗位是免费的 首先打开吉鹿力 jilulijob.com 然后点击注册,拥有自己的账号 选择角色类型 发布招聘信息 选择我要招人 填写企业注册信息 通过企业资质认证后即可发布招聘信息。一、智联招聘 智联招聘一般按照套餐受,以年为单位可以分为单人、双人、...

教师招聘考试字音识记解答技巧?
【例题3】中A项“挨”是多音字,C项“础”“黜”“绌”是一组形声字。从上面的设误情况来看,字音题多在形声字和多音字读音上的设误。对于形声字和多音字,我们在复习备考的时候是可以采用一些技巧来积累。(一)形声字——记少不记多 形声字,是一半表义,一半表声的字。这类字绝大多数是...

噶尔县13273147712: 怎样识别Linux中各硬件设备 -
符会复方: 方法/步骤1.硬盘每个硬盘表现为一个单独的设备文件.通常只能有2-4个IDE硬盘. 这就是/dev/hda ,/dev/hdb , /dev/hdc , 和/dev/hdd . SCSI是 /dev/sda , /dev/sdb ,等等.2.软驱软驱的名字是复杂的,因此Linux有一个特定的软驱设备类型,能...

噶尔县13273147712: Linux系统中的硬件问题如何排查? -
符会复方: 这篇教程的诞生过程实在相当纠结.很长时间以来我一直在考虑要不要写这么一篇东西,最主要的原因在于对硬件相关问题进行故障排查可能是计算机管理领域最棘手的工作.即使是经验相当丰富的用户有时也会遇上自己搞不定的状况,并在试...

噶尔县13273147712: linux下如何检测硬件 -
符会复方: linux默认是图形操作界面的,界面与xp类似,开始菜单(也许叫别的名字,但也是在左下角)里面有一个菜单,类似于Windows的设备管理器,你找一下,里面会列出所有的硬件信息 另外,告诉你几个命令,你在桌面点鼠标右键,会出现一个打开终端的选项 你可以在命令行里输入dmidecode命令,这会显示系统的整体信息 如果想单独看cpu,你可以cat /proc/cupinfo 单独看内存cat /proc/meminfo 看硬盘fdisk -l 其他的板卡信息lspci 如果你没用过linux的话,还是割掉装Windows吧.《Linux就该这么学》里有相关介绍,建议看看.

噶尔县13273147712: 如何在LINUX下实现硬件的自动检测 -
符会复方: 1,在linux下,有多种命令可以用于查看硬件信息:用硬件检测程序kuduz探测新硬件:service kudzu start ( or restart);查看CPU信息:cat /proc/cpuinfo;查看板卡信息:cat /proc/pci;查看PCI信息:lspci (相比cat /proc/pci更直观);查看内存...

噶尔县13273147712: 如何查看Linux系统下的硬件信息 -
符会复方: 用dmesg命令可以看到Linux系统的电脑硬件信息,它的原理是读取系统保存的开机时内核对硬件的检测信息,检测信息里面就有电脑硬件信息,不过这个命令产生的输出太多太长了,需要用管道命令暂停界面输出来实现翻页(用空格键翻页):dmesg |more 也可以用dmesg |grep -i 单用户括起来的关键字 用来截取需要的那部分硬件信息

噶尔县13273147712: Linux系统中的硬件问题应该怎样排查 -
符会复方: cat /proc/cpuinfo查看CPU cat /proc/meminfo查看内存 fdisk -l查看硬盘 我也是刚接触,不知道是否适合你

噶尔县13273147712: 求教:linux是怎样查找硬件设备的 -
符会复方: 可以用df -h查看.1、裸设备定义:一块没有分区的硬盘,称为原始设备(RAW DEVICE)或者是一个分区,但是没有用EXT3,OCFS等文件系统格式化,称为原始分区(RAW PARTITION)以上两者都是裸设备.2、裸设备的绑定 有文件系统的...

噶尔县13273147712: linux中如何检测设备驱动模块是否存在 -
符会复方: linux系统中的设备驱动是否安装好一般检查几个方面:1、系统日志.嵌入式系统多是直接dmesg一下,看有没有设备关键字相关的出错信息(通用系统可检查/var/log/messages文件).2、已加载的模块.检查模块加载列表中有没有相关设备的...

噶尔县13273147712: 如何获取linux主机硬件信息 -
符会复方: 建议直接进主板的bios查看硬件信息,linux的话看具体什么版本了,指令可能有些小差异,linux指令:1、 主板信息#查看BIOS信息 dmidecode | grep -A 28 “BIOS Information”#查看主板型号信息 dmidecode |grep -A 10 “Base Board ...

噶尔县13273147712: linux服务器故障怎么去排查 -
符会复方: 故障排查要分两种情况进行排查,首先排查下硬件,看硬件是否有问题,其次再排查下服务器系统设置、软件设置等是否存在问题.在这里还有个比较重要的就是看下服务器是否是受到了攻击,导致出故障的.作为服务器是很容易受到攻击的,建议要安装安全狗之类的服务器防护软件来确保服务器安全哦.

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网