HP設(shè)備預(yù)防性巡檢報(bào)告模版V1
HP主機(jī)巡檢服務(wù)報(bào)告
公司名稱(chēng)客戶(hù)信息部門(mén)聯(lián)系人手機(jī)公司名稱(chēng)服務(wù)商信息地址聯(lián)系人手機(jī)南京南瑞集團(tuán)公司南京市鼓樓區(qū)南瑞路8號(hào)210003電話(huà)電子郵件025--83092831電話(huà)電子郵件主機(jī)硬件檢查檢查內(nèi)容指示燈狀態(tài)分區(qū)狀態(tài)(僅限高端產(chǎn)品)處理器內(nèi)存磁盤(pán)I/O正常正常正常正常正常正常正常異常說(shuō)明:異常說(shuō)明:異常說(shuō)明:異常說(shuō)明:異常說(shuō)明:異常說(shuō)明:異常說(shuō)明:異常說(shuō)明:異常說(shuō)明:異常說(shuō)明:異常說(shuō)明:檢查結(jié)果網(wǎng)絡(luò)正常正常磁帶機(jī)DVD,CD-ROM正常正常機(jī)器的出風(fēng)口和入已清潔不需要清潔說(shuō)明:風(fēng)口是否需要清潔系統(tǒng)日志檢查檢查內(nèi)容GSP/MP/SP日志dmesg輸出系統(tǒng)啟動(dòng)日志系統(tǒng)運(yùn)行日志正常正常正常正常檢查結(jié)果異常說(shuō)明:異常說(shuō)明:異常說(shuō)明:異常說(shuō)明:
第1頁(yè)共3頁(yè)
HP主機(jī)巡檢服務(wù)報(bào)告
系統(tǒng)shutdown日志文件系統(tǒng)正常正常異常說(shuō)明:異常說(shuō)明:有說(shuō)明:有說(shuō)明:系統(tǒng)近期有無(wú)HPMC無(wú)系統(tǒng)近期有無(wú)Core無(wú)Dump檢查內(nèi)容集群的運(yùn)行狀態(tài)集群的日志鎖盤(pán)檢查正常正常正常檢查結(jié)果異常說(shuō)明:異常說(shuō)明:異常說(shuō)明:系統(tǒng)備份檢查做vg配置信息的備份詢(xún)問(wèn)客戶(hù)有否在系統(tǒng)變更后或每半年做ignite系統(tǒng)備份詢(xún)問(wèn)客戶(hù)數(shù)據(jù)庫(kù)及應(yīng)用、應(yīng)用數(shù)據(jù)是否定期有效進(jìn)行備份詢(xún)問(wèn)客戶(hù)磁帶機(jī)是否按要求定期清潔完成是是是失敗說(shuō)明:否建議:否建議:否建議:系統(tǒng)總體性能評(píng)估Usr:%Sys:%CPU平均使用率Idle:%IO所占用的CPU使用率空閑的物理內(nèi)存交換區(qū)使用情況Wio:%Free:K建議:建議:建議:PctUsed(Total):%建議:
第2頁(yè)共3頁(yè)
HP主機(jī)巡檢服務(wù)報(bào)告
檢查結(jié)論:下一步工作計(jì)劃:客戶(hù)意見(jiàn):□非常滿(mǎn)意□滿(mǎn)意□不滿(mǎn)意客戶(hù)建議:
客戶(hù)簽字:年月日聯(lián)系電話(huà):
(簽字人有效電話(huà),便于客服回訪(fǎng))
工程師簽字:年月日
第3頁(yè)共3頁(yè)
擴(kuò)展閱讀:HP主機(jī)設(shè)備巡檢標(biāo)準(zhǔn)版V1
HP巡檢指導(dǎo)說(shuō)明
目錄
1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.
PM過(guò)程中注意事項(xiàng)................................................................................................................3預(yù)防性報(bào)告的使用方法.........................................................................................................3登錄系統(tǒng)注意事項(xiàng).................................................................................................................3確定機(jī)器型號(hào)及操作系統(tǒng)型號(hào).............................................................................................3查看MP日志及Cell版狀態(tài)................................................................................................3查看系統(tǒng)硬件狀態(tài)-IOSCAN命令..........................................................................................4Dmesg查看系統(tǒng)緩沖區(qū)內(nèi)容.................................................................................................5系統(tǒng)啟動(dòng)日志........................................................................................................................7系統(tǒng)運(yùn)行日志........................................................................................................................7系統(tǒng)shutdown日志..............................................................................................................7EMS日志................................................................................................................................8文件系統(tǒng)(bdf)......................................................................................................................8系統(tǒng)近期有無(wú)HPMC................................................................................................................8系統(tǒng)近期有無(wú)CoreDump......................................................................................................8查看邏輯卷狀態(tài)....................................................................................................................9Dump區(qū)的配置是否合理.......................................................................................................9集群的運(yùn)行狀態(tài)...................................................................................................................10集群的日志...........................................................................................................................11鎖盤(pán)檢查..............................................................................................................................12系統(tǒng)信息收集......................................................................................................................12CPU平均使用率(#sar)...................................................................................................13IO所占用的CPU使用率.....................................................................................................13空閑的物理內(nèi)存(#top)...................................................................................................14交換區(qū)使用情況(#swapinfoatm).................................................................................14查看系統(tǒng)CPU個(gè)數(shù),內(nèi)存數(shù)量.............................................................................................
1.PM過(guò)程中注意事項(xiàng)
預(yù)防性報(bào)告的使用方法
在到達(dá)用戶(hù)現(xiàn)場(chǎng)前,打印預(yù)防性維護(hù)報(bào)告,一式兩份。在完成維護(hù)后,簽名并留一份
拷貝給客戶(hù),另一份保存在公司文檔中。
PM過(guò)程中,請(qǐng)盡量保存詳細(xì)的日志,以備不時(shí)之需
本文檔為巡檢的簡(jiǎn)易文檔,如有時(shí)間,請(qǐng)多閱讀我的MP:13826181760
2.登錄系統(tǒng)注意事項(xiàng)
登陸HPUX操作系統(tǒng),以避免產(chǎn)生彗星撞地球之類(lèi)不可預(yù)料事,請(qǐng)多開(kāi)窗口以防萬(wàn)一
A:開(kāi)多個(gè)窗口命令:#TSMB:切換窗口命令:#CTRL+wC.退出TSM命令:#quit
同時(shí)請(qǐng)打開(kāi)SecureCRT等軟件的日志Log功能,以便記錄下相關(guān)重要日志
3.確定機(jī)器型號(hào)及操作系統(tǒng)型號(hào)
a.確定系統(tǒng)型號(hào)命令:#modelb.確定系統(tǒng)序列號(hào)
命令:#getconfCS_MACHINE_SERIAL
如果此命令失效,物理觀(guān)察取得機(jī)器序列號(hào)c.確定操作系統(tǒng)型號(hào)命令:#unamea
HP-UXasogz3B.11.11U9000/8001135931517unlimited-userlicense
4.查看MP日志及Cell版狀態(tài)
a.查看MP卡錯(cuò)誤日志,及消除System黃燈告警
1.從串口或者M(jìn)PLAN口登陸MP卡
Account:AdminPassword:Admin2.出現(xiàn)如下登陸窗口
MPMAINMENU:
CO:Console
VFP:VirtualFrontPanel
CM:CommandMenuCL:ConsoleLogSL:ShowEventLogsHE:MainHelpMenuX:ExitConnection
[rp4440_mp]MP>
輸入命令:SL
3.緊接著就可查看MP卡日志命令序列:e->a->3
此時(shí)就可以看到導(dǎo)致System黃燈事件了,多按幾次Enter,黃燈就能被消滅了.
b.查看系統(tǒng)Cell版電源狀態(tài),或者風(fēng)扇狀態(tài):
MPMAINMENU:
CO:Console
VFP:VirtualFrontPanel
CM:CommandMenuCL:ConsoleLog
SL:ShowEventLogsHE:MainHelpMenuX:ExitConnection
[rp4440_mp]MP>
在此窗口下,輸入命令:CM然后輸入命令:PS
此時(shí)就可以看到Fan及Power狀態(tài)了,如下:
[rp3440]MP:CM>ps
PSSystemPowerstate:OnTemperature:NormalPowersuppliesState
-----------------------------------------------------------
PowerSupply1Normal
PowerSupply2NotInstalled
FansState
-----------------------------------------------------------
Cooling1(Sys)NormalCooling2(Mem)NormalCooling3(Disk)Normal
5.查看系統(tǒng)硬件狀態(tài)-IOSCAN命令I(lǐng)oscan作為查看系統(tǒng)硬件狀態(tài)的重要命令,其狀態(tài)CLAIMED為正常,
NO_HW,UNCLAIMED,UNKNOWN為不正常,至于三命令為何種不正常,請(qǐng)參看,在此略過(guò)不提
a:ioscan磁盤(pán)
命令:#ioscanfnCdiskb:ioscanIO
命令:#ioscannfc:ioscan網(wǎng)絡(luò)
命令:#ioscannfClan命令:#lanscan
命令:#ifconfiglanX
此處有兩條輔助命令lanscan及ifconfigLanscan狀態(tài)UP為正常,down為異常
Ifconfig顯示正確配置ip為正常,非配置ip為異常
6.Dmesg查看系統(tǒng)緩沖區(qū)內(nèi)容運(yùn)行命令dmesg是一個(gè)即簡(jiǎn)單又快捷的方法來(lái)查看系統(tǒng)硬件及文件系統(tǒng)有無(wú)報(bào)錯(cuò)。dmesg
的工作原理是直接從系統(tǒng)的緩沖器(buffer)中讀取系統(tǒng)最近一段時(shí)期內(nèi)的硬件狀態(tài)。命令dmesg的缺點(diǎn)是輸出結(jié)果中沒(méi)有時(shí)間標(biāo)志,同時(shí)因?yàn)榫彌_器的容量有限,近期的內(nèi)
容會(huì)覆蓋緩沖器里以前的內(nèi)容,因此如果有些故障輸出,而機(jī)器一兩年沒(méi)重啟過(guò),也屬正常,不必過(guò)分關(guān)注.
服務(wù)器沒(méi)有硬件報(bào)錯(cuò)時(shí),dmesg的標(biāo)準(zhǔn)輸出是:
May1410:38
gate64:sysvec_vaddr=0xc000201*for2pages
NOTICE:autofs_link():Filesystemwasregisteredatindex3.NOTICE:cachefs_link():Filesystemwasregisteredatindex5.NOTICE:nfs3_link():Filesystemwasregisteredatindex6.0sba0/0lba
0/0/0/0btlan0/0/1/0c7200/0/1/0.7tgt0/0/1/0.7.0sctl0/0/1/1c7200/0/1/1.2tgt0/0/1/1.2.0sdisk0/0/1/1.7tgt0/0/1/1.7.0sctl0/0/2/0c7200/0/2/0.7tgt0/0/2/0.7.0sctl0/0/2/1c7200/0/2/1.2tgt0/0/2/1.2.0sdisk0/0/2/1.7tgt0/0/2/1.7.0sctl0/0/4/0asio00/0/5/0asio00/1lba0/2lba
0/2/0/0c7200/2/0/0.0tgt0/2/0/0.0.0schgr0/2/0/0.1tgt0/2/0/0.1.0stape0/2/0/0.7tgt0/2/0/0.7.0sctl0/3lba0/4lba
c8xxBUS:5SCSIC1010UltraWideLVDassignedCPU:00/4/0/0c8xx0/4/0/0.6tgt0/4/0/0.6.0sctl0/5lba
0/5/0/0c7200/5/0/0.2tgt0/5/0/0.2.0stape0/5/0/0.7tgt0/5/0/0.7.0sctl0/6lba0/6/0/0td
td:claimedTachyonXL2FibreChannelMassStoragecardat0/6/0/00/6/0/0.8fcp
0/6/0/0.8.0.110.0fcparray0/6/0/0.8.0.110.0.0tgt0/6/0/0.8.0.110.0.0.0sdisk0/6/0/0.8.0.110.0.0.1sdisk0/6/0/0.8.0.110.0.0.2sdisk0/6/0/0.8.0.110.1fcparray0/6/0/0.8.0.110.1.0tgt0/6/0/0.8.0.110.1.0.0sdisk0/6/0/0.8.0.110.1.0.1sdisk0/6/0/0.8.0.110.1.0.2sdisk0/6/0/0.8.0.255.6fcpdev0/6/0/0.8.0.255.6.14tgt0/6/0/0.8.0.255.6.14.0sctl0/7lba
c8xxBUS:7SCSIC1010UltraWideLVDassignedCPU:10/7/0/0c8xx0/7/0/0.6tgt0/7/0/0.6.0sctl8memory
160processor166processor
btlan:Initializing10/100BASE-TXcardat0/0/0/0....
SystemConsoleisontheBuilt-InSerialInterfaceLogicalvolume64,0x3configuredasROOTLogicalvolume64,0x2configuredasSWAPLogicalvolume64,0x2configuredasDUMP
Swapdevicetable:(start&sizegivenin512-byteblocks)
entry0-majoris64,minoris0x2;start=0,size=5242880Dumpdevicetable:(start&sizegivenin1-Kbyteblocks)
entry0000000000000000-majoris31,minoris0x1201*;start=310112,size=2621440
StartingtheSTREAMSdaemons-phase1CreateSTCPdevicefilesStartingtheSTREAMSdaemons-phase2
$Revision:vmunix:vw:-projselectors:CUPI80_BL201*_1108-c"VwforCUPI80_BL201*_1108build"--cupi80_bl201*_1108"CUPI80_BL201*_1108"WedNov819:24:56PST201*$MemoryInformation:
physicalpagesize=4096bytes,logicalpagesize=4096bytes
Physical:1310720Kbytes,lockable:1127096Kbytes,available:1091104Kbytes
我們查看dmesg的輸出時(shí),應(yīng)著重觀(guān)察有沒(méi)有類(lèi)似”SCSIReset”,“DiskPowerFailed”,
“PVpath”,“LPMC”,“filesystemfull”等報(bào)錯(cuò)信息。如果有,可以在系統(tǒng)的syslog中進(jìn)一步確定錯(cuò)誤發(fā)生的時(shí)間,從而對(duì)所報(bào)錯(cuò)誤進(jìn)行定位.
7.系統(tǒng)啟動(dòng)日志
請(qǐng)輸入命令:#cat/etc/rc.log記錄系統(tǒng)啟動(dòng)日志系統(tǒng)的啟動(dòng)日志是指文件:/etc/rc.log.
我們可以用vi命令進(jìn)行查看,看/etc/rc.log日志中有沒(méi)有”Fail”或”error”;如果
有,就代表系統(tǒng)在啟動(dòng)時(shí)相應(yīng)的啟動(dòng)腳本運(yùn)行失敗。
8.系統(tǒng)運(yùn)行日志
請(qǐng)輸入命令:#more/var/adm/syslog/syslog.log記錄系統(tǒng)運(yùn)行日志,有些系統(tǒng)長(zhǎng)年未重
啟過(guò),日志超大,輸入命令#tail-500/var/adm/syslog/syslog.log觀(guān)察機(jī)器具體運(yùn)行情況.
系統(tǒng)的運(yùn)行日志是指文件:/var/adm/syslog/syslog.log.查看syslog.log日志中有沒(méi)有”SCSIReset”,“DiskPowerFailed”,“PVpath”,
“LPMC”,“filesystemfull”,“Fail”,“Error”,“Warning”等錯(cuò)誤信息。如果有,請(qǐng)根據(jù)經(jīng)驗(yàn)給出合理的解釋?zhuān)蝗绻蠩MSlog,可以按照其提示的命令看具體的內(nèi)容;如有必要請(qǐng)聯(lián)系我.
9.系統(tǒng)shutdown日志
請(qǐng)輸入命令:#cat/etc/shutdownlog記錄系統(tǒng)關(guān)機(jī)日志.
系統(tǒng)的shutdown日志(/etc/shutdownlog)記錄了系統(tǒng)所有停止,重啟的時(shí)間。
07:35SatMay11,201*.Reboot:(bySAM)
07:37SatMay11,201*.Reboot:(byasogz3!root)00:01SunMay12,201*.Reboot:(bySAM)00:04SunMay12,201*.Reboot:
17:17ThuMay30,201*.Reboot:(byasogz3!oracle9i)21:33ThuMay30,201*.Reboot:(byasogz3!root)
17:35FriApr30,201*.Halt:(byasogz3.guangzhou.guangdong-n.tax.cn!root)
我們可以同客戶(hù)進(jìn)行溝通,確認(rèn)系統(tǒng)是否非正常重啟過(guò)。
10.EMS日志
輸入命令:#more/var/opt/resmon/log/event.logEMS日志記錄系統(tǒng)硬件事件,仔細(xì)閱讀確定有無(wú)故障.
11.文件系統(tǒng)(bdf)
用命令bdf查看文件系統(tǒng)的使用情況,如果有文件系統(tǒng)的使用率超過(guò)90%,請(qǐng)告知客戶(hù)。
有可能的話(huà),可幫助客戶(hù)擴(kuò)充相應(yīng)的文件系統(tǒng);或者和客戶(hù)一起刪除過(guò)期沒(méi)用的文件。
12.系統(tǒng)近期有無(wú)HPMC
查看系統(tǒng)近期有沒(méi)有HPMC的方法是:
#cd/var/tombstones#morets99
HP-UXasogz3B.11.11U9000/8001135931517
CPU-ID(Model)=0x11
-----------------Processor0HPMCInformation-PDCVersion:40.48------
Timestamp=MonApr2110:26:49GMT201*(20:03:04:21:10:26:49)
HPMCChassisCodes系統(tǒng)最近一次發(fā)生HPMC的時(shí)間(格林尼治時(shí)間)ChassisCodeExtension---------------------
0x000008201*ff62420x00000000000000000x180008201*0063020xc3808000000000000x0000087000ff62920x00000000000000000x60000820700060620x00000000011001700x70000820700060820x0000000000a41c000x201*082374ff6b830x0000ff00002aff740x201*082374ff6b830x0000ff00002bff740x201*082274ff6bc30x0000ff00002aff740x201*082274ff6bc30x0000ff00002bff74
0x00000800800063100x0000000000000001
13.系統(tǒng)近期有無(wú)CoreDump
查看系統(tǒng)近期有沒(méi)有CoreDump的方法是:#cd/var/adm/crash#lltotal40
-rwxr-xr-x1rootroot1May30201*boundsdrwxr-xr-x2rootroot4096Apr809:59crash.0drwxr-xr-x2rootroot4096Apr110:02crash.1drwxr-xr-x2rootroot4096Mar910:04crash.2drwxr-xr-x2rootroot4096Mar210:06crash.3
系統(tǒng)CoreDump內(nèi)容存到硬盤(pán)上的時(shí)間
在DUMP的子目錄中的INDEX文件中dumptime和savetime會(huì)更精確地指出dump發(fā)生
及存儲(chǔ)的時(shí)間。
14.查看邏輯卷狀態(tài).
系統(tǒng)硬盤(pán)物理?yè)p壞,一般前面故障指示燈,都會(huì)亮,但也有些古董級(jí)別的機(jī)器,壞了,故障燈依然長(zhǎng)綠.為防此類(lèi)事件,可查看邏輯卷狀態(tài)命令:#vgdisplayvvg00|more
#lvdisplayv/dev/vg00/lv*|more
邏輯卷狀態(tài)為Syncd/Active為正常;stale/Unknown為不正常.
15.Dump區(qū)的配置是否合理
對(duì)CoreDump的分析是我們定位系統(tǒng)故障原因的重要手段。
Dump區(qū)配置的是否合理,決定了CoreDump能否被成功保存到系統(tǒng)硬盤(pán)上。
以下是關(guān)于DUMP區(qū)配置的一些建議,請(qǐng)仔細(xì)檢查主機(jī)系統(tǒng)中Dump區(qū)的配置是否滿(mǎn)足要
求:
1.#lvlnbootv
BootDefinitionsforVolumeGroup/dev/vg00:PhysicalVolumesbelonginginRootVolumeGroup:/dev/dsk/c1t2d0(0/0/1/1.2.0)--BootDiskBoot:lvol1on:/dev/dsk/c1t2d0Root:lvol3on:/dev/dsk/c1t2d0Swap:lvol2on:/dev/dsk/c1t2d0Swap:lvol1on:/dev/dsk/c2t1d0Dump:lvol2on:/dev/dsk/c1t2d0,0系統(tǒng)DUMP區(qū)(PrimarySwap)
通常情況下,系統(tǒng)將PrimarySwap區(qū)作為系統(tǒng)的Dump區(qū).
2.DUMP大小的要求
HPUX10.20:Dump區(qū)的大小一定要大于PhysicalRAM。
HPUX11.0&11i:為了成功將CoreDump保存到系統(tǒng)硬盤(pán)上,Dump區(qū)的大小需要介于PhysicalRAM的30%和60%之間,具體要根
據(jù)系統(tǒng)發(fā)生Dump時(shí)的忙閑程度。
3.如果系統(tǒng)現(xiàn)有的Dump區(qū)大小無(wú)法滿(mǎn)足要求,請(qǐng)告知客戶(hù)。
4.在條件允許的情況下,和客戶(hù)協(xié)商并征得客戶(hù)同意,可以增加Swap.
16.集群的運(yùn)行狀態(tài)
用命令#cmviewclv查看整個(gè)集群的運(yùn)行狀態(tài)。
#cmviewclvCLUSTERSTATUS正常:UP異常:DOWNacct_clusterupNODESTATUSSTATEacctdb_auprunningNetwork_Parameters:正常:running異常:down,unknownINTERFACESTATUSPATHNAME
PRIMARYup5/1/0lan2正常:UP異常:DOWNPRIMARYup3/0/0lan0STANDBYup5/0/0lan1PACKAGESTATUSSTATEAUTO_RUNNODEacct_pkg1uprunningdisabledacctdb_aPolicy_Parameters:正常:UP異常:DOWN正常:runningPOLICY_NAMECONFIGURED_VALUE異常:HaltedFailoverconfigured_nodeFailbackmanualScript_Parameters:
ITEMSTATUSMAX_RESTARTSRESTARTSNAMEServiceup00service1Subnetup192.168.0.0正常:UP異常:DOWNNode_Switching_Parameters:
NODE_TYPESTATUSSWITCHINGNAMEPrimaryupenabledacctdb_a(current)Alternateupenabledacctdb_b
NODESTATUSSTATEacctdb_buprunningNetwork_Parameters:
INTERFACESTATUSPATHNAMEPRIMARYup5/1/0lan2PRIMARYup3/0/0lan0STANDBYup5/0/0lan1
PACKAGESTATUSSTATEAUTO_RUNNODEacct_pkg2uprunningdisabledacctdb_bPolicy_Parameters:
POLICY_NAMECONFIGURED_VALUEFailoverconfigured_nodeFailbackmanualScript_Parameters:
ITEMSTATUSMAX_RESTARTSRESTARTSNAMEServiceup00service2Subnetup192.168.0.0Node_Switching_Parameters:
NODE_TYPESTATUSSWITCHINGNAMEPrimaryupenabledacctdb_b(current)Alternateupenabledacctdb_a
如果集群的運(yùn)行狀態(tài)有異常,請(qǐng)和客戶(hù)一起確認(rèn)產(chǎn)生異常的原因,并請(qǐng)聯(lián)系我.
17.集群的日志
集群的日志是指文件:/etc/cmcluster/pkgXX/pkgXX.log.
集群的每個(gè)包(Package)都有自己的運(yùn)行日志,并且每個(gè)包(Package)的實(shí)時(shí)日志是
保存在這個(gè)包所正在運(yùn)行的主機(jī)節(jié)點(diǎn)上。我們查看集群的日志主要是看日志中有沒(méi)有類(lèi)似于“Failed”,“Error”等報(bào)錯(cuò)信息,
如果有請(qǐng)憑經(jīng)驗(yàn)給出解釋.
18.鎖盤(pán)檢查
對(duì)于由2個(gè)節(jié)點(diǎn)(主機(jī))組成的集群(Cluster),我們需要確認(rèn)集群中鎖盤(pán)上的鎖盤(pán)
標(biāo)志是否存在。
檢查集群中鎖盤(pán)標(biāo)志是否存在的方法是:
1.首先在集群的配置文件中找出主機(jī)上的鎖盤(pán)。例如:
#Definitionofnodesinthecluster.
#Repeatnodedefinitionsasnecessaryforadditionalnodes.NODE_NAME
acctdb_alan2
NETWORK_INTERFACE
HEARTBEAT_IP192.10.1.3NETWORK_INTERFACEHEARTBEAT_IPNETWORK_INTERFACEFIRST_CLUSTER_LOCK_PV
lan0192.168.0.3lan1
/dev/dsk/c7t5d6
鎖盤(pán)
2.然后用下面的命令檢查鎖盤(pán)上的標(biāo)志信息是否存在:
#echo"0x2084?4D"|adb/dev/dsk/c7t5d6
2084:141941451010590466256
有鎖盤(pán)標(biāo)志
2084:0000
沒(méi)有鎖盤(pán)標(biāo)志
如果輸出結(jié)果的第二列是“1”,表明集群中鎖盤(pán)上有鎖盤(pán)的標(biāo)志。如果輸出結(jié)果的第二列是“0”,表明集群中鎖盤(pán)上鎖盤(pán)的標(biāo)志已經(jīng)丟失。
如果鎖盤(pán)上沒(méi)有鎖盤(pán)的標(biāo)志,可用以下命令將鎖盤(pán)標(biāo)志重新寫(xiě)到鎖盤(pán)上,建議和客戶(hù)
另外約時(shí)間并聯(lián)系我.
19.系統(tǒng)信息收集
請(qǐng)用cstm收集系統(tǒng)相關(guān)信息
a:收集相關(guān)信息到文件/tmp/hp/info.out#cstmselall>info>>>>>>il>EOF
以上腳本中的幾個(gè)空行是必要的,否則執(zhí)行il命令時(shí)可能得不到正確結(jié)果。輸出的結(jié)果被保存在info.out文件中,Memory,InternalDisk,Tapedrive等設(shè)備的序列號(hào)都會(huì)被列出來(lái),通常CPU的序列號(hào)顯示為0.b:Log收集的信息
#Cat/tmp/hp/info.out
20.CPU平均使用率(#sar)
#saru330(每隔3秒采樣一次,共采樣30次)
在業(yè)務(wù)高峰期使用saru命令
%usr=timespentinusermode%sys=timespentinsystemmode
%wio=timespentinblock,raw,andvirtualmemorymanagementI/O%idle=CPUtimenotbeingused
sar-uM:optionformultiprocessorplatforms.
首先應(yīng)看%idle是否接近于0.如果是,那么看%wio是否大于7.如果%wio大于7,可能需要考慮是否有IO瓶頸。
如果%wio很小,但CPU依然很忙,要看一下%usr與%sys的比率。如果%usr很高,則可能說(shuō)明用戶(hù)的應(yīng)用程序造成CPU瓶頸。如果大部分時(shí)間被%sys占用,需要進(jìn)一步分析為什么系統(tǒng)會(huì)占用這么多時(shí)間。比如說(shuō)內(nèi)存的瓶頸,造成操作系統(tǒng)頻繁的做swapping操作,就是一個(gè)可能的原因。
對(duì)于一個(gè)典型的系統(tǒng),通常的建議值是:%usr%sys%wio%idle6025015
21.IO所占用的CPU使用率
如上所述,在此記錄%wio值。
如果%wio較高,有條件的話(huà)可以進(jìn)一步分析一下。
使用sard命令觀(guān)察各個(gè)設(shè)備的狀態(tài)。通常一個(gè)設(shè)備的%busy>50%,則說(shuō)明可能存在
IO瓶頸。另外一個(gè)標(biāo)志是其avwait>avserv。
另外,系統(tǒng)中各個(gè)設(shè)備的使用應(yīng)該比較均衡。檢查哪些設(shè)備使用率明顯高于其他設(shè)備。
如果該設(shè)備是存放用戶(hù)數(shù)據(jù)庫(kù)數(shù)據(jù),那么可以考慮建議用戶(hù)將這部分?jǐn)?shù)據(jù)盡量分散到多個(gè)設(shè)備上。如果是操作系統(tǒng)盤(pán),需要關(guān)注是不是在做大量的swapping操作(內(nèi)存瓶頸,sar-w)。
22.空閑的物理內(nèi)存(#top)#top
在memory:一行有xxxxxkfree一項(xiàng)。
23.交換區(qū)使用情況(#swapinfoatm)
#swapinfoatm
MbMbMbPCTSTART/Mb
TYPEAVAILUSEDFREEUSEDLIMITRESERVEPRINAME
dev2560025600%0-1/dev/vg00/lvol2reserve-559-559
total2560559201*22%-0-
另外需檢查,如果用戶(hù)的物理內(nèi)存比交換區(qū)大,需確定swapmem_on核心參數(shù)已設(shè)置
為1.
24.查看系統(tǒng)CPU個(gè)數(shù),內(nèi)存數(shù)量
此信息已收集在/tmp/hp/info.out文件中,亦可在SAM中查看命令序列:#sam->performancemonitors->systemproperties
友情提示:本文中關(guān)于《HP設(shè)備預(yù)防性巡檢報(bào)告模版V1》給出的范例僅供您參考拓展思維使用,HP設(shè)備預(yù)防性巡檢報(bào)告模版V1:該篇文章建議您自主創(chuàng)作。
來(lái)源:網(wǎng)絡(luò)整理 免責(zé)聲明:本文僅限學(xué)習(xí)分享,如產(chǎn)生版權(quán)問(wèn)題,請(qǐng)聯(lián)系我們及時(shí)刪除。