시스템 점검시 유용한 명령어 몇가지..
1. 파일 시스템 및 디스크 사용률 점검.
명령어 : df -k / df -h
수행 화면.
명령어 수행시 위와 같은 정보가 나옵니다.
사용중인 공간이 ( Use% ) 80% 이하로 관리하는게 좋다고 생각 합니다.
( -k 옵션 사용시 너무 적은 단위로 보여지게되서 눈에 딱 보이질 않아, 저는 -h 옵션을 이용해 기가바이트 단위로 봅니다. )
2. Disk 상태 점검.
명령어 : format
수행 화면.
명령어 수행시 현재 장착되어 있는 디스크의 수량, 파티션 등에 대한 정보가 출력 됩니다.
디스크의 인식 여부 등을 확인 할수 있습니다.
( format 명령어를 통해 파티션등을 설정 할수 있지만, 간단한 점검을 위한 글이므로 해당 부분에 대한 설명은 하지 않겠습니다. 그리고 명령어 수행시 수정할 디스크의 번호를 입력하라고 할때 Ctrl + d 를 입력하면 명령어에서 빠져나오게 됩니다. 해당 화면에서 실수로 숫자를 누른다고 바로 format 되거나 하진 않으니 너무 벌벌 떨지 않으셔도 됩니다 ^^;; )
3. 디스크 ERROR 점검.
명령어 : iostat -e / iostat -E
수행 화면.
명령어를 수행하면 크게 Soft Error / Hard Error / Transport Error 의 항목별로 Error 카운트가 나타납니다.
이중 주의해서 볼 것은 Hard Error 의 카운트 입니다.
만약 디스크에 에러가 있거나 블록이 깨진 경우엔 이 Error count 가 올라가게 됩니다.
보다 자세한 정보를 원하면 -e 옵션대신 -E 옵션을 주면 디스크의 사이즈와 시리얼 번호 제조사 등에대한 정보를 확인 가능 합니다.
4. 디스크의 I/O 상태 점검.
명령어 : iostat -xn [수행 주기]
수행 화면.
명령에서 수행주기는 명령을 수행하는 간격을 말합니다. 위와 같이 1 10 을 입력시 1초 간격으로 10회 반복하고 명령을 종료 합니다. ( 모니터링을 위해 횟수 제한없이 계속해서 보고싶을 경우엔 뒤에 횟수를 쓰지 않고 초단위의 간격만 입력하면 무한으로 반복 합니다. )
다양한 정보가 출력 되는데 %b 가 지속적으로 100 이상이 나타나면 I/O에 병목이 발생하고 있다는 것으로 판단되니 대책을 세워야 합니다. ( cpu 증설, array 교체 등등 )
5. CPU 사용률 점검.
명령어 : vmstat(기본) / top(패키지 설치)
수행 화면.
명령을 수행하면 CPU의 idle 수치를 볼 수 있습니다. 이 때 CPU의 idle( id ) 수치가 지속적으로 20% 이하인 경우엔 장비의 업그레이드를 고려해 보아야 합니다.
( 보다 자세한 정보를 원한다면 top 패키지를 설치해 top 명령어를 수행해보는것도 좋습니다. vmstat 명령의 출력과 달리 top 명령은 어떤 프로세스가 cpu를 얼마만큼 사용하는지에 대한 정보가 함께나와 비정상적인 프로세스의 발견에 유용합니다. )
6. 시스템의 네트웍 상태 점검.
명령어 : netstat -i [수행 주기]
수행 화면.
결과에서 colls(충돌) 가 지속적으로 나타나는지 확인하고 계속해서 발생하면 네트워크의 상태가 불안정한 상태 이므로 그에따른 적절한 대응책을 마련해주는게 좋습니다.
7. 시스템 로그를 통해 시스템 상태 파악.
명령어 : cat /var/adm/messages
명령어 수행시 /var/adm 경로에 있는 messages 파일안의 내용이 출력 되는데 해당 내용에서 FAIL, WARNING, PANIC 등의 단어가 나타나는지 확인하고 이러한 단어가 보인다면 주의깊게 확인하고 그에 따른 적절한 대응을 해줘야 합니다.
8. 하드웨어 상태 점검 ( 시스템의 전체 하드웨어 상태를 솔라리스의 유틸을 통해 파악. )
명령어 : /usr/platform/sun4u/sbin/prtdiag -v
수행 화면.
명령어를 수행하면 현재 시스템의 하드웨어( CPU, MEMORY, IO CARDS, HW REVISION )에 Failure 가 있는지 알수 있습니다.
만약 문제가 있는 부분이 없다면 위의 화면과 같이 "No failures found in System" 메시지가 나옵니다.
( OS 의 버전 마다 조금씩 출력의 결과가 다르니 참고 하세요. )
9. 시스템 기동 시간 확인.
명령어 : uptime
수행 화면.
명령어 수행시 위와 같이 시스템의 기동 시간이 나옵니다.
365일 이상일 경우 장비의 상태를 고려해 재기동을 해주는게 좋다고 생각합니다.
10. 네트워크 소켓 연결 상태 확인. ( 프로세스간 소켓 연결 상태 확인 )
명령어 : netstat -a | grep "호스트명"
수행 화면.
명령어를 통해 STATE 값이 "ESTABLISHED" 가 아닌 "TIMEWAIT" 이거나 "DISABLE" 일 경우엔 해당 포트를 사용해 연결중인 프로세스를 점검해야 합니다.
위와 같이 간단한 명령어 10개 정도만 숙지하고 1주일에 한번이라거나 한달에 한번정도 점검을 진행하면 좋을것 같아요 ~
사전 예방도 되고 ~
'OS > 솔라리스' 카테고리의 다른 글
[솔라리스 & 리눅스] 도움말(메뉴얼) 명령어 man (0) | 2014.07.02 |
---|---|
[CRON] cron 을 이용한 디스크 용량 관리. (0) | 2014.06.11 |
[솔라리스] ifconfig 명령어로 IP 변경. (1) | 2014.05.28 |
[솔라리스] 네트워크 인터페이스명 확인 방법. (0) | 2014.05.28 |
[솔라리스] 프로세스가 사용중인 FD 확인 ( pfiles ) (0) | 2014.05.28 |