adsense_in_article_test


SMART 정보를 이용한 디스크(HDD/SSD) 고장 징후 판단 IT/잡담

예전에 블랙블레이즈(Blackblaze)라는 클라우드 회사에서 HDD 내구성/신뢰성에 대한 통계를 공개한 적이 있는데, 이번에는 자사에서 디스크 교체 여부를 판단하기 위해 사용하는 SMART 정보를 발표했구나. 원문 기사는 여기로.

디스크가 동작을 멈추거나 또는 조만간 고장이 날 징후가 있다고 판단될 경우 교체한다는데, 고장이 날 징후를 어떻게 판단하는지에 대한 내용이다.

지금까지 온라인 백업 서비스를 운영해 온 경험을 바탕으로 HDD의 사망 징후를 나타내는 SMART 정보 다섯개를 추려냈다고 한다. 수십개의 항목들 중에 고장과 관련된 가장 중요한 항목은 이 다섯개인 듯.

원문 기사에는 SMART ID가 10진수로 되어 나와 있는데, S/W에 따라16진수로 표시해 주는 경우도 있다. 어쨌든, 문제의 다섯개 항목은 아래와 같다. (괄호 안은 16진수 ID)

5 (0x05)reallocated_sector_count
187 (0xBB) reported_uncorrectable_errors
188 (0xBC) command_timeout
197 (0xC5) current_pending_sector_count
198 (0xC6) offline_uncorrectable

위의 항목 다섯개에 대한 상태값이 모두 0이라면 괜찮다고 할 수 있다. 만약 하나라도 1 이상의 값이 나와 있다면 고장의 징후가 시작된 것이므로 중요한 자료는 반드시 백업해 두자. 하드디스크를 기준으로한 내용이긴 하나, SSD도 이에 준해서 관리하면 될 것 같다.

윈도우에서 SMART 정보 확인은  CrystalDiskInfo를 사용하면 된다. 관련 게시물은 여기로.

리눅스에서 SMART 정보를 확인은 smartctl 명령을 이용한다. 관련 게시물은 여기로.



덧글

  • 역성혁명 2014/11/28 14:17 # 답글

    SSD라고 막 썼는데, 앞으로는 조심히 써야겠어요.
  • 반달가면 2014/11/28 20:05 #

    특별히 뭔가 조심해서 쓸 것까진 아닌 것 같습니다. 다만, 중요한 자료를 저장중이라면 종종 SMART 정보를 확인하면 되겠습니다. 클라우드에 백업해 두면 더 좋구요.
  • hyunyi 2014/11/28 22:05 # 답글

    서버 하드디스크에서 종조 모니터링을 해야겠네요. 한번 서버 하드가 소리 소문없이 운명하셔서 엄청 고생을 했더랬죠ㅠ 좋은 정보 감사합니다!
  • 반달가면 2014/11/29 23:41 #

    네. 디스크 날아가고 후회하는 것보다 조금 귀찮아도 상태정보에 신경을 좀 쓰는 것이 좋을 듯합니다.
댓글 입력 영역
* 비로그인 덧글의 IP 전체보기를 설정한 이글루입니다.


B-Side


adsense(w160_h600)2

통계 위젯 (화이트)

264487
4519
2080403

2019 대표이글루_IT

Google Analytics