2023/04/29

NVMe SSD 고장 전 증상 | Media and Data Integrity Errors

NVMe SSD 고장 전 증상 | Media and Data Integrity Errors

처음 겪은 SSD 고장

Symptoms Before NVMe SSD Failure | Media and Data Integrity Errors
<AS 보내기 직전의 증상>

작년 9월에 구매한 트랜센드 NVMe MTE220S 1TB 제품에 문제가 발생했다. 엄청난 배드섹터가 발생한 것. Windows에서 chkdsk /f /r 검사를 시도하면 불량 섹터를 복구하는 단계에서 블루스크린이 발생했고, PE에서 chkdsk 검사를 시도하면 역시 불량 섹터를 복구하는 단계에서 오류와 함께 검사가 중단되었고, 더불어 장치 관리자에서 NVMe가 사라졌다.

배드섹터가 대략 250GB 부분부터 대거 발생하는 것으로 보아 두 번째 낸드플래시가 고장 난 것으로 추측되는데 삼성 낸드플래시도 역시 고장률은 다른 제품과 차이가 없나 보다.

문제가 된 제품은 트랜센드 공식 유통사인 파인인포메이션을 통해 새 제품으로 교체 받았고(월요일 날 보내고 수요일 날 새 제품 받음), 이 과정에서 방열판이 부착되어 있으면 AS가 거부된다는 사실도 배웠다.

아무튼 오늘은 이번 경험을 통해 NVMe SSD 제품이 고장 나기 전에 어떤 사전 징후를 보였는지에 대해 몇 자 적어봤다. 이를 통해 자동차 주행 시 간헐적인 소음 같은 증상으로 고장을 사전에 예상하듯 NVMe도 그렇게 함으로써 소중한 자료가 유실되는 것을 방지할 수 있기를 기대해본다.

NVMe SSD 고장 전 징후 1

Symptoms Before NVMe SSD Failure | Media and Data Integrity Errors

내가 이번에 겪은 NVMe SSD 고장 전 사전 징후 증상 중 첫 번째는 프리징과 블루스크린이다.

새로 장착한 SSD가 프리징과 블루스크린을 발생시킨다면 호환성 문제, 또는 초기 불량을 의심해볼 수 있지만, 몇 달 동안 잘 사용하던 SSD가 프리징과 블루스크린을 일으킨다면 SSD에 문제가 발생한 것으로 의심해 볼 수 있다.

NVMe SSD 고장 전 징후 2

Symptoms Before NVMe SSD Failure | Media and Data Integrity Errors

처음 장착했을 때는 겪지 않았던 프리징 현상이 나타난다면, [이벤트 뷰어]를 확인해보자. 만약 다음과 같은 이벤트 오류 ‘Event ID: 7, Source: Disk’가 기록되어 있다면, SSD에 문제가 발생했을 가능성이 크다.

\Device\Harddisk 장치에 잘못된 블록이 있습니다
\Device\Harddisk has a bad block

NVMe SSD 고장 전 징후 3

Symptoms Before NVMe SSD Failure | Media and Data Integrity Errors

’Event ID: 7’을 발견했다면, CrystalDiskInfo 같은 S.M.A.R.T. 기반 HDD/SSD 모니터링 도구로 속성값을 확인해보자. 아마도 Media and Data Integrity Errors(매체/데이터 무결성 오류 횟수) 값이 엄청나게 증가해있을 것이다.

참고로 Media and Data Integrity Errors 값은 NVMe SSD에만 해당되는 것이고 SATA SSD에는 없다.

NVMe SSD 고장 전 징후 4

Symptoms Before NVMe SSD Failure | Media and Data Integrity Errors

HDD/SDD 유틸리티인 HD Tune Pro의 읽기 속도 테스트 도중 [Read Error!] 메시지와 함께 테스트가 종료된다.

NVMe SSD 고장 전 징후 5

Symptoms Before NVMe SSD Failure | Media and Data Integrity Errors

Macrorit Disk Scanner로 배드섹터 검사 결과다.

이땐 초기라 배드섹터가 몇 개 없었다. 하지만, AS를 받기 직전엔 대충 250GB부터는 배드섹터 축제!!!

Symptoms Before NVMe SSD Failure | Media and Data Integrity Errors
<AS로 교체 받은 새 제품(2023년 3월 생산)>

마무리

처음 문제점을 발견했을 때, 그러니까 배드섹터가 몇 개 없었던 초기엔 chkdsk /f /r 디스크 검사로 프리징/블루스크린 문제는 해결할 수 있었다. 그리고 디스크를 초기화하고 일반 포맷하니 배드섹터도 사라졌다. 그래서 문제가 해결된 줄 알았는데, 이 상태에서 한 달이 못가 결국 서문에서 언급한 사태와 맞닥뜨리게 되었다(이땐 Media and Data Integrity Errors 값이 6천 넘게 치솟아 있었다). 다행히 급사는 아니었고, 문제가 발생한 낸드플래시가 저장된 부분의 자료를 제외하곤 나머지 낸드플래시 위치에 있는 자료는 읽기가 가능했다. 문제가 있는 낸드플래시에만 접근하면 프리징!

이런 경험에 비추면 Media and Data Integrity Errors 값이 지속해서 증가하고 배드섹터가 발생하고 ‘Event ID: 7, Source: Disk’가 기록된다면, 그리고 문제가 된 제품의 무상 AS 기간이 남았다면, 스스로 해결한답시고 이리저리 머리 굴리며 시간과 열량 낭비하지 말고 자료 백업 후 바로 교체 받는 것을 추천한다.

만약 (이번 경우처럼) Windows 특정 이벤트 로그가 발생했을 때 실시간으로 알림을 받고 싶다면 「Windows 특정 이벤트 로그 실시간 알림」 글을 참고할 수 있다.

참고로 고장 난 SSD를 AS 보내기 전에 급한 김에 삼성 PM9A1 M.2 NVMe 병행수입 제품을 구매했는데, 역시 삼성이다. 체감 성능도 살짝 좋지만, PCIe4.0 스펙의 제품을 PCIe3.0 스펙으로 사용해서 그런지 발열이 거의 없어서 좋다.

0 comments:

댓글 쓰기

댓글은 검토 후 게재됩니다.
본문이나 댓글을 정독하신 후 신중히 작성해주세요