유휴 상태에서 SAS HDD 클릭 소음 - PERC H710 설정에 대한 조언 구하기(스토리지 문제 해결)

유휴 상태에서 SAS HDD 클릭 소음 - PERC H710 설정에 대한 조언 구하기(스토리지 문제 해결)

저는 최근 각각 약 35일 동안 서비스를 제공하는 중고 SAS HDD 5개를 구입했습니다. 새 HDD를 구입하는 것과 비교하면 엄청난 금액이지만 처음에는 SATA인 줄 알고 약간의 혼동이 있었습니다. 몇 가지 조사 끝에 RAID 컨트롤러(HBA로 사용)인 PERC H710을 구입했습니다. 그러나 모든 것을 설치한 후에는 이러한 SAS HDD가 유휴 상태일 때 이상한 딸깍 소리가 나는 것을 발견했습니다. 특히 판매자의 좋은 평판을 고려할 때 잘 포장된 디스크 5개 모두 동일한 문제가 있을 가능성은 거의 없습니다. 참고용으로 소음을 녹음했습니다.

서버에 더 가까운 곳: https://www.youtube.com/shorts/DFqMGDFCObU

다른 방(벽 반대편): https://www.youtube.com/shorts/4jHKJnIhp2Q 추신: 특히 일부 SATA HDD가 실행 중인 경우 비디오를 듣는 것이 어려울 수 있습니다. 서버가 생산 중이므로 다른 SATA HDD에서 읽기/쓰기가 진행 중입니다.

그 중 하나에 대한 정보는 다음과 같습니다.

    === START OF INFORMATION SECTION ===
Vendor:               SEAGATE
Product:              ST33000650SS
Revision:             RS16
Compliance:           SPC-4
User Capacity:        3,000,592,982,016 bytes [3.00 TB]
Logical block size:   512 bytes
Rotation Rate:        7200 rpm
Form Factor:          3.5 inches
Logical Unit id:      0x5000c50055ad05e3
Serial number:        Z295A8NC
Device type:          disk
Transport protocol:   SAS (SPL-3)
Local Time is:        Wed Feb 21 17:40:10 2024 EST
SMART support is:     Available - device has SMART capability.
SMART support is:     Enabled
Temperature Warning:  Disabled or Not Supported

=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK

Current Drive Temperature:     48 C
Drive Trip Temperature:        68 C

Accumulated power on time, hours:minutes 63899:38
Manufactured in week 43 of year 2012
Specified cycle count over device lifetime:  10000
Accumulated start-stop cycles:  70
Specified load-unload count over device lifetime:  300000
Accumulated load-unload cycles:  12281
Elements in grown defect list: 0

이전에 SAS HDD에서 비슷한 문제를 겪은 사람이 있습니까? 이는 SAS의 정상적인 동작입니까, 아니면 몇 가지 테스트를 실행해야 합니까? 어떤 조언이라도 매우 감사하겠습니다!

답변1

다음 명령을 실행하고 완료될 때까지 기다린 후 "총 읽기 오류 수정 = 1809673244"가 표시되고 드라이버에서 이러한 소음이 발생하지 않습니다.

smartctl -tlong /dev/sdX

완료 후 출력은 다음과 같습니다.

root@abc:~# smartctl -a /dev/sda
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.10.0-27-amd64] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Vendor:               SEAGATE
Product:              ST33000650SS
Revision:             RS16
Compliance:           SPC-4
User Capacity:        3,000,592,982,016 bytes [3.00 TB]
Logical block size:   512 bytes
Rotation Rate:        7200 rpm
Form Factor:          3.5 inches
Logical Unit id:      0x5000c50055ad05e3
Serial number:        Z295A8NC
Device type:          disk
Transport protocol:   SAS (SPL-3)
Local Time is:        Thu Feb 22 09:40:48 2024 EST
SMART support is:     Available - device has SMART capability.
SMART support is:     Enabled
Temperature Warning:  Disabled or Not Supported

=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK

Current Drive Temperature:     43 C
Drive Trip Temperature:        68 C

Accumulated power on time, hours:minutes 63915:46
Manufactured in week 43 of year 2012
Specified cycle count over device lifetime:  10000
Accumulated start-stop cycles:  70
Specified load-unload count over device lifetime:  300000
Accumulated load-unload cycles:  12283
Elements in grown defect list: 0

Vendor (Seagate Cache) information
  Blocks sent to initiator = 3623441469
  Blocks received from initiator = 3686219937
  Blocks read from cache and sent to initiator = 272821687
  Number of read and write commands whose size <= segment size = 36308955
  Number of read and write commands whose size > segment size = 15

Vendor (Seagate/Hitachi) factory information
  number of hours powered up = 63915.77
  number of minutes until next internal SMART test = 55

Error counter log:
           Errors Corrected by           Total   Correction     Gigabytes    Total
               ECC          rereads/    errors   algorithm      processed    uncorrected
           fast | delayed   rewrites  corrected  invocations   [10^9 bytes]  errors
read:   1809673244        0         0  1809673244          0      30248.740           0
write:         0        0         0         0          0       8554.361           0
verify: 2794696942        0         0  2794696942          0    1042801.370           0

Non-medium error count:    59813

SMART Self-test log
Num  Test              Status                 segment  LifeTime  LBA_first_err [SK ASC ASQ]
     Description                              number   (hours)
# 1  Background long   Completed                  32   63907                 - [-   -    -]
# 2  Background short  Completed                  32   63890                 - [-   -    -]
# 3  Background short  Completed                  32      23                 - [-   -    -]
# 4  Background long   Completed                  32      22                 - [-   -    -]

Long (extended) Self-test duration: 27600 seconds [460.0 minutes]

root@abc:~#

이것이 같은 문제를 가진 누군가에게 도움이 되기를 바랍니다!

관련 정보