ATA가 응답을 중지하면 md RAID의 장치에 오류가 발생합니다.

Question

델틱, 당신은 Linux 소프트웨어 RAID( md)가 어떻게 작동하는지 오해했습니다.

md여러 장치나 파티션으로 가상 블록 장치를 만들고 가상 장치에서 어떤 데이터를 전송하고 있는지 인식하지 못합니다.
당신은 그것이 하도록 설계되지 않은 일을 할 수 있기를 바랐습니다.

답변

1. `md`응답하지 않는 드라이브/파티션이 실패하지 않는 이유는 무엇입니까?

그 이유 md는

드라이브가 md자체적으로 요청한 I/O로 인해 사용 중이거나
드라이브 자체 오류 복구 또는 귀하의 경우 ATA Secure Erase와 같은 일부 외부 상황으로 인해 드라이브가 차단되었습니다.

그래서 md드라이브가 무엇을 반환하는지 기다릴 것입니다. 드라이브는 결국 읽기 또는 쓰기 오류를 반환하지 않았습니다. 읽기 오류가 있으면 md패리티에서 자동으로 수정하고, 쓰기 오류가 있으면 md장치에 오류가 발생합니다(설명서의 "복구" 섹션 참조).md매뉴얼 페이지).

읽기 오류나 쓰기 오류가 없었으므로 md커널이 응답을 기다린 후 장치를 계속 사용했습니다.

2. 드라이브가 차단된 동안 어레이에서 드라이브/파티션을 삭제할 수 있습니까?

아니요. /dev/md0RAID 장치는 차단되어 있으며 블록이 지워질 때까지 수정할 수 없습니다.

-f또는 --fail플래그를 "관리" 모드에 전달했습니다 mdadm.
실제로 수행되는 작업에 대한 연습은 다음과 같습니다.

이것은 해당 플래그가 작동하는 방식에 대한 소스 코드입니다.:

case 'f': /* set faulty */
    /* FIXME check current member */
    if ((sysfd >= 0 && write(sysfd, "faulty", 6) != 6) ||
        (sysfd < 0 && ioctl(fd, SET_DISK_FAULTY,
                rdev))) {
        if (errno == EBUSY)
            busy = 1;
        pr_err("set device faulty failed for %s:  %s\n",
            dv->devname, strerror(errno));
        if (sysfd >= 0)
            close(sysfd);
        goto abort;
    }
    if (sysfd >= 0)
        close(sysfd);
    sysfd = -1;
    count++;
    if (verbose >= 0)
        pr_err("set %s faulty in %s\n",
            dv->devname, devname);
    break;

호출을 확인합니다 write(sysfd, "faulty", 6). sysfd파일의 앞부분에 설정된 변수입니다.
sysfd = sysfs_open(fd2devnm(fd), dname, "block/dev");

sysfs_open()의 함수입니다이 파일:

int sysfs_open(char *devnm, char *devname, char *attr)
{
    char fname[50];
    int fd;

    sprintf(fname, "/sys/block/%s/md/", devnm);
    if (devname) {
        strcat(fname, devname);
        strcat(fname, "/");
    }
    strcat(fname, attr);
    fd = open(fname, O_RDWR);
    if (fd < 0 && errno == EACCES)
        fd = open(fname, O_RDONLY);
    return fd;
}

함수를 따라가면 mdadm /dev/md0 -f /dev/sdb1기본적으로 다음과 같은 작업을 수행한다는 것을 알 수 있습니다.

echo "faulty" > /sys/block/md0/md/dev-sdb1/block/dev

이 요청은 대기 중이며 차단되었으므로 즉시 처리되지 않습니다 /dev/md0.

`md`3. ATA 명령에 응답하지 않는 드라이브가 자동으로 실패 하도록 시간 초과를 구성할 수 있습니까 ?

예. 사실은,기본적으로 제한 시간은 30초입니다.:

root@node51 [~]# cat /sys/block/sdb/device/timeout
30

가정의 문제는 드라이브가 실제로 ATA 명령을 실행 중이어서(188분 동안) 시간 초과가 발생하지 않았다는 것입니다.

이에 대한 자세한 내용은 다음을 참조하세요.Linux 커널 SCSI 오류 처리 문서.

4. `md`데이터가 유효하지 않은 기기를 계속 사용하는 이유는 무엇입니까?

ATA Secure Erase가 완료되었을 때 드라이브는 명령 중단과 같은 문제를 보고하지 않았으므로 md문제가 있다고 의심할 이유가 없었습니다.

또한 전체 디스크 대신 파티션을 RAID 장치로 사용하는 경우 커널의 메모리 내 파티션 테이블은 지워진 드라이브의 파티션이 사라졌다는 사실을 알리지 않았으므로 아무 문제가 없는 것처럼 md계속 액세스하게 됩니다 ./dev/sdb1

이것은md매뉴얼 페이지:

스크러빙 및 불일치

저장 장치는 언제든지 불량 블록을 개발할 수 있으므로 이러한 불량 블록을 조기에 발견할 수 있도록 어레이에 있는 모든 장치의 모든 블록을 정기적으로 읽는 것이 중요합니다. 이 과정을닦고.

md 배열은 다음 중 하나를 작성하여 스크러빙할 수 있습니다.확인하다또는수리하다파일에md/sync_action에서sysfs장치의 디렉터리입니다.

스크럽을 요청하면 md가 어레이에 있는 모든 장치의 모든 블록을 읽고 데이터가 일관성이 있는지 확인하게 됩니다. RAID1 및 RAID10의 경우 이는 복사본이 동일한지 확인하는 것을 의미합니다. RAID4, RAID5, RAID6의 경우 이는 패리티 블록이 올바른지 확인하는 것을 의미합니다.

이를 통해 일반적으로 모든 디스크 읽기에서 패리티가 검사되지 않는다는 것을 추론할 수 있습니다. (게다가 모든 읽기에서 패리티를 확인하는 것은 단지 읽기를 완료하는 데 필요한 트랜잭션을 늘리고 읽은 데이터에 대한 패리티 비교를 실행하므로 성능에 큰 부담이 됩니다.)

정상적인 작동에서는 md읽고 있는 데이터가 유효하다고 가정하므로 다음과 같은 공격에 취약합니다.조용한 데이터 손상. 귀하의 경우 드라이브를 삭제했기 때문에 드라이브 전체가 조용히 손상된 데이터를 갖게 되었습니다.

파일 시스템이 손상을 인식하지 못했습니다. 파일 시스템이 잘못된 데이터가 있는 이유를 이해할 수 없기 때문에 파일 시스템 수준에서 입출력 오류가 발생했습니다.

자동 데이터 손상을 방지하려면 먼저,다시는 당신이 했던 일을 하지 마세요. 둘째, 사용을 고려하십시오.ZFS, 데이터 무결성에 중점을 두고 자동 데이터 손상을 감지하고 수정하는 파일 시스템입니다.

Answer 1

델틱, 당신은 Linux 소프트웨어 RAID( md)가 어떻게 작동하는지 오해했습니다.

md여러 장치나 파티션으로 가상 블록 장치를 만들고 가상 장치에서 어떤 데이터를 전송하고 있는지 인식하지 못합니다.
당신은 그것이 하도록 설계되지 않은 일을 할 수 있기를 바랐습니다.

답변

1. `md`응답하지 않는 드라이브/파티션이 실패하지 않는 이유는 무엇입니까?

그 이유 md는

드라이브가 md자체적으로 요청한 I/O로 인해 사용 중이거나
드라이브 자체 오류 복구 또는 귀하의 경우 ATA Secure Erase와 같은 일부 외부 상황으로 인해 드라이브가 차단되었습니다.

그래서 md드라이브가 무엇을 반환하는지 기다릴 것입니다. 드라이브는 결국 읽기 또는 쓰기 오류를 반환하지 않았습니다. 읽기 오류가 있으면 md패리티에서 자동으로 수정하고, 쓰기 오류가 있으면 md장치에 오류가 발생합니다(설명서의 "복구" 섹션 참조).md매뉴얼 페이지).

읽기 오류나 쓰기 오류가 없었으므로 md커널이 응답을 기다린 후 장치를 계속 사용했습니다.

2. 드라이브가 차단된 동안 어레이에서 드라이브/파티션을 삭제할 수 있습니까?

아니요. /dev/md0RAID 장치는 차단되어 있으며 블록이 지워질 때까지 수정할 수 없습니다.

-f또는 --fail플래그를 "관리" 모드에 전달했습니다 mdadm.
실제로 수행되는 작업에 대한 연습은 다음과 같습니다.

이것은 해당 플래그가 작동하는 방식에 대한 소스 코드입니다.:

case 'f': /* set faulty */
    /* FIXME check current member */
    if ((sysfd >= 0 && write(sysfd, "faulty", 6) != 6) ||
        (sysfd < 0 && ioctl(fd, SET_DISK_FAULTY,
                rdev))) {
        if (errno == EBUSY)
            busy = 1;
        pr_err("set device faulty failed for %s:  %s\n",
            dv->devname, strerror(errno));
        if (sysfd >= 0)
            close(sysfd);
        goto abort;
    }
    if (sysfd >= 0)
        close(sysfd);
    sysfd = -1;
    count++;
    if (verbose >= 0)
        pr_err("set %s faulty in %s\n",
            dv->devname, devname);
    break;

호출을 확인합니다 write(sysfd, "faulty", 6). sysfd파일의 앞부분에 설정된 변수입니다.
sysfd = sysfs_open(fd2devnm(fd), dname, "block/dev");

sysfs_open()의 함수입니다이 파일:

int sysfs_open(char *devnm, char *devname, char *attr)
{
    char fname[50];
    int fd;

    sprintf(fname, "/sys/block/%s/md/", devnm);
    if (devname) {
        strcat(fname, devname);
        strcat(fname, "/");
    }
    strcat(fname, attr);
    fd = open(fname, O_RDWR);
    if (fd < 0 && errno == EACCES)
        fd = open(fname, O_RDONLY);
    return fd;
}

함수를 따라가면 mdadm /dev/md0 -f /dev/sdb1기본적으로 다음과 같은 작업을 수행한다는 것을 알 수 있습니다.

echo "faulty" > /sys/block/md0/md/dev-sdb1/block/dev

이 요청은 대기 중이며 차단되었으므로 즉시 처리되지 않습니다 /dev/md0.

`md`3. ATA 명령에 응답하지 않는 드라이브가 자동으로 실패 하도록 시간 초과를 구성할 수 있습니까 ?

예. 사실은,기본적으로 제한 시간은 30초입니다.:

root@node51 [~]# cat /sys/block/sdb/device/timeout
30

가정의 문제는 드라이브가 실제로 ATA 명령을 실행 중이어서(188분 동안) 시간 초과가 발생하지 않았다는 것입니다.

이에 대한 자세한 내용은 다음을 참조하세요.Linux 커널 SCSI 오류 처리 문서.

4. `md`데이터가 유효하지 않은 기기를 계속 사용하는 이유는 무엇입니까?

ATA Secure Erase가 완료되었을 때 드라이브는 명령 중단과 같은 문제를 보고하지 않았으므로 md문제가 있다고 의심할 이유가 없었습니다.

또한 전체 디스크 대신 파티션을 RAID 장치로 사용하는 경우 커널의 메모리 내 파티션 테이블은 지워진 드라이브의 파티션이 사라졌다는 사실을 알리지 않았으므로 아무 문제가 없는 것처럼 md계속 액세스하게 됩니다 ./dev/sdb1

이것은md매뉴얼 페이지:

스크러빙 및 불일치

저장 장치는 언제든지 불량 블록을 개발할 수 있으므로 이러한 불량 블록을 조기에 발견할 수 있도록 어레이에 있는 모든 장치의 모든 블록을 정기적으로 읽는 것이 중요합니다. 이 과정을닦고.

md 배열은 다음 중 하나를 작성하여 스크러빙할 수 있습니다.확인하다또는수리하다파일에md/sync_action에서sysfs장치의 디렉터리입니다.

스크럽을 요청하면 md가 어레이에 있는 모든 장치의 모든 블록을 읽고 데이터가 일관성이 있는지 확인하게 됩니다. RAID1 및 RAID10의 경우 이는 복사본이 동일한지 확인하는 것을 의미합니다. RAID4, RAID5, RAID6의 경우 이는 패리티 블록이 올바른지 확인하는 것을 의미합니다.

이를 통해 일반적으로 모든 디스크 읽기에서 패리티가 검사되지 않는다는 것을 추론할 수 있습니다. (게다가 모든 읽기에서 패리티를 확인하는 것은 단지 읽기를 완료하는 데 필요한 트랜잭션을 늘리고 읽은 데이터에 대한 패리티 비교를 실행하므로 성능에 큰 부담이 됩니다.)

정상적인 작동에서는 md읽고 있는 데이터가 유효하다고 가정하므로 다음과 같은 공격에 취약합니다.조용한 데이터 손상. 귀하의 경우 드라이브를 삭제했기 때문에 드라이브 전체가 조용히 손상된 데이터를 갖게 되었습니다.

파일 시스템이 손상을 인식하지 못했습니다. 파일 시스템이 잘못된 데이터가 있는 이유를 이해할 수 없기 때문에 파일 시스템 수준에서 입출력 오류가 발생했습니다.

자동 데이터 손상을 방지하려면 먼저,다시는 당신이 했던 일을 하지 마세요. 둘째, 사용을 고려하십시오.ZFS, 데이터 무결성에 중점을 두고 자동 데이터 손상을 감지하고 수정하는 파일 시스템입니다.

ATA가 응답을 중지하면 md RAID의 장치에 오류가 발생합니다.

경고

질문

답변1

답변

1. `md`응답하지 않는 드라이브/파티션이 실패하지 않는 이유는 무엇입니까?

2. 드라이브가 차단된 동안 어레이에서 드라이브/파티션을 삭제할 수 있습니까?

`md`3. ATA 명령에 응답하지 않는 드라이브가 자동으로 실패 하도록 시간 초과를 구성할 수 있습니까 ?

4. `md`데이터가 유효하지 않은 기기를 계속 사용하는 이유는 무엇입니까?

스크러빙 및 불일치

관련 정보

경고

질문

답변1

답변

1. md응답하지 않는 드라이브/파티션이 실패하지 않는 이유는 무엇입니까?

2. 드라이브가 차단된 동안 어레이에서 드라이브/파티션을 삭제할 수 있습니까?

md3. ATA 명령에 응답하지 않는 드라이브가 자동으로 실패 하도록 시간 초과를 구성할 수 있습니까 ?

4. md데이터가 유효하지 않은 기기를 계속 사용하는 이유는 무엇입니까?

스크러빙 및 불일치

관련 정보

1. `md`응답하지 않는 드라이브/파티션이 실패하지 않는 이유는 무엇입니까?

`md`3. ATA 명령에 응답하지 않는 드라이브가 자동으로 실패 하도록 시간 초과를 구성할 수 있습니까 ?

4. `md`데이터가 유효하지 않은 기기를 계속 사용하는 이유는 무엇입니까?