우리최근에 약간의 문제가 생겼어요여러 서버가 해결하기 상당히 어려운 방식(하드 재부팅 필요)으로 간헐적으로 네트워크 연결이 끊어지는 네트워킹을 사용합니다. 이것은 다른 서버에서 무작위로 보이는 것처럼 약 2주 동안 계속되었습니다. 우리가 식별할 수 있는 특별한 패턴은 없습니다.
좀 더 자세히 조사한 결과 스위치가 문제 포트에 대해 100Mbps를 보고하는 것을 확인했습니다.
이것은 Joel Spolsky 기사에서 일어난 일과 매우 흡사합니다.다섯 가지 이유
Michael은 사후 조사를 하면서 시간을 보냈고 문제가 스위치의 단순한 구성 문제라는 것을 발견했습니다. 스위치가 통신하는 데 사용할 수 있는 속도에는 여러 가지가 있습니다(10, 100 또는 1000MB/초). 속도를 수동으로 설정하거나 스위치가 양쪽에서 작업할 수 있는 최고 속도를 자동으로 협상하도록 할 수 있습니다.실패한 스위치는 자동 협상으로 설정되었습니다. 이는 일반적으로 작동하지만 항상 그런 것은 아니며 1월 10일 아침에는 작동하지 않았습니다.
우리는 지금자동 협상 비활성화네트워크 하드웨어에서 고정 속도 1000Mbps(기가비트)로 설정합니다.
서버 하드웨어 네트워킹 전문 지식이 있는 분들에게 드리는 질문은 다음과 같습니다.
- 최신 네트워킹 하드웨어에서 자동 협상 문제는 얼마나 흔한가요?
- 네트워킹을 설정할 때 자동 협상을 비활성화하고 고정 속도를 설정하는 것이 좋은 표준 네트워킹 방식으로 간주됩니까?
답변1
(a) 링크 한쪽 끝의 수동과 다른 쪽 끝의 자동 불일치 또는 (b) 링크의 실패한 구성 요소로 인해 발생하지 않는 네트워크 속도 자동 협상 문제를 아직 본 적이 없습니다. 케이블, 포트 등).
이는 관리자에 따라 다르지만 내 경험에 따르면 링크 속도와 이중 설정을 수동으로 지정하면 속도 불일치가 발생할 수 있습니다. 왜? 스위치와 서버 사이의 다양한 연결을 문서화한 다음 변경 시 해당 문서를 따르는 것이 거의 불가능하기 때문입니다. 내가 본 대부분의 실패는 1(a) 때문에 발생하며 속도/이중 설정을 수동으로 설정하기 시작할 때만 해당 상황에 처하게 됩니다.
에서 언급했듯이시스코 문서:
자동 협상을 비활성화하면 링크 삭제 및 기타 물리적 계층 문제가 숨겨집니다. 기가비트 자동 협상을 지원하지 않는 이전 기가비트 NIC와 같은 최종 장치에 대한 자동 협상만 비활성화하십시오. 물리적 계층 문제가 감지되지 않고 스패닝 트리 루프가 발생할 수 있으므로 반드시 필요한 경우가 아니면 스위치 간 자동 협상을 비활성화하지 마십시오.
속도/이중 확인이 필요한(흐름 제어도 잊지 마세요) 네트워크 변경에 대한 변경 관리 시스템을 설정할 준비가 되어 있지 않거나 모든 네트워크 장치에서 이러한 설정을 수동으로 지정함으로써 발생하는 간헐적인 불일치를 처리하려는 의지가 없다면, 그런 다음 자동/자동의 기본 구성을 유지합니다.
앞으로는 다음을 사용하여 스위치 포트의 오류를 모니터링하는 것을 고려하십시오.MRTG문제가 발생하기 전에 이러한 문제를 발견할 수 있습니다.
편집하다:나는 오래된 장비에 대한 협상 실패를 언급하는 사람들을 많이 봅니다. 예, 이것은 표준이 만들어지고 모든 장치가 표준을 따르지는 않는 오래 전의 문제였습니다. 귀하의 NIC와 스위치가 10년 미만입니까? 그렇다면 이것은 문제가 되지 않습니다.
답변2
매우 일반적입니다. 다양한 유형의 하드웨어에서 수년 동안 수많은 문제가 발생했습니다.
제 생각에는 설정이 정적(예: 서버 랙)이고 변경이 없을 것이라고 생각한다면 속도와 이중 방식을 수동으로 설정하는 것이 좋습니다. 향후 문제를 방지할 수 있도록 잘 문서화되어 있는 한.
편집하다:
명확히 하자면, 전체 네트워크에서 수동 속도를 사용하는 것을 옹호하는 것이 아닙니다. 95%의 경우 자동/자동이 좋은 방법이라고 말하고 싶습니다. 나는 단지 이중/속도에 문제가 있었고 내 네트워크의 작은 부분(예: 서버 랙 중 하나)이 대부분 수동 설정을 가지고 있다는 것을 말하는 것입니다. 우리는 사용하지 않는 포트를 종료하고 대부분의 포트에 MAC 필터를 사용하여 매우 엄격하게 제어되는 LAN을 운영하므로 속도를 추적하는 것이 그리 어렵지 않습니다.
답변3
자동 협상이 하루 또는 한 달 동안 한 시간 동안 작동한 후 어떤 이유로 "뭔가가 발생하면" 링크를 고정 속도로 설정하면 "수정"되는 문제가 해결되지 않고 대신 우회되는 문제가 있다고 생각합니다. 실제 문제가 해결될 때까지 임시 해결책으로 링크를 고정으로 설정하는 것으로 보입니다.
답변4
내가 (다른 몇몇 사람들과 함께) 담당하고 있는 네트워크는 ~40개의 서버, 1000개 이상의 워크스테이션(다소 큰 캠퍼스에 분산되어 있음) 및 다양한 유형과 연령대의 넓은 지역에 분산되어 있는 ~1000개의 WAP로 구성되어 있습니다. 네트워크 장비의.
dimitri.p가 말했듯이, 자동 협상이 갑자기 중단되지 않으면 일반적으로 다른 문제가 있음을 나타냅니다. 포트를 수동으로 설정하는 것은 내장에 찔린 사람에게 반창고를 붙이는 것과 유사합니다. 출혈을 멈출 수는 있지만 아래쪽에는 손상이 있을 수 있습니다.
나의 평소 체크리스트:
- 기계에 뭔가 변화가 있었나요? 드라이버? OS 또는 BIOS 수준 설정? 아마도 OS에서 autoneg가 비활성화되었을 수 있습니까?
- 패치 케이블을 교체했나요?검증됨케이블이 연결됩니다(로그너가 하나의 랙보다 실행되는 경우?)
- 스위치 포트가 불량인지 실패하는지 테스트해 보셨나요?
- NIC가 나빠질 수 있나요?
우리는 원칙적으로절대다른 모든 가능한 원인이 제거되고, 스위치 포트를 이동하고, 케이블을 변경하고, NIC를 테스트하는 등의 상황이 아닌 한 서버(또는 데이터 센터의 다른 모든 것)에서 자동 거부를 비활성화합니다. 다른 선택의 여지가 없습니다. 어떤 경우에는 사망으로 문서화됩니다. 이는 매우 드물게 발생하며 일반적으로 BIOS 및 OS 설정을 확인하기 위해 액세스할 수 없는 어플라이언스에서 발생합니다.
반면에 워크스테이션과 AP는 이야기가 다릅니다. 자동 감지 실패는 케이블 연결 상태가 좋지 않다는 전형적인 신호이며, 여름철 새 케이블 설치 시즌이 올 때까지 속도와 이중 방식을 수동으로 설정해야 하는 경우가 많습니다.