압축으로 rsync를 수행한 후 파일 복원

압축으로 rsync를 수행한 후 파일 복원

압축 및 보관을 위해 arg -z 및 -a를 사용하여 rsync를 수행할 수 있다는 것을 이해합니다.

누군가 이러한 옵션을 알려줄 수 있습니까? 원래 폴더로 복원해야 하는 경우 백업 중인 파일에 어떤 영향을 미칩니까?

rsync -avz를 수행한 후 미디어 파일 샘플을 다시 복사했는데 제대로 작동하는 것 같지만 확인하고 싶었습니다.

감사해요

답변1

누군가 이러한 옵션을 알려줄 수 있습니까? 원래 폴더로 복원해야 하는 경우 백업 중인 파일에 어떤 영향을 미칩니까?

아니요, -z스위치는 대상 위치에 기록된 데이터에 어떤 식으로든 영향을 미치지 않으며 -a단지 보다 충실한 복사본이 만들어지도록 하기 위한 것입니다. 자세한 내용은 계속 읽어보세요...


rsync 매뉴얼 페이지에서는 -z( --compress) 스위치에 대해 다음과 같이 설명합니다.

-z,--compress전송 중 파일 데이터 압축

( -a전송이 완료된 후 대상 위치 데이터가 모든 측면에서 소스 위치 데이터와 동일하도록 스위치를 활성화하는 약칭입니다. 파일 메타데이터에는 영향을 주지만 파일 내용에는 영향을 미치지 않습니다.내용물복사된 파일의 개수는 사용 여부에 관계없이 동일합니다 -a.)

-z압축 에 대한 설명은 다음과 같습니다.전송하는 동안. 그게 중요한 부분인데, 배경 지식이 없으면 이해하기 쉽지 않을 수도 있어요.

주로 rsync는 로컬 전송의 경우에도 클라이언트/서버 아키텍처를 사용한다는 사실입니다. 한쪽은 소스 위치에서 데이터를 읽고, 다른 쪽은 대상 위치에 씁니다. 이 둘 사이에는 네트워크 연결이 있을 수도 있고 동일한 호스트에서 실행될 수도 있습니다. 이 아키텍처를 통해 rsync는 로컬로 복사하거나 네트워크를 통해 복사하기 위해 정확히 동일한 프로토콜과 본질적으로 동일한 구현을 사용할 수 있습니다. 변경이 필요한 유일한 부분은 실제로 중간 계층입니다.rsync 인스턴스 간에 데이터를 앞뒤로 전달합니다..

처리량이 네트워크 처리량에 의해 제한되는 경우또는전송된 네트워크 데이터 양에 따라 요금이 부과되는 경우그리고 아마도 만약에소스 및 대상 시스템에 사용 가능한 CPU 시간이 있습니다.그 다음에네트워크를 통해 흐르는 데이터 스트림을 압축하면 네트워크를 통해 흐르는 더 적은 데이터에 사용되는 추가 CPU 시간을 교환하기 때문에 복사 프로세스가 더 빨리 완료되거나 비용이 적게 드는 데 도움이 될 수 있습니다.

그런 다음 대상 rsync 프로세스는 데이터를 추가로 처리하고 결국 스토리지에 쓰기 전에 데이터의 압축을 풉니다.

이것으로부터 다음과 같은 결과가 나온다.rsync를 사용하여 로컬로 파일을 복사할 때 압축을 켜는 것은 본질적으로 CPU 시간을 낭비하는 것입니다.관련된 두 rsync 인스턴스 간의 연결은 관련된 다른 I/O보다 훨씬 빠르며 동일한 CPU가 데이터 스트림의 압축 및 압축 해제를 모두 수행하기 때문입니다. 이러한 경우 캐싱을 잠시 무시하면 데이터가 디스크에서 RAM으로 읽혀지고(느림) RAM 내에서 복사된 후(빠름) 다시 디스크에 기록됩니다(느림). 느린 구성 요소가 지배적이며 RAM 내에서 더 적은 데이터를 복사하는 것은 프로세스 속도를 눈에 띄게 높이는 데 도움이 되지 않습니다(그리고 필요한 추가 처리로 인해 속도가 매우 느려질 수 있으며 그 자체로 RAM 내 복사가 필요할 수 있음) 데이터). 당신이있는 경우정말불행하게도 압축을 활성화하면 필요한 모든 데이터를 메모리에 맞추기 위해 스왑 공간을 사용해야 하는 한계를 초과하게 됩니다.죽이다성능.

요즘 일반 RAM은 땀을 흘리지 않고도 초당 수 기가바이트의 지속적인 전송을 처리할 수 있습니다. 7200rpm 회전 디스크 드라이브는 순차 작업에서 약 120-150MB/s에 도달하는 경향이 있으며 무작위 파일 I/O(rsync에 의해 수행됨)는 사실상 짧은 버스트 이상 동안 순차적이지 않습니다. SSD는 지연 시간과 처리량 측면에서 더 나은 성능을 제공할 수 있지만 여전히규모의 순서RAM보다 느림. 따라서 로컬로 복사할 때는 항상 I/O 바인딩됩니다.전송 중인 데이터 스트림 압축기껏해야아무런 차이가 없습니다왜냐하면 위에서 본 것처럼 동일한 양의 데이터를 읽고 쓰는 것이 프로세스의 느린 부분이기 때문입니다.

관련 정보