Насколько мне известно, алгоритм в инструменте rsync нарежет файл и вычислит для каждого среза хэш. Поэтому я предполагаю, что есть файлы, в которых алгоритм хэширования перестроит файл, фактически не передавая меньше данных. Полагаю, файл, содержащий только нули, будет хорошим кандидатом, верно?
решение1
Алгоритм rsync более сложен. Хэши для фрагментов файла вычисляются для удаленного файла и передаются локальному rsync. Локальный rsync использует эти хэши для поиска соответствующих разделов файла в локальном файле, где бы они ни встречались. Эти соответствующие разделы не передаются; вместо этого отправляются токены, сообщающие удаленному rsync, как воспроизводить эти разделы, и таким образом rsync избегает передачи всего файла.
Итак, оптимальными файлами для rsync являются те, которые содержат большие участки данных, возможно, смещенные вставками и удалениями, например, файлы, созданные в результате типичной человеческой деятельности по редактированию. Это неудивительно, поскольку, как написал автор rsync Эндрю Триджелл в своейКандидатская диссертация, он начал рассматривать алгоритм rsync, с нетерпением ожидая обновления исходных файлов программы по модемному соединению.