Я имел дело с серийными номерами, которые хранятся в виде текста в ячейках, потому что иногда серийные номера имеют буквы. Я столкнулся с чем-то, что я не совсем понимаю ообнаружение дубликатов. Microsoft Excel, по крайней мере, начиная с Excel 2007, предоставляет способ выделения дубликатов ячеек. Моя первая мысль была, что он проверяет, имеют ли ячейки точно такое же значение, но все же я столкнулся с этим примером:
Эти ячейки хранятся как значения типа «Текст», но, очевидно, не имеют одинаковых значений, и все же помечены как дубликаты. Я сталкивался с этим и в Excel 2007, и в Excel 2010.
Вот несколько мыслей, которые у меня возникли по этому поводу:
Возможно, алгоритм проверяет только X первых символов (15 первых символов?) или Y позиций текста?
Поэтому я попробовал разные варианты и в итоге пришел к выводу, что это не так.
Возможно, тип текста был неисправен.
Я перепробовал кучу типов значений, но ничего не вышло.
Возможно, ячейка неправильно распознала данные.
Я уже пробовал добавлять апостроф, но это не сработало.
Может быть, я неправильно понимаю определение дубликата.
Почему эти ячейки были помечены как дубликаты?
решение1
Мне удалось воспроизвести проблему в Excel 2016. Она появляется, когда вы пытаетесь использовать опцию «Повторяющиеся значения» в условном форматировании илинекоторыйформулы (например: COUNTIF(A$1:A$5,A1)>1
).
Проблема исчезает в тот момент, когда вы добавляете букву в последовательность, предполагая, что даже если она отформатирована как текст, в какой-то момент Excel интерпретирует числовую последовательность как число и, поскольку у вас более 15 цифр, выполняет округление для сравнения.
Вот формула условного форматирования, которая работает со строго числовыми последовательностями, независимо от их длины:
=SUMPRODUCT(--(A$1:A$5=A1))>1