Намеренно загрязнять данные в Excel

Намеренно загрязнять данные в Excel

Я пытаюсь найти в сети ответы на этот вопрос. У меня есть набор данных, который я хочу намеренно загрязнить. Я изучаю правила ассоциации и хочу провести несколько тестов. В идеале я хочу случайным образом выбрать x% ячеек и заменить их на «Null» или пустое пространство. Есть ли у кого-нибудь рекомендации, как это можно сделать?

Спасибо

решение1

Просто используйте Python...

Если это «старый» xls-файл, используйтеxlrdиxlwt

Если это «новый» xlsx-файл, используйтеopenpyxl

Пример использования openpyxl

30 Случайных ячеек уничтожено

import openpyxl as xl
import random

wb = xl.open("Book1.xlsx")
ws = wb.worksheets[0]
for n in range(30):
    r = random.randint(1,ws.max_row)      #  Note row indexes start at 1
    c = random.randint(0,ws.max_column-1) #  Note column indexes start at 0
    ws[r][c].value=None
wb.save("Book1b.xlsx")

Связанный контент