
Ich habe Mühe, online Antworten auf diese Frage zu finden. Ich habe einen Datensatz, den ich absichtlich verunreinigen möchte. Ich durchforste die Regeln der Vereinigung und möchte einige Tests durchführen. Idealerweise möchte ich x % der Zellen zufällig auswählen und durch „Null“ oder leeren Raum ersetzen. Hat jemand Empfehlungen, wie das gemacht werden könnte?
Danke
Antwort1
Verwenden Sie einfach Python ...
Wenn es sich um eine 'alte' xls-Datei handelt, verwenden SiexlrdUndxlwt
Wenn es sich um eine „neue“ xlsx-Datei handelt, verwenden Sieopenpyxl
Beispiel mit openpyxl
30 zufällige Zellen ausgelöscht
import openpyxl as xl
import random
wb = xl.open("Book1.xlsx")
ws = wb.worksheets[0]
for n in range(30):
r = random.randint(1,ws.max_row) # Note row indexes start at 1
c = random.randint(0,ws.max_column-1) # Note column indexes start at 0
ws[r][c].value=None
wb.save("Book1b.xlsx")