Microsoft Excel Fuzzy Lookup-Add-on – zu groß eingestellt?

Microsoft Excel Fuzzy Lookup-Add-on – zu groß eingestellt?

Die Daten, die ich vergleiche, sind eine Reihe katalogisierter Elemente (90.000 Elemente) mit einer alten Liste von Elementen, von denen wir dachten, sie würden fehlen (etwa 11.000). Ich muss sehen, ob einige der „fehlenden“ Elemente tatsächlich in der katalogisierten Reihe auftauchen. Ich habe versucht, Duplikate mithilfe der bedingten Formatierung zu finden, aber die Hauptkennungen (Signaturen) sind zu chaotisch. Beispiel:

„Y 4 Ex 7/11:W 19/2/v.1-3“ ist im katalogisierten Satz.

und Y 4.EX 7/11:W 19/2/V.1

J 4.EX 7/11:W 19/2/V.2

Y 4.EX 7/11:W 19/2/V.3 sind Werte im fehlenden Set.

Ich verwende die Fuzzy-Suche, um nahezu Duplikate zu finden.https://www.microsoft.com/en-us/download/details.aspx?id=15011 Gemäß den Anweisungen zur Verwendung des Fuzzy-Lookup-Add-Ins habe ich zwei Tabellen in separaten Registerkarten/Arbeitsblättern erstellt, „cataloged_subsetA“ und „missing_items“. Dann habe ich die Anzahl der Übereinstimmungen auf 1 und den Ähnlichkeitsschwellenwert auf 0,85 gesetzt. Ich komme auf etwas über 4.700 verglichene Zeilen und das Programm reagiert nicht mehr. Ich habe die Speichernutzung überprüft und vermute, dass ich den Speicherschwellenwert erreiche, erhalte aber keine Fehlermeldungen oder ähnliches.

Die Ergebnisse des Fuzzy-Lookup-Vergleichs sollten ein leeres Blatt (oder eine leere Tabelle) mit den Spalten aus „Cataloged_subsetA“ und den Spalten aus „missing_items“ sowie einer neuen Spalte „similarity“ mit einem Wert zwischen 0 und 1 füllen.

Ich habe versucht, die Konfiguration auf „UseApproximateIndexing“ – True zu setzen. Ich habe versucht, eine Tabelle für die Ausgabe zu erstellen; ich habe versucht, ein leeres Arbeitsblatt zu verwenden. Meine Tabellen enthalten nur die Zeilen mit Daten, keine endlosen Spalten. Ich habe in keiner der Tabellen Null- oder leere Zellen. Ich habe auch versucht, die kleinere Tabelle als „linke Tabelle“ und die größere Tabelle als „rechte Tabelle“ zu verwenden und umgekehrt. Ich habe das Fuzzy Matching Add-In deinstalliert und neu installiert.

Ich habe versucht, eine Teilmenge von 30.000 Zeilen (Signaturen AE) zu erstellen, sie mit der Menge von 11.000 verglichen und das gleiche Ergebnis erhalten: keine Reaktion nach etwa 4700 abgeschlossenen Zeilen. Dann habe ich sie noch weiter reduziert, von einer Menge von 12.000 auf eine Menge von 11.000. Dasselbe Ergebnis.

Angesichts der mangelnden Transparenz von Microsoft in Bezug auf den Code dieses Add-Ins und der vielen unbeantworteten Fragen auf anderen Community-Sites vermute ich, dass ich das Add-In aufgeben und eine andere Möglichkeit finden muss, diese Sets zu vergleichen.

Beispiel „cataloged_subsetA“ Beispiel „missing_items“ Beispiele für gewünschte Ergebnisse

verwandte Informationen