
我有一個交易表,其中包含每個客戶 ID 和購買的產品。一位客戶可以購買多種產品,這些產品可以是獨立產品或插件。
現在我正在嘗試建立一個交叉銷售表來查看哪些插件最常見於哪些產品,但無法弄清楚如何計算不同行中匹配的多個條件(clientid、產品和插件)。
日期表看起來像這樣:
clientid product ... ...
10 prod 1 ...
11 prod 2
13 prod 1
10 addon 1
... ...
我想要得到的輸出是:
x addon 1 addon 2 addon 3 ....
prod 1 # # #
prod 2
prod 3
...
因此,使用範例資料表,交叉銷售表將在產品 1 與插件 1 處計數 1(因為 clientid = 10 購買了兩種產品)
我遇到的問題是當相同的客戶端 ID 與兩行或更多行(購買的產品和插件)中的條件匹配時進行計數。資料表有將近300k條目,所以我無法手動完成。
有人知道我該怎麼做嗎?
非常感謝你的幫忙!
答案1
我會分兩步完成此操作。
- 表 A:選擇您的資料
"insert->Pivot Table"
。將「客戶 ID」放入行欄位中,並將「產品」放入「列」和「值」欄位中。
現在您有一個表,其中的行中包含唯一的客戶,以及每個客戶購買的產品和外掛程式。
- 表 B 現在建立第二個表,行中包含產品名稱,列中包含插件名稱。若要填入表,請使用 sumproduct() 將產品 n 的列與外掛 i 的列相乘。
不幸的是,我想不出一個很好的方法來自動選擇表 B 中的公式應該查看表 A 中的哪些列。如果表 A 包含所有產品,後面跟著所有插件,您可以手動選擇表格 B 第一列的每一行中的每個產品,然後拖曳以使其自動填入表 A 中正確的插件列。排序,這樣可能會起作用,具體取決於您的產品和插件的命名方式。您仍然需要手動選擇所有產品列。