我有一个表格的数据框:
index Name_A Name_B 0 Adam Ben 1 Chris David 2 Adam Chris 3 Ben Chris
我想获得Name_A和Name_B的邻接矩阵,即:
Adam Ben Chris David Adam 0 1 1 0 Ben 0 0 1 0 Chris 0 0 0 1 David 0 0 0 0
什么是他们最狡猾/可扩展的解决方法?
编辑:另外,我知道如果行Adam,Ben在数据集中,那么在其他一点,Ben,Adam也将在数据集中.
解决方法
您可以在列和索引值的0700和
reindex之间使用
crosstab和
reindex:
df = pd.crosstab(df.Name_A,df.Name_B)
print (df)
Name_B Ben Chris David
Name_A
Adam 1 1 0
Ben 0 1 0
Chris 0 0 1
df = pd.crosstab(df.Name_A,df.Name_B)
idx = df.columns.union(df.index)
df = df.reindex(index = idx,columns=idx,fill_value=0)
print (df)
Adam Ben Chris David
Adam 0 1 1 0
Ben 0 0 1 0
Chris 0 0 0 1
David 0 0 0 0