推荐些网络数据分析方面旨在找出多个website共有的用户的科研论

b
burgerk
楼主 (未名空间)

比如A网站有用户100人,B网站有用户200人。虽然用户都是匿名的,但是理论上可以通过一些数据统计手段分析出,比如A网站的用户a1, a3, a5 的真实身份很可能就是B网
站的用户b7, b2, b0。

我猜想,数据分析者,或者黑客能有接触到网络流量,时间,IP地址之类的信息,或者甚至更进一步通过纸面上的信息(性别,言论,年龄,以及各种合理的信息)来实现我刚才说的目的,即找出两个网站共有的用户。

我不是很懂网络安全和数据分析,但是觉得以上实验并不会非常难吧?而且估计应该有科研人员做过相关的事且发过文章。所以在此恳请大侠们推荐一些关于这种问题的论文,谢谢啦。

PS:似乎也和SNA (Social Network Analysis) 这个概念有关,但我不知道这具体算哪一种分支。我不是问具体怎么做,只要找到相关topic的例子和可以引用的文献就好 : )