定量和定性的结合:格兰诺维特弱关系理论的扩散网络
原创 杜盈霏、杨张博 定量群学
原文信息
Keuchenius, A., P. Törnberg and J. Uitermark, Adoption and adaptation: A computational case study of the spread of Granovetter's weak ties hypothesis. Social Networks, 2021. 66: p. 10-25.
科学是“站在巨人肩膀上”的,科学的发展是一个不断积累和证伪的过程,这也是为什么学者的研究会强调已有文献,以及自己的研究在已有文献中的定位。只有这样,才能较为明确的说明学者对新知识的贡献。而学术论文的规范性和数据的可获得性使得学者们可以通过大规模数据,定量的考察学术新观点的扩散。学术新观点可以视为思想上的创新,关于网络和创新扩散的研究一直受到学者们的关注,埃弗雷特·罗杰斯1962年的经典著作《创新的扩散》详细分析了各类技术创新和学术创新的扩散过程。在市场营销领域,新产品的扩散和采纳也已有大量研究。普遍认为,创新的扩散符合S型,一开始较少的人会使用创新产品或采纳新思想,突破临界值后创新采用会增长的非常迅速,当大部分人使用创新技术后增长曲线又会放缓。这样一个过程与人际网络结构息息相关,已有大量研究证明,合适的网络结构可以导致创新的快速扩散,引发信息级联(information cascade),但特定的网络结构也会将创新限定在少部分人群中,导致信息阻塞。
这篇论文就是研究格兰诺维特的“弱关系”理论在学术界的扩散,1973年格氏发表了这一研究,他发现求职过程中,弱关系是非常重要的渠道,能够为求职者带来非冗余的信息。这一研究成为了社会网络领域最经典的研究之一,启发了众多学者的讨论,包括Burt的结构洞理论、边燕杰的强关系命题等,该研究谷歌学术被引数量已经超过了6万次,其影响力不仅表现在社会学领域,在新闻学、政治学、管理学等不同的学科都有着广泛的应用和发展,展现了社会网络分析强大的跨学科能力。本次推送的文献就是对该文的扩散网络进行了详细梳理。
一、摘要
新知识是如何扩散的?计算研究解释了网络结构是如何促进或阻碍扩散的;定性研究则证实了扩散会导致相关学术转译和转化。这篇研究尝试同时使用两种方法,来研究学术新知识的扩散过程。作者以格兰诺维特1973年发表在American Journal of Sociology上的经典论文《弱关系的力量》(The strength of weak ties)为例,研究其扩散过程。通过社会网络分析、主题模型和仔细阅读相关文献等方法,本文研究了学术网络中不同的社区是如何以不同的方式解释和发展上述格兰诺维特的理论(注意,这里的社区指的是引文网络中的子网络或凝聚子群,社区内部联系较为紧密,社区间联系较为稀疏)。基于以上的探索,研究进一步追溯了这些社区是如何产生、融合、分离,并且处于中心的学者在扩散过程中是如何作为社区领袖或中间人出现的。
二、背景
在20世纪六七十年代,科学的扩散和传播开始成为科学界关注的焦点。大多数的学者使用问卷调查的方法对其进行分析,他们发现:科学知识扩散与其他类型的创新(如专利等)的扩散存在共性;非正式群体如“无形学院”(invisible college)对科学知识的解释说明在科学扩散过程中发挥重要作用,然而这一时期的研究方法还存在着较多的不足。随着研究方法的发展,对科学扩散的研究在2000年后进入了一个爆发性增长的时期。数据和复杂分析技术的发展使得利用海量数据研究科学知识扩散成为可能。随着研究深入,有关于定性和定量方法研究的矛盾随之而来,而本文则将定性和定量方法结合,利用引文网络、主题模型(topic model)和仔细阅读原文的方法研究格兰诺维特《弱关系的力量》一文的扩散过程。本文发现,科学思想的扩散需要复杂的转化过程,在此过程中,学术团体成为中观层面上的学术思想中介,根据他们所从事的不同研究项目,对扩散的科学观点进行不同的解释。在这个过程中,一些学者在转化新知识并将其引入他们的学术圈和跨越学术边界的过程中发挥了重要的作用。
三、有关于科学扩散的观点
20世纪六七十年代的研究是研究知识扩散的基础。研究发现,大多数的学者被组织在相应的学术社区中,这些社区在科学知识的扩散和发展过程中发挥着重要的作用。这些社区一般会围绕一个或几个学术明星组织起来,他们的地位会通过累积优势机制得到进一步的巩固。虽然这些早期分析知识扩散学者经常被认为是通过发展数学模型进行研究,但他们的工作也关注学术网络和学术文化的共同演变问题,同时包含定量和解释性的见解。
然而随着研究的进一步深入,对知识扩散的研究逐渐分化出两种方向:定量研究和定性研究。定量研究运用数据可用性和复杂分析方法来研究学术网络的结构特性;定性研究则强调意义以及解释的重要性。定量研究多使用引文和作者合作关系数据,关注发现支撑新科学和新发现应用发展的关系结构。通过使用大数据进一步验证早期研究的一些结论。而定性研究则认为,科学观点的扩散不仅是对原观点的完全复制,还有改编和扬弃,类似于再发明或再创新。值得注意的是,知识扩散不仅是集体行动的结果,还包含了对理论的改编和转化,这些改编和转化是研究者的解释和学术社区相互作用的结果。
基于上述的观点,本研究认为科学扩散是一个复杂的过程,并使用计算方法和基于引文的扩散网络来研究其微观和宏观层面的变化过程。同时,本文同定性学者一样,认为每条引文都涉及对原理论或命题的解释和发展。由于这一过程是集体解释的结果,因此本文认为研究人员可以自组织成不同的传播社区。
那么,格兰诺维特弱关系假设的扩散模式是什么呢?在扩散过程中是如何重新解释和适用的呢?本文假设扩散网络由结构性的学术社区组成,这些社区以不同的方式推进了相同的科学思想的扩散。除了检验这一一般假设外,本文还进一步探讨了是什么导致了扩散网络中的这些结构模式。因此,本文研究了扩散网络随着时间的演变,并对关键角色在促进传播和发展特定解释中的作用进行了更深入的讨论。
四、数据和方法
该研究通过web of science 收集了引用格兰诺维特(1973)文献的原始数据并构建引用网络和作者之间的合作关系网络。然后使用主题模型来识别这些施引文献中的主要主题,并分析它们与网络中的知识社区之间的关系。最后,通过仔细阅读一些重要的论文,分析三个最大的研究社区对格兰诺维特弱关系假设的应用和再解释的异同。
为了进一步研究这些结构模式是如何出现的,本文对研究社区随着时间的发展以及其中有影响力的学者的作用进行了更深入的探索。为此,研究通过时间社区检测算法,以定位不同时间段(1995–2000–2005–2010–2017)中的研究社区,并探索关键人物在扩散中的作用。
五、传播网络中的社会
首先,本文利用Louvain算法进行社区侦测(community detection)以确定网络确实表现出显著的聚类结构。结果如图1所示。其中颜色代表不同的社区,标注的作者为高影响力的作者,根据入度决定节点的大小。
图2展示了扩散社区的大小分布。从图中可以看出,社区大小是不均匀的,三个最大的社区中的学者占总数的45%;最大的12个社区(规模大于200个社区)的学者占总数的86%。本文的分析集中在这12个社区。
为了衡量这种社区结构是否显著,本文以仅考虑时间的Havel-Hakimi 随机图为基准与上述社区进行对照。图3展示了对比的结果,其中两图的节点规模、颜色等设置均保持一致。从图中可以看出扩散网络更聚集(0.623,p值<0.001)。高入度学者在HH图中高度集中,但在扩散网络中却分布在不同的社区。高入度的学者是那些曾经引用过格兰诺维特(1973)研究的文章、且他们的文章又经常被新接触弱关系理论的学者引用的学者。图4展示了随着时间推移不同社区的变化和学者入度的变化。可以看出,先发优势并不驱动扩散的进程,较早首次引用格兰诺维特文章并不会带来其入度的提高。结合图3和图4不难得出,学术思想的扩散不是简单的一传十、十传百的过程,而是学术关键人物(学术明星)发挥了重要作用。学术明星的地位或者能力助力着新思想的传播,这些学术明星的被引更可能发生在相关研究社区内部。
本文基于主题模型,探究了主题和社区之间的相关性,从而确定不同的社区研究主题的情况。作者发现,不同社区将格兰诺维特弱关系理论运用至不同的主题,存在引用关系的文章更可能拥有相似的主题。基于此,本文将相关内容进行汇总得到下图。这表明科学观念的扩散是由学术界根据不同的学科观点和研究兴趣来进行的。格兰诺维特的文章为一系列研究播下种子,他们随着科学的扩散过程不断的发展和分化,格氏的理论在社会学、商学、传播学、物理学和计算机科学等不同的理论都被引用,并得到了不同的解释和发展。接下来本文以三个规模最大的社区为例,进行了更加细致的探究。
图10是社区1的演进过程。社区1是有关于组织优势的社区。大多数的文献涉及的研究领域是组织管理科学,从格兰诺维特对于“弱关系对于信息传递有更重要的影响”这一论点出发,主要研究组织合作网络对其竞争优势的影响,如结构洞理论。随着研究的深入,研究的主题也进一步发展到了有关于社会资本(social capital)的讨论。此社区涉及到的学术明星为Burt等。
社区2则是关于个体网的研究,主要集中在劳动力市场领域。林南等社会学学者从“弱关系对于找工作有更大影响”这一论述出发,探讨了强弱关系对求职者所带来的不同利益,并提出了“社会资源”(social resource)这一概念。下图是社区3的演进图示,该社区为复杂网络社区,涉及大规模定量研究技术,研究领域主要是物理学、科学学、计算科学等。格兰诺维特曾在文章中提到“使用网络结构将社会的微观和宏观层面联系起来”,以此为基础,社区3运用数据和模型分析各类网络结构,既包括人际网络,也包括物理网络和互联网,将弱关系理论更广泛的应用至相关研究。主要学者包括Watts、Barabasi等。
综合上述三个社区的分析可以看出,不同的学者在各个方向上转化和发展相应的科学观念。例如,弱关系在社区1被视为集体的组织资源、在社区2则被认为是个人的资本,社区3则从更为宏观的网络结构的角度探讨了弱关系的作用。此外,大多数社区都是围绕着一位或几位学术明星发展起来的。
该研究继续通过时间社区检测算法寻找不同时间节点上的社区。图12是社区以及学者随时间的演进图。从图中可得,随着时间的推移一些社区出现整合和分化。为了进一步的讨论相关的整合和分化,本文提出了扩散过程中的离心力和向心力。所谓离心力,就是对概念进行重新的解释,使得原有的整体网络产生碎片化的趋势,最终导致离心。与之对应,向心力就是以创新理论为纽带整合不同的概念使得不同概念汇拢,最终促进网络向心发展。例如产生离心力的代表学者Barabasi和产生向心力的代表作者Burt。结合图13,可以看出Barabasi将弱关系运用至复杂网络,其被引也大多发生在复杂网络领域内部;而Burt 不仅是组织优势的关键学者,也链接了其他社区,在整体学术引文网络中扮演中介角色,他获得的引用多来自其他社区,在整体网居于结构洞位置,即结构洞理论的提出者本身占据了结构洞位置。
综合上述分析可得,学者如何发挥不同的作用中和了扩散过程中的离心力和向心力。这个过程是由关键个人的工作推动的,这些工作以集体引用行为为后盾,他们要么将新思想融入现有观念,要么通过与其他概念和想法联系起来来填补文化和结构漏洞。科学社区是一种文化和结构,由概念和个人之间的紧密联系组成,使研究人员在累积知识的基础上作出新的贡献。
六、结论和讨论
首先,对于格兰诺维特弱关系理论的扩散来说,其扩散路径产生了多个可识别的科学社区,每个社区都对理论进行了发展,形成了自己独有的解释。因为研究背景和方向的不同,虽然理论来源相同,但不同社区的学者都关注不同的议题、使用不同研究方法来回答不同问题。社区中关键人物对这一理论扩散发挥了重要的作用。进一步来说,对于理论的扩散和发展而言,这一过程并非像疾病一般一传十、十传百的传播,而是像变色龙一样根据学者的兴趣和观点进行发展和“伪装”,是一个以我为主,为我所用的过程,即不是我注六经,而是六经注我。
其次,在科学社区的发展过程中,产生了离心力和向心力。就像植物的发芽生长一样,由于许多学者对概念的不同解释,其思想朝着不同的方向发展,这一过程在结构上起着扩散网络的离心运动的作用,使社区分裂和分离,诞生新的子研究方向。同时,网络中的一些学者在不同社区中积极工作,将不同思想和领域联系在一起,从而将不同网络整合为一个整体。
这篇研究很好的展示了定量分析和定性结合的研究方法的力量,完整描绘了学术思想的扩散和发展。采用大跨度、基于海量数据的引文网络分析和主题词模型等方法,这篇研究避免了“只见树木,不见森林”的问题;基于对单个学术社区和学者的具体分析和相关文章的梳理,又强调了“森林”中“树木”成长的细节。值得我们学习。
导读人 | 杜盈霏(西安交通大学社会学2017级本科生,南开大学2021级社会工作研究生);杨张博(西安交通大学人文学院副教授)
原标题:《定量和定性的结合:格兰诺维特弱关系理论的扩散网络》