当前位置:99696大富豪棋牌 > 99696大富豪棋牌 > 研究论文,(Like)记录进行预测

研究论文,(Like)记录进行预测

文章作者:99696大富豪棋牌 上传时间:2019-10-07

近日,英国剑桥大学心理测验学中心的米哈尔·科辛斯基(Michal Kosinski)和他的两位同事在《美国国家科学院院刊》上发布了一份新的研究论文。该论文证实,人们的许多个人特征——诸如政治倾向、宗教信仰、性别、种族和性倾向——都可以通过他在Facebook上的“赞”(Like)记录进行预测。

荣获2014年奥斯卡最佳原创剧本奖的电影《她》中,描述了这样一个科幻爱情故事:心思细腻而深邃的男主角爱上了他的操作系统。通过分析他的数字记录,他的计算机比其他人(包括他长期的女朋友和最亲密的朋友)能更好地理解他,并对他的想法做出回应。电影中的故事虽发生在2025年,但这是否可能会成为现实呢?

日前有研究表明,滥用药物会改变一个人的行为模式,而其他人可以通过他在社交媒体中的异常表现来判断他是否有此类举动。

  • 集体暴力的微观动力学;
  • 基于经验的基于主体的创新扩散模型:一个批判性综述
  • 等价图的谱分割;
  • 在线贝叶斯推理的扩散网络;
  • 由一个音乐旋律模型引发的1/f噪音的产生;
  • Facebook照片中的文化扩散与趋势;
  • 表征粉丝行为研究社会分解;
  • 谁会分享我的形象?预测在线社交网络中的内容扩散路径;

在研究中,研究人员开发了一个数学模型,可以根据5.8万位美国Facebook用户的“赞”记录来预测他们的各项特征和偏好。之后,他们将模型的预测结果与这些志愿者的Facebook档案信息以及通过在线测试得出的智力、人格和生活满意度等信息进行了比对,发现这个模型可以非常准确地预测参与者的性别、种族出身和性倾向。其性别预测正确率高达93%,在95%的情况下可以正确识别黑人和白人,并在88%的情况下正确识别出了同性恋和异性恋。同时,该模型还有80%以上的几率对民主党人和共和党人、基督教徒和穆斯林进行正确识别。但是,这个模型在预测恋爱状态、药物滥用以及父母离异状况等方面的准确度较低。

99696大富豪棋牌 1在电影《她》中,主角爱上了他的操作系统OS1。图片来源:blastr.com

“物质使用障碍(SUD)是一种因为滥用酒精、药物和烟草等物质而导致个体日常生活中临床性和功能性重大损伤的病症。”罗阿诺克弗吉尼亚康复研究中心的沃伦·比克尔(Warren Bickel)和他的几个同事正在研究这种病症。

集体暴力的微观动力学

地址: http://arxiv.org/abs/1312.6809

作者: Jeroen Bruggeman

摘要: 两个对立组织之间的直接对抗的集体暴力发生在短时间内,其中小型的群体短暂地攻击少数对手,而大多数参与者形成了支持性的观众。这种机制是战斗人员在初步互动过程中相互调和节奏运动,克服了恐惧。以Randall Collins对冲突的观察结果作为风格化事实,这些涌现和亚组的小尺寸可以由同步模型解释。

就此,果壳网对该论文第一作者——米哈尔·科辛斯基博士进行了采访。

最近一项研究显示,计算机模型作出的人格判断的确比熟人(包括朋友、家庭成员、配偶和同事等)的判断更准确。研究论文[1]于1月13日发表在《美国科学院院刊》(PNAS)上。果壳网科学人就此对论文作者,剑桥大学的吴又又以及斯坦福大学的米哈尔·科辛斯基(Michal Kosinski)进行了采访。

99696大富豪棋牌 2

基于经验的基于主体的创新扩散模型:一个批判性综述

地址: http://arxiv.org/abs/1608.08517

作者: Haifeng Zhang, Yevgeniy Vorobeychik

摘要: 创新扩散在社会学,经济学,市场营销,生态学,计算机科学等多个领域得到广泛的研究。关于创新扩散的传统文献由总体行为和趋势模型主导。然而,基于主体的建模(ABM)模式正在越来越受欢迎,因为它捕获代理异构性,并且能够对由社会和地理网络介导的交互进行细粒度建模。虽然大多数ABM在创新传播方面的工作是理论性的,但经验依据的模型越来越重要,特别是在指导政策决策时。我们对基于经验的基于主体的创新扩散模型进行了重要审查,基于主体模型和应用程序的类型开发了本研究的分类。通过连接信息和创新扩散领域的建模方法,我们建议前者广泛使用的最大似然估计框架是用于校准基于主体的创新扩散模型的有前途的范例。尽管已经对ABM方法标准化做了很多进展,但我们确定了模型校准和验证中的四个主要问题,并提出了潜在的解决方案。

果壳网:用户会在Facebook上面点很多个“赞”,包括视频、链接、状态、图片等等,你们怎样分配不同类型的“赞”的权重?

电脑和朋友,谁更懂你?

在社会生活中,判断别人的个性是一项非常重要的技能,因为个性是隐藏在人们行为和情绪背后的一个关键驱动因素。人们常通过个性判断来做出决定和计划,比如和谁交朋友、结成伴侣、信任谁、聘用谁或者选谁作总统等等。一开始的判断越准确,后面做出的决定也越正确。

之前人们认为,准确的个性判断来自人类大脑的社会认知技能。但是近来研究表明,计算机模型可以通过人类行为的数字记录,对个性做出准确判断[2-3]。那么,计算机和人类的判断,到底哪个更准确呢?

研究中共收集了86,220名志愿者的信息。志愿者被要求填写有关大五人格模型的个性调查问卷,进而得出了他们在开放性、尽责性、外向性、宜人性和神经质这5个方面的个性特征。

计算机做出的人格判断则是以70,520名志愿者的脸书点赞数据为基础的,而点赞被认为可以有效地预测人的个性和其它心理特征[2]。比如,给某个品牌或者产品点赞可以代表消费者的偏好和购买行为;音乐相关的点赞可以透露音乐品味;点赞的网站则可以代表网页浏览行为。而来自他人的判断则由志愿者的好友完成,他们需要填写由10个项目组成的个性量表。

通过将参与者的自我评定与计算机及他人的判断进行比较,研究人员首先检测了这两种判断的自评-他评一致性(外部判断和自我评定的一致性)。因为自评-他评一致性受人际关系的持续时间和形式的影响很大,因此研究人员又进一步将“他人”分成了不同的小类别,分别为朋友、配偶、家人、同居者和同事。

99696大富豪棋牌 399696大富豪棋牌 4以计算机为基础的人格判断的准确性(y轴)与点赞数目(x轴)之间的关系。红线显示的是计算机对大五人格判断的平均准确性,他人判断的准确性也在这条红线上标出。因为该样本中个体的平均点赞数为227,由此得到计算机在这个点赞数目下的平均准确性为0.56,这比来自他人判断的平均准确性(0.46)要更高,而与配偶判断的准确性(0.58,这也是最好的他人判断准确性)相近。在研究中,可以看到随着点赞数目的增加,计算机的判断准确性也在增加;当点赞数超过500时,可以看到该判断准确性可达0.66。而且,相比于其它个性特征,以点赞为基础的模型对于开放性的判断有着最高准确性。图片来源:研究论文

结果显示,计算机模型仅需要100个点赞数据,其准确性就可以超过他人的平均值(蓝点);和同事、朋友/同居者、家人和配偶的判断相比,计算机模型分别需要10、70、150和300个点赞,就可以在准确性方面超过他们。

作为一个日渐突出的严重问题,当前大约有十分之一的美国人存在药物滥用的现象。导致美国政府每年要花超过7000多亿去解决因为滥用药物而导致的生产力损失、犯罪以及恢复治疗。因此,如果有一种可以快速确定药物滥用患者的方法,那将是重大的突破。

等价图的谱分割

地址: http://arxiv.org/abs/1610.02668

作者: Paolo Barucca

摘要: 图分割问题出现在各种各样的复杂系统中,从生物学到金融学,但只能用于几个图集合,才能被严格分析和解决。在这里,研究了等价图的集合,即具有块规则结构的随机图,可以获得分析结果。特别地,这个集合的谱密度是针对模块化和二分体结构而精确计算的。分析发现Kesten-McKay关于随机规则图的定律,当块是均匀的时,也适用于模块化和二分体结构。提出并验证了两个相等大小社区的图分割的精确解决方案,并建议在公平图表中没有有效的恢复可检测性转换的推测。最终讨论总结了结果,并概述了与其他图集合中图分割问题的解决方案的相关性,特别是对随机块模型中可检测性阈值和分辨率极限的研究。

米哈尔·科辛斯基 :我们使用的是一个非常简单的机器学习方法,让机器来自动判断哪种“赞”更加重要。在这次研究中,“赞”所扮演的角色与其它的数字记录信息很相似,比如你的浏览日志、搜索记录、购买记录、微博和播放列表。

为什么点赞可用来判断个性?

研究人员表示,点赞可以代表行为、态度和偏好。比如,有着高开放性的志愿者倾向于给萨尔瓦多·达利(Salvador Dali)、冥想或者TED演讲点赞;而具有高外向性的志愿者则倾向于给派对、史努基(Snookie,真人秀明星)或者舞蹈点赞。

谈到计算机判断比人类判断更准确的原因,吴又又解释说:“原因之一是计算机掌握有大量和人格有关的数据信息;另一个原因则在于计算机能通过模型和算法,非常理性地处理这些信息。相反,人类可能会受到认知偏见的影响,而无法以最好的方式处理这些信息。打个比方,我们的结果显示,喜欢英剧《神秘博士》的人是高度内向的;而对普通人来说,即使你知道你的朋友在看《神秘博士》,你可能也无法得出这个结论。“

99696大富豪棋牌 5通过建立模型分析Facebook上的点赞信息,我们能得到关于一个人人格的很有预测。合理的使用这项技术,将会使更多人受益。图片来源:wordpress.com

吴又又告诉科学人:“这次研究中,我们仅仅检测了大五人格特征。我们认为计算机模型完全有可能在判断其他人格特征方面,也有更好的表现。但是,我并不会说计算机模型就一定会更好,因为对某些特征做出正确判断需要更微妙的线索,而这在数字环境中是没有体现的。我们可以拿情商(EQ) 作为例子说明这一点:对人来说,利用面部表情或者肢体语言等信息来判断他人是否在社交中感到尴尬,或者是否对别人产生了共情是相对容易的;但至少从目前来看,这种信息在数字环境中是很难体现的。”

吴又又表示,该研究最实际的应用包括将该算法应用到有着脸书使用者身上——当然是在他们同意的情况下。这样,就可以绘制出使用者的个性特征图谱,而这个图谱可以进一步在其他方面使用,例如

  1. 市场营销,广告商可以因此提高产品的推荐并对他们的市场信息进行量身定制(比如说,蹦极公司可能要针对那些更愿意尝试新体验的人);
  2. 工作推荐,HR专员能根据人格特征选择合适的求职者(如为会计工作选择有条理的人);
  3. 网上约会,一般来说,性格相似的人更容易成对。

针对计算机个性判断是否存在风险,论文作者之一的科辛斯基告诉我们:“个性判断和其他任何技术一样,在道德上是中立的。就像一把刀,我们可以用它来改善生活,也可以用它来伤害我们自己。当然,我们需要小心行事,因为这项技术涉及的范围很大,很多人能从中受益,或受害。因此,我们应该采取一些政策或者技术,来将风险降到最低。在此,有两个原则可以指导我们:透明和受控。首先,我们需要帮助使用者知道,他们有哪些个人数据正被如何使用及可能被如何使用;其次,我们需要让使用者能够控制他们的数据,并决定这些数据可以被用来做什么。做到这两个方面在技术上并不困难,但是落实它们则需要使用者意识到问题本身的存在——也许还需要加上政策制定者的推动。”(编辑:球藻怪)

PS:这个结论对点赞狂魔可能不适用……

Bickel和他的同事们表示他们已经研发出了这样一种技术,它可以通过观察人们在社交网站上的信息(例如Facebook帖子)来发现患者。这项技术甚至对滥用不同物质进而影响人们在社交网站中发布信息的方式提供了新的见解。

在线贝叶斯推理的扩散网络

地址: http://arxiv.org/abs/1611.01086

作者: Shohreh Shaghaghian, Mark Coates

摘要: 了解传播在整个网络中传播的过程在许多现实世界的应用中都是非常重要的。推理方法所需的复杂性取决于我们想要提取的信息类型以及可用于我们的观察次数。我们分析不仅需要检测底层网络结构(父母关系和链接强度)的场景,还必须估计感染时间。我们假设我们对扩散过程的唯一观察是一组时间序列,一个针对网络的每个节点,其在感染发生时呈现出变化点。在制定模型来描述传染性和选择适当的先验分布之后,我们寻求找到最能说明我们观察结果的模型参数集合。在贝叶斯框架中建模问题,我们利用蒙特卡洛马尔科夫链,顺序蒙特卡罗和时间序列分析技术来开发批量和在线推理算法。我们通过合成网络传播的数值模拟和现实世界数据集的分析来评估我们提出的算法的性能。

果壳网:为什么这个模型在预测恋爱状态、药物滥用、幸福感和父母离异状况时的准确度会下降呢?

参考文献:

  1. 99696大富豪棋牌,Wu Youyou, Michal Kosinski, and David Stillwell. Computer-based personality judgments are more accurate than those made by humans.PNAS..
  2. Kosinski M, Stillwell D, Graepel T. Private traits and attributes are predictable from digital records of human behavior.PNAS. 110(15):5802–5805.
  3. Kosinski M, Bachrach Y, Kohli P, Stillwell D, Graepel T. Manifestations of user personality in website choice and behaviour on online social networks. Mach Learn. 95(3):357–380.

99696大富豪棋牌 6

由一个音乐旋律模型引发的1/f噪音的产生

地址: http://arxiv.org/abs/1705.08888

作者: Martin Grant, Niloufar Faghihi

摘要: 我们提出一个模型来产生功率谱噪声,其强度与频率f的函数成比例1 / f。该模型来自对应于绝对音调的破坏对称变量,其中波动发生在尝试恢复该对称性的同时,受音乐旋律创作中的相互作用的影响。

本文由99696大富豪棋牌发布于99696大富豪棋牌,转载请注明出处:研究论文,(Like)记录进行预测

关键词: