来自英国、德国和南非的大学研究人员在《自然-人类行为》杂志上发表的一篇题为《平台控制的社交媒体api威胁开放科学》的论文中警告说,这对科学知识和研究的未来构成了威胁。本文概述了社交媒体应用程序编程接口(api)变化的含义。
在2023年期间,包括X、TikTok和Reddit在内的许多社交媒体平台对其api进行了重大改变——大幅减少访问或增加访问费用,研究人员表示,这在很多情况下会使研究变得更加困难。
研究人员经常利用api获取社交媒体用户的大规模数据,以便对个人、群体和人口层面的行为模式进行学术研究。这项工作包括预测冲突可能发生的地方和分配灾难援助;了解网络极化或错误信息对投票模式的影响。API访问的变化意味着这类研究将更难进行。
在各种其他变量中,政治立场/从属关系和健康状况不能再使用X数据在个人层面上进行研究。Reddit现在禁止使用Reddit用户生成的数据进行机器学习。这些数据对于训练ML/AI模型来测试它们预测结果的准确性至关重要。
来自巴斯大学管理学院的布里特·戴维森博士说:“这些变化对那些想要研究社交媒体对心理健康、错误信息、政治观点等影响的学者产生了不利影响。它还会无意中影响到基于这些信息源构建服务的应用程序开发者。
“至关重要的是,对人和社会的研究可以访问这些大规模的数据集,因为如果我们弄错了,可能会产生政策影响和深远的后果。随着时间的推移,我们有很多案例表明,缺乏开放科学(共享数据、分析、材料)会影响我们验证和检查科学可信度的能力。我们看到科学受到质疑,这引发了人们对研究成果能否被复制或复制的担忧。”
tiktok最初只允许美国学者访问,但在7月份将其研究API扩展到欧洲。然而,它的条款仍然过于严格,无法与研究兼容,它规定研究人员必须“至少每15天刷新一次研究API数据,并删除[不再可用的]数据”。
同样来自巴斯大学的乔安妮·海因兹博士说:“值得注意的是,对API访问的改变可能是善意的,也是必要的。2018年的剑桥分析丑闻导致社交媒体平台实施严格措施,防止第三方用户在未经同意的情况下获取个人数据。然后,他们允许用户撤销应用程序权限,这让用户对自己的数据有了更多的控制权,以保护用户隐私。
“然而,这一波变化正在推动研究人员放弃项目,或者考虑在官方手段之外收集数据,”她说,“除非得到解决,否则这将意味着我们根本无法研究每天有数百万人使用的这些平台的重要问题。”
从官方API渠道之外获取数据将研究人员置于可能违反条款的法律灰色地带。随着行业进入未知领域,其后果尚不清楚。
戴维森博士说:“欧盟的新法规可能在2024年生效,旨在解决这一问题,并似乎指出了获取数据的新途径,这些途径将更可持续,更实惠,并保护用户。”
“欧盟数字服务法旨在为经过审查的研究人员提供访问'非常大的在线平台'的权限,并对GDPR第40条进行了类似的更新。我们等待听到更多关于审查在实践中的意义以及使用数据的条件。”
该研究由Brittany I. Davidson、Darja Wischerath、Daniel Racek、Douglas A. Parry、Emily Godwin、Joanne Hinds、Dirk van der Linden、Jonathan F. Roscoe、Laura Ayravainen和Alicia G. Cork共同撰写。
电话咨询