要点
伊隆·马斯克(Elon Musk)上周五表示,他将暂停对推特(Twitter)的收购,以试图弄清楚Twitter是否少报了虚假账户的数量。
马斯克表示,他的团队正在挑选推特官方账户,并随机查看100名粉丝,看看他们是假的、垃圾邮件还是重复的账户。
社交媒体、虚假信息和统计分析方面的专家解释了为什么这种方法行不通。
上周五,特斯拉首席执行官埃隆·马斯克(Elon Musk)表示,他将“暂停”对社交网络Twitter的440亿美元收购,同时研究该平台上虚假和垃圾账户的比例,推特股价因此暴跌。
尽管马斯克后来澄清说,他仍然致力于这笔交易,但他继续抨击虚假账户的问题。他在Twitter上写道,他的团队将自己进行分析,并对Twitter在最近的财务申报文件中报告的数据的准确性表示怀疑。
在今年第一季度的收益报告中,推特公司(Twitter)承认其平台上存在许多“虚假或垃圾账户”,以及合法的可货币化的每日活跃用户(mDAU)。该公司报告称:”我们对一些账户样本进行了内部审查,估计在2022年第一季度,虚假或垃圾账户的平均比例不到本季度mDAU的5%。”
推特公司也承认在过去的3年里夸大了140万到190万的用户数量。该公司写道:“2019年3月,我们推出了一项功能,允许人们将多个单独的账户链接在一起,以便方便地在账户之间切换,”推特公司透露。“当时出现了一个错误,即通过主账户采取的行动导致所有关联账户都被计算为mDAU。”
虽然马斯克的好奇不无道理,但社交媒体、虚假信息和统计分析方面的专家表示,他建议的进一步分析方法存在严重缺陷。
SpaceX和特斯拉首席执行官表示,为了确定推特上有多少垃圾邮件、虚假和重复账户,他将采取以下措施:
”为了找到答案,我的团队将随机抽取100名@twitter粉丝。我邀请其他人重复同样的过程,看看他们会发现什么。”
他在随后的推特中阐明了自己的方法,并补充说:“选择任何有很多粉丝的账户,”以及“忽略前1000个粉丝,然后每10个选择一个。”我愿意接受更好的想法。”
马斯克还表示,他之所以选择100作为研究的样本量,是因为推特使用这个数字来计算其收益报告中的数据,但没有提供证据。
“任何合理的随机抽样过程都可以。如果许多人独立得到类似结果「虚假/垃圾邮件/重复帐户」的百分比,这将说明问题。我选择100作为样本大小,因为推特公司使用这个数字来计算<5%的虚假/垃圾邮件/重复。”
当被问及他对Twitter方法论的描述是否准确时,推特公司拒绝置评。
脸书联合创始人达斯汀·莫斯科维茨(Dustin Moskovitz)通过自己的推特账号对这个问题进行了评论,指出马斯克的方法实际上不是随机的,使用的样本太少,存在巨大的错误空间。
他写道:”我觉得‘不相信推特团队会帮忙提取样本’本身就是个危险信号。”
BotSentinel创始人兼首席执行官克里斯托弗·布齐(Christopher Bouzy)在接受CNBC采访时表示,他的公司的分析表明,Twitter上10%到15%的账户可能是“不真实的”,包括伪造、垃圾邮件发送者、骗子、邪恶的机器人、复制和“单一用途的仇恨账户”,这些账户通常针对和骚扰个人,以及其他故意传播虚假信息的人。
BotSentinel主要通过众筹来支持,它利用机器学习软件和人类评审员团队,独立分析和识别Twitter上的不真实活动。该公司目前监控着250多万个Twitter账户,主要是英语用户。
布齐说:“我认为Twitter并没有实际地对‘虚假和垃圾’账户进行分类。
他还警告说,根据讨论的话题,不真实账户的数量可能会在Twitter的不同角落出现更多或更少。BotSentinel发现,与讨论小猫和折纸等无争议话题的twitter账户相比,更多的是关于政治、加密货币、气候变化和covid的不真实账户。
“我只是无法理解马斯克除了用这个愚蠢的抽样计划来挑衅我们之外,还在做什么。”
----------教授卡尔·T·伯格斯特罗姆(Carl T. Bergstrom)
华盛顿大学(University of Washington)教授卡尔·T·伯格斯特罗姆(Carl T. Bergstrom)与人合写了一本书,帮助人们理解数据,避免被网上的虚假声明所欺骗。他告诉CNBC,对任何一个Twitter账户的100个粉丝进行抽样调查都不应该成为“尽职调查”。
他说,100人的样本规模比社交媒体研究人员研究这类事情的标准小了几个数量级。马斯克使用这种方法将面临的最大问题是选择偏差。
伯格斯托姆在给CNBC的一条信息中写道,“没有理由相信Twitter官方账户的粉丝是该平台账户的代表性样本。也许机器人不太可能跟踪这个账户以避免被发现。也许他们更有可能遵循,以显得合法。谁知道呢?但我只是无法理解,马斯克除了用这个愚蠢的抽样计划来挑衅我们之外,还会做什么。”