下载APP | 繁體版 | 发布广告 |常用工具

深度分析:被推特删除的二十万账号究竟说了什么

京港台:2019-8-24 22:09| 来源:karl marx | 评论( 12 )  | 我来说几句


深度分析:被推特删除的二十万账号究竟说了什么

来源:倍可亲(backchina.com)

  结论:推特近日删除了20万账户,并公布了其中近一千个账户的360万条推文信息。这些账户长期大量使用英文和其他语种发文,近期才改为中文,中文发帖量不到5%。基本可判断,过去被用于发送各类垃圾信息的账户近期被集中用于中文时事评论。

  有多少账号被删?

  国内一些媒体报道,推特于近期删除了936个发表有关香港(专题)政治言论的账号。实际上,2019年8月19日,推特宣布它停用了约20万个账号,其中很多是在推特采取停用账号行动以后新注册的,未发表任何言论,但被推特识别为同一批人控制的账号。在这20万个账号当中,推特公布了其中最活跃的936个账号的账号信息和全部三百多万条推文内容及相关信息。删除账号对推特来说不是什么新鲜事,2018年夏天,它在两个月内删除了七千万个账号(多为区块链营销账号)。

  账号为什么被删?

  推特称,它在中国是被屏蔽的,中国用户通常通过VPN访问,但(1)仍有账户通过未被屏蔽的中国IP地址访问推特。被停用的20万账户就是如此。(2)这些账户构成了一个垃圾信息发送网络。(3)这些账户故意和特意散播有关香港政治动乱的信息,大批账户采取一致行动。

  这些账户到底说了什么?  

  推特提供了936个账号的全部信息。在这里(https://blog.twitter.com/en_us/topics/company/2019/information_operations_directed_at_Hong_Kong.html)下载。共有四个csv文件,两个不到100k的是账户信息;两个700多M的是三百多万条推文。

     

  让我们仔细读一下这些文件。

  两个账户文件包含了九百多个账户的推特ID(注册时分配的一串字符)、用户名(如方舟子的用户名”@fangshimin”)、昵称(如”方舟子”)、说明档、(自己填写的)地点、网址、关注和被关注数量、帐号创建时间和账户语言等。

  

  其中多数用户使用的是正常的中英文用户名和昵称,但也有相当用户直接使用了一串无意义的字符做用户名和昵称。我数了一下,936个账户中,共有303个使用了形如”pAPZcBOlsHhF2sv5fBWt8Pgxe0ayi0Saz0MtLRf2E=“这样的用户名和昵称。

  这些账户建立的时间从08年到19年都有,大部分账户语言为中文,少量为英文,还有一些其他语言的。

  两个巨大的csv文件则分别提供了190万条和170万条推文的信息。

  推文大概长这个样:

  

  

  你能看懂吗?看不懂是正常的。两个csv文件共包含17万条中文推文(115283条+54440条),仅占全部推文的5%。英文54万条(377943条+167573条),占15%。其余推文为西班牙文、印尼文、葡萄牙文、阿拉伯文等几十种语言(亦有很多未进行语言分类的转推或无正文仅有链接的推文,多为英语)。

  因为第二个csv文件中中文推文不多,最近几个月更只有几百条,以下仅用第一个csv文件内容进行赏析。

  

  

  筛选出中文推文,似乎是前两年与某富豪对骂的比较多。

  

  如果按照时间逆序排列,可以看到最新的推文中,有很多关于香港的内容。(两个文件分别包含”香港”字样的近2500条和200余条)

  

  比如最晚的是7月25日,用户“流金岁月(电视剧)”使用网页客户端在六分钟内连续发表了五篇推文。

  同一用户在七分钟内发了四篇很长的推文,下面那几篇短网址也来自同一用户。

  繁体用户发文同样很集中。用户”Resilceale”在两分钟内发了四篇,”lingmoms”在三分钟内发了三篇,都是好几十字的推文。

  

  当然,集中发文也并不是奇怪的操作,决不能成为封锁账号的理由。

  下面来看一下部分用户的发言情况。先随意点几位用户。

  (1) 流金岁月 :食物过敏话题英文帐号–》各种语言转推–》爱港爱国

  这位”流金岁月”共发布了3340条推文。

  

  

  最初的多年里,用户”流金岁月”只用英文发推,有些是跟奥巴马互动(蹭流量?),更多的是跟普通用户(?)打招呼,欢迎互粉。

  

  12分钟内发了10条新闻,这样发新闻持续到2010年11月。链接均指向http://foodallergysupport.drmomsallergyrx.com,看上去是一家有关食物过敏的网站。这一网站现在已经不存在(如果存在过),现在看上去是一家中国公司的网站,但”ICP备0000000号”:

  

  2010年以后,该用户只在2011年和一个字符串ID有过一次互动,然后就跳到了2018年,开始转推很多西班牙语或英语推文,那些推文似乎是随机选自正常用户。

  

  甚至还有泰文的,这位用户在2018年8月转推了一条:

  RT @ICUSUB: มีผีเสื้อหลงบินมาเกาะที่แถวจมูกน้อนไซ

  ผีเสื้อกระพือปีกเดินไปมาระหว่างที่อยู่บนหน้าน้อน

  ส่วนน้อนไม่กล้าทำอะไรผีเสื้อ

  เลยทำได้แค่…

  谷歌翻译了一下,这段话的意思是:”有一些蝴蝶在鼻子线周围徘徊。 飘飘的蝴蝶在脸上的脸部之间移动。 至于我,我不敢做任何事情。蝴蝶只能做……”

  在一大堆转推中间,到了2018年8月,重新开始说话了。这次是对什么金融产品爆雷的用户说的,大概是投资本来就有风险,国家已经预警和打击了。

  

  然后继续大量随机(?)转推普通用户的推文,直到2019年又发了几条中文推文,一条是骂美国贸易战的,一条是谴责退伍军人上言方的,其余是骂某富豪的。今年6月份开始,该用户多次转发youtube中文视频链接,内容是普通的美食健身娱乐等。

  

  6月15日以后,该用户开始发表一些关于香港的评论,多为几分钟内连续多条的;同时仍转发一些视频链接,各种语言的都有,各种内容的都有。

  (2) Resilceale :切尔西粉丝英文账号–》中文垃圾信息推送–》粤语时评

  再看看前面提到的繁体用户Resilceale。

  2011-12年,这位用户的所有推文都是英文的,用twiiterfeed发的,或由facebook分享的,几乎全部是关于切尔西的。偶有一两分钟内连续发文的,都是twiiterfeed和fb联动分享所致。

  

  2012年6月以后,该账户沉寂;直到2019年5月,可能账户换了主人,改用中文,以twitter web app/Twitter for Android发帖,链接均已失效,似乎是休闲性的(垃圾?)内容分享。

  7月1日以后,突然改发政治社会类消息:

  

  每次在三分钟内发三四百字的推文:

  

  (3) The Flecha :22万条葡萄牙语垃圾信息疯狂推手–》中文足球新闻

  再来看看居住在韩国的”The Flecha”(意为”箭”)的推文。这位用户的说明档是”When you see Jair Bolsonaro and his program of genocide and ecocide, you should see him for what he truly is, modern fascism that refuses to hide its true”。意为”当你看到Jair Bolsonaro(2019年上任的巴西总统)和他的种族灭绝和生态灭绝计划时,你应该看到他的真实面目,现代法西斯主义拒绝掩饰其真实性。”

  这是个疯狂转推的账号,从2011年到2015年,该账号转推了22万条推文(可能是此次被封的账户中发文最多的之一),有时一分钟内转发好几条,原文均为葡萄牙语。

  

  其内容基本上是社交网站上的垃圾文章,至少以如此巨大的数量转发时是垃圾文章:

  “当我们喝醉时,我们不应该做的10件事情。请查看(网址)”

  “关于如何忘记那个不想要你的人的7个万无一失的提示,请查看(网址)”

  “每个最好的朋友曾经说过或会说的15个短语,请查看(网址)”

  像”PUTARIA NO BBB FERNANDO E AMANDA SE MASTURBAM AO VIVO VEJA AQUI(网址)”这一条色情(?)信息,这一账户在两天内连续发了98次。

  2016年以后,这一账号停止活动;2018年开始,发了数十条中文的足球新闻,中间还夹了一条笑话:”老板,我最近想请个假。””怎么回事,家里出啥事了。”小李憨厚的笑笑,挠了挠头,没啥事,就是老婆,最近怀孕了。老婆怀孕了请啥啊,不久过年了回去刚好啊。”不是,我半年没回家了……老婆怀孕两个月了。”老板:”需要人吗?一个车间够不够。””谢谢老板”!老板:各位,今晚全部去小李家吃饭。

  2019年又开始发英文消息,批评巴西现任总统Bolsonaro。未见有关香港的消息,大概这一账户是因其登录IP或登录模式等被封的。

  

  (4)曲剑明:18万条印尼文求关注、韩文自动转推、英文报时–》中文政治评论

  再来看一个叫做”曲剑明”(@qujianming1)的账号。其地点是”纽约(专题)布朗克斯”,说明档是”一个因言获罪的流浪者,我坚信光明一定会到来。”这一账号发了18万条推文,基本上是印尼文的,没有内容,只是@一堆人,或者@人之后求关注。有很多IFTTT实现的自动转推,内容多为韩语。(发文时才发现我忘记截图以上两类推文了)比较诡异的是这一账号还长期连续发文,发文内容为当前时间。

  

  在发了18万条令人迷惑的推文后,2019年6月这一账户开始使用中文了。7月,在中文推文中夹杂着发表有关香港局势的评论。

  

  

  再看几个ID。

  (5)乱码用户一:只讨论特定几个细分话题

  用户”uOZs9l90kjpTMudsExF+WcnabiFSlZLMQYX2gcMYBVY=“一共只有四十多条推文,讲的事情都是需要搜索一下才知道的,主要是(1)骂某落马官员的妻子;(2)骂在台湾(专题)的一个大陆学生;(3)讲某爆雷的金融产品的用户太贪心;(4)骂推特上(?)的一个”民主骗子”。

  

  (6)(7)乱码用户二、三:出师未捷身先死

  用户”owVjSnZidM7XhiuiVeeeIZJdzs9hikiZ3+1rdi8x+yA=“转推了几百条推文,还没来得及发文。

  用户”w5jyswR+IhPaTN+1Mj9OeEjzWnYusRu3wtyO1aw0SAE=“也一样。

  (8) HK時政直擊:英语体育新闻–》中文新闻

  因为这样随机抽取用户或推文,很少能找到与香港相关的,于是该为有针对性的搜索。搜索”HK“找到用户”HK時政直擊“(@HKpoliticalnew)发了2200条推文。其中约一半发表在2018年5月到7月,转推英文足球或网球新闻。2018年7月后,开始发布有关港澳台或海外华人(专题)的中文新闻。此后几乎全部是有关香港的新闻或转推。偶尔有自己发言,使用粤语。

  

  

  (9)我最牛:从爱美(军)爱加(军)变爱港爱国

  搜索”香港”,找到一位用户”我最牛”。这位用户共发布了672条推文。”我最牛”可能是一位靴子爱好者,其早期推文均系转推英文内容,几乎每一条推文内都含有”boot”一词,例如”我爱靴子”、”猫在靴子里”、拍靴子的摄影师、”靴型杯子”(boot shots)。但其转推最多的是bootcampaign和boot campaign Canada相关的推文。前者是美国女性支持美军的组织,后者是加拿大(专题)的同类组织。

  

  沉寂了几年以后,2018年,这个账号复出,主要发广告,偶尔骂一骂某位富豪。

  

  2019年7月以后,这个热心美国和加拿大的拥军拥属活动的账号开始爱港爱国,评论香港局势,同时继续骂某富豪。

  

  (10)爱德森:99.9%葡语英语–》0.1%中文新闻

  通过搜索”香港”,找到用户”爱德森”。这位用户发布了12337条推文。其中99.9%为葡萄牙语或英语,发布于2013年以前。2019年5月,该账号开始发布中文信息,似乎是一些随机的新闻;6月末开始发布一些有关香港的新闻。全部中文推文不过160条。

  

  

  再搜索其他账号的内容,得出结果与以上相似。

  结论

  大致可以得出结论。此次所删除的账号中,历史较长的,此前多长期发布其他语种的垃圾信息(或偶有正常信息?),后账号停用,近一两年改用中文;初则转发一些无关政治的链接,但不发言,后期发言则全部是关于政治的信息。普通用户直接注册新账号即可使用,并没有必要对旧账号重新利用,使用这些账号或许是为了形成有足够多的关注者(意味着更高的可信度)的账号群。此外,亦有相当数量的账号是最近建立的,仅有有关政治的发言。这些发言通常集中在几分钟内。

  从发推内容来看,基本可判断其中大量账号为专门用于发送垃圾信息的,只不过最近被集中用于发送政治评论。其中很多随机和非随机转推(如有关boot的转推)应当是由程序完成的;发文则难以判断,几分钟内集中大量发文也可能是由人工完成的。

  当然,推特封禁账号的最重要依据似乎是登录IP地址,也许还有其未公布的登录设备、登录时间、互相关注的关系或其他行为模式等。

推荐:美国打折网(21usDeal.com)    >>

        更多大千杂闻 文章    >>

【郑重声明】倍可亲刊载此文不代表同意其说法或描述,仅为提供更多信息,也不构成任何投资或其他建议。转载需经倍可亲同意并注明出处。本网站有部分文章是由网友自由上传,对于此类文章本站仅提供交流平台,不为其版权负责;部分内容经社区和论坛转载,原作者未知,如果您发现本网站上有侵犯您的知识产权的文章,请及时与我们联络,我们会及时删除或更新作者。

关于本站 | 隐私政策 | 免责条款 | 版权声明 | 联络我们 | 刊登广告 | 转手机版 | APP下载

Copyright © 2001-2013 海外华人中文门户:倍可亲 (http://www.backchina.com) All Rights Reserved.

程序系统基于 Discuz! X3.1 商业版 优化 Discuz! © 2001-2013 Comsenz Inc. 更新:GMT+8, 2024-3-29 04:16

倍可亲服务器位于美国圣何塞、西雅图和达拉斯顶级数据中心,为更好服务全球网友特统一使用京港台时间

返回顶部