华裔能当上美国总统么?我Python了油管评论

作为中国人,你问我资瓷不资瓷华裔当美国总统,我只能说无可奉告。

国人对美籍华裔的复杂感情,以下两组照片很能说明问题了。

500

500

刷油管时我注意到个人,杨安泽(Andrew Yang)。他是美国史上第二位宣布参选总统的华人。我最初注意到他的确是因为他的华裔身份,之后的持续关注倒和他的族裔无关了。

500

他提出的政策很有趣。

大家好,我是杨安泽,我当选总统,会给每个满18岁的美国人每月发1000美金

听起来像个大忽悠对吧?

Why do we do it? We already automated away millions of manufacturing jobs and chances are your job could be next.为什么我要发钱?因为成千上万的工作岗位因为自动化消失,你的工作很可能就是下一个。

他是我所知的第一个正式用AI,自动化解释各类社会问题的政治人物。多听他几句,了解了他发钱的动机和逻辑后,你会觉得他和其他喜欢从道德角度谈问题的候选人相比,简直就是一股唯物主义清流。

其实,我觉得他最有趣的言论出自2019年2月份的一个演讲视频。

500

很明显,演讲受众是亚裔

链接: https://www.youtube.com/watch?v=_Qf2EX0d9AY

I think we’re one generation away from falling into the same camps as the Jews.

我觉得我们(华裔/亚裔)离进集中营只有一代人的时间了。

到2045年的时候,美国会成为少数族裔占多数的国家。如果你看历史的话,人口占多数族群不会自然放弃其主导地位,那种越来越多元而使一个社会越来越包容的愿景并不是历史的常态。

你发现那种因为感到不安而怀有敌意的白人已经越来越多了。而谁会是那个在接下来20年里不断挑战美国的“坏蛋”呢?

中国

这时候,那些失去工作的白人会怎么看美国华人和亚裔?

我觉得我们(华裔/亚裔)离进那种类似犹太人住过的集中营只有一代人的时间了。

我很害怕,我有两个6岁和3岁的小孩,我和他们都是美国公民。

他的想法是有历史依据的。珍珠港事件后,美国把约12万的日裔平民投入集中营,其中约64%是美国公民。

500

同一时期,作为德裔艾森豪威尔被提拔为欧洲战区司令。二战后,艾森豪威尔被认为有意的通过制造饥荒的方式将大批德国战俘虐杀。

纳粹固然可恶,美国的德裔和日裔也不能简单拿来相互对比,但我还是不禁回想起文章开头提到的老贼吕超然,有些现象是具有普遍性的。

不少华人反对他,因为他曾发推支持哈佛按种族而非成绩招收学生。

500

我认为针对哈佛歧视亚裔考生的诉讼是不合理的。学校在录取学生时应该考虑多种因素以达成不同目标。亚裔目前占录取人数比例的23%,一个新高。———— 杨安泽

我想到明朝南北榜事件,以及......嗯......你懂的。只是华裔在美国既不是北方考生也不是南方考生,更不是朱元璋。

我中国人,我看戏。

不过我觉得未来中国对外政策会越来越刚,如果他能以华裔的牺牲缓和美国针对中国人的种族矛盾,对隔着太平洋的我们来说似乎没什么不好。

在2019年7月31日的民主党候选人辩论后,杨引起了更非常多关注。这里再列一些他的语录和观点。

成千上万的工作岗位因为自动化消失,你的工作很可能就是下一个。

你如果去工厂,你不会看到大批的移民,你看到的将是一排排的机器。移民成为了我们经济问题的替罪羔羊。

工作被自动化取代是我们今天所面临的最大挑战,这就是为什么特朗普成了美国总统。意识不到问题的领导人辜负了美国人民。(希婆口号:美国已经很伟大)

我们(候选人们)化了妆,演练好互相攻击的内容,在这个真人秀(候选人辩论)上扮演各自的角色。这就是美国选出了个真人秀明星当总统的原因之一。我们应该聚焦当今社会所面临的真实问题,比如10年内那些最普遍的岗位会被机器取代…

我这不是在搞社会主义,如果大多数人连资本都没有,我们还叫什么资本主义。

全民基本收入UniversalBasicIncome(UBI),钱从哪来?

阿拉斯加州用石油收入给每人每年发1000-2000美元,这个先例政策实施了37年,技术就是这个时代的石油。

每笔因AI和自动化所创造的新财富,我将通过向技术公司收税的方式确保美国人民从中分一杯羹。

很多美国人日子都紧巴巴,所以多数发出去的钱会马上用于消费,回到经济循环,刺激经济和税收的增长。

我会从如监狱系统,对无家可归者的社保以及急诊医疗类的政府福利花费中削减开支,因为UBI会减少这类社会问题。

UBI不是当前已有福利的额外福利,它保证的是每个人总的福利不小于1000美元。比如你领了600美元的食品券,UBI会给你400美元保证你享受总额1000美元的福利,而非给你额外的1000美元。成年人口乘以1000美元这个公式计算得出的政策总花费实际要扣减多数美国人已经取得了各类的福利花费,所需的额外开支会小很多。当然如果有人当前已经享受了超过1000美元的福利的话,此项政策也不会削减他/她的福利。

在看了几个杨的视频后,因油管推荐机制,我的油管主页不断出现杨的其它视频。视频下评论一边倒的叫好。

还有几个视频,支持共和党的右翼FOX新闻台对他做了专访。评论区中那些明显倾向右翼的观众所给出的评论也非常正面。很多人自称上届大选投了特朗普,现在要转而支持民主党的杨。

很难想象能有其他民主党候选人能做到这一点。

就我个人对美国的认知,我一直相信华裔不会有什么政治号召力,我甚至都不觉得他能被注意到。但发生在他身上的事情对我的认知形成了一定的挑战。

正文开始500


油管推荐机制好烦,老给我推杨的视频(“我为啥要点开??”)。能扯出那么多关于杨的信息,全拜这个推荐机制。

虽然我这个人爱比较,但我没足够动力去了解每个候选人的背景及政策主张。那该如何看待这些“硬”入我眼帘的信息?我决定做点功课,用python把油管评论数据量化一下。

查谷歌文档,发现油管是有视频评论数据接口的,然后就是一番折腾…...

我会从那些主题关乎整个选举的视频下提取数据。假设此类视频观众群是整体选民,而非某个候选人的粉丝。

我第一组评论素材来自The Colbert Reprot节目频道的一个片段。

500

此节目是美国喜剧中心频道的一档新闻类喜剧脱口秀,通过喜剧搞笑的方式报道新闻(或者新闻的方式做喜剧),每期都会有各种国内外的政治人物被挖苦讽刺一番。

民主党候选人第二次辩论分两天举行,候选人被分为两组,分别在7月30和31日两天进行对决。7月31日,也是杨参与的第二轮辩论当天,此频道放出8个视频片段。

其中两个片段的主题分别就两天的辩论点名挖苦各组候选人。一个片段主题是挖苦所有候选人。

500

剩下视频主要是访谈之类的。

我选取了聚焦31日辩论内容的节目片段,杨参与的那场。

500

片段时间为7分21秒,当日参与辩论的所有10位候选人都在视频中被提及。

杨被提及三次,出镜率算高的,不过按节目尿性,这只能证明编剧能从他那里找到槽点。

视频并没有针对或侧重报道任何一位候选人,且对所有候选人都是一副负面的嘲笑态度。

那视频下面的评论是什么样的呢?

截止我写此文之时,视频下共产生2646条评论,时间跨度为整个8月份。不少评论是对他人评论的回复评论,会在同一主题上不断纠缠,所以排除。我拿最后剩下的1434条评论作为分析对象。

两个晚上共有20位候选人参与辩论,根据他们的名字,我定义了20组关键词。某条评论中如果出现某个候选人对应的那组关键词,既被认为此条评论提到了这个候选人。比如某评论出现sanders或者bernie,就判断次条评论讨论了桑德斯,出现biden或者joe就判断在讨论拜登,不会100%但基本靠谱。

统计各候选人在评论中出现的情况,可得下图。

各候选人被评论提及次数(总评数:1434)

500

被提及各候选人评论占比

500

很明显了,似乎大家都很喜欢谈论杨安泽,这符合我肉眼看评论的观感。

顺便说一下,排名第二的候选人是个叫Tulsi Gabbard的美女。当过兵,信印度教,有1/4萨摩亚血统,去叙利亚见过阿萨德,并因此受到各种攻击。总之,也不是个传统意义上的总统候选人。

有意思的是,评论中出现了不少重复数据。提取这类数据,发现

500

出现重复的评论全是支持杨的口号,这些评论加起来有53条之多。相比而言,现任总统川普的“Trump2020” 出现了2次,总评论排第二的Gabbard 的“#tulsi2020” 出现了3次。其他候选人没有类似情况。

加上时间维度,会是怎样的效果?

这里只选取4位候选人进行呈现,除杨,Gabbard,前副总统拜登着3位排名前三的候选人,我按个人喜好加上了持左翼政策主张激进的桑德斯,他在中国可能相对有点知名度。杨表示上届选举本想投桑德斯的的,结果桑德斯在民主党党内选举被希拉里干掉了。

首先看数量。

因为随时间推移,视频热度递减。我仅展示前10日评论情况。

前10日4位候选人评论数

500

看来评论递减对数据呈现影响还是不小,不过杨的蓝色展现出明显优势。

再看评论占比比例(全部)

4位候选人评论占比

500

比例,前10日

前10日4位候选人评论占比

500

到月中时,数据已经很少,没有太大意义了。不过还是会有人提到杨,而其他候选人没有这个待遇。


用类似的方法,我们换个视频看看杨的表现。其实做这类评估,最具代表性的视频是候选人辩论视频本身。然而素材不是很理想。

民主党候选人辩论目前共进行了两轮,NBC新闻官方只放出了第一轮辩论的视频。那轮辩论,杨仅发言3分钟,是所有20名参与者中发言时间最短的。杨和另外两名候选人反映当时麦克风有问题,他们只有在被主持人叫到的时候才能讲话,而其他候选人可以中间插话。第二轮辩论,杨发言时长8.7分钟,仍然最短短,但足以阐明观点,因此赢得很多关注。

既然没有最新视频,那还是回到6月的第一轮辩论录播视频,看看评论区是什么状况。

先大致了解下视频本身的情况

500

视频发布于2019年6月27日,共有近400万播放。踩视频的人比点赞的人多。视频时长两个半小时,我并没有看,查维基得知杨发言3分钟,时间占比2%。不过,关心杨的评论远多于2%。截止8月底,排除评论下的子评论,视频下共有评论9493条。提到杨的评论数达到1927条,占比达到20%,数量远多于他候选人。

首轮辩论录播,提及候选人评论数(总数:9493)

500

占比

500

最常见重复出现的评论

500

可明显发现,人们很关注杨。不过从重复出现的评论可看出,杨的麦克风问题可能引起了不少不满。我觉得这种强烈情绪的存在降低了数据说服力,毕竟一般观众懒得发评论,当然他们也可能懒得投票。另外,我们这个视频的评论中有不少川大统领支持者。

加上时间维度

提及次数

500

占比(视频发布后10日)

500

查看完整时间段评论占比情况,发现一直会有很大比例的评论提到杨。

占比(发布后至8月底)

500

检查最后20天评论数发现,视频即便已经发布了快2个月了,还是有一定数量的留言。留言中杨被提到的几率更高了。

占比(8月最后20日)

500

本来我还做了语义分析,但使用的库处理下来准确度较低,结果就不放这里了,也许以后会补充这个维度,不过可能是探讨其他主题了。

语义的话我给个肉眼观感——杨不但被大量评论提到,还普遍获得了正面评价,而大多候选人是富有争议的。想到右翼FOX对杨的好感,我觉得他吸引共和党选民能力会很强。

就已有统计结果,总的来说,从油管评论区看,杨受到了非常多的关注。虽然看油管评论预测美国大选是件很不靠谱的事情,但我相信这些观察还是有些价值。

一段时间后再进行回顾,这些观察也许这能侧面帮助我们认识思考更多问题。

社交媒体,视频媒体对社会的影响力多大?

美国建制派对国家的掌控力有多强?

我们平时使用的新闻渠道可信度多高?

自动化与人工智能对社会会产生什么样的影响?

生产资料集中化,私有化背景下的财富分配问题。

还包括是我个人非常关心的,认真考虑过的,未来共产主义的实现问题。

500


一番操作猛如虎,最后有个打脸。

wo随便找了个民调机构,这是他们的数据。其他机构的数据大致类似。

500

前副总统拜登遥遥领先,杨缩到了很靠后的角落。

这意味着什么,每个人都会有不同理解。

我就练练Python,陪大家看戏。

#见谅,一些图贴过来后发现字太小了,懒得回去改,各位读者老爷就看个颜色吧,见谅,

站务

全部专栏