一、让总经理王高飞紧张敏感的海外合作伙伴
2014年11月,新浪微博总经理王高飞亲自下令把徽剑我的新浪微博给封了,理由是我在造谣新浪微博。
起因是新浪微博公开了其数据分析合作伙伴,然后我指出其合作伙伴中有问题。
当我发出这条微博后,不到半小时,徽剑、徽通社两个账号都被新浪微博封号。新浪微博总经理王高飞发出一条微博。
那么是不是我徽剑真的造谣了呢?这个effyis的公司究竟是什么呢?先看新闻报道:
2014中国大数据技术大会上一位专家的发言
这可是由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中科院计算所与CSDN共同协办的带有学术性质会议上的专家发言。不会也是造谣吧?
这两条报道可以证实两点:
1、这家叫Effyis的公司在“销售注册用户超过5亿的新浪微博全部数据”,包括“微博发布的数据”等等。
2、这家公司还被日本企业买了。
有人会说,他们是不是只搜集商业信息,那也没事啊?那么我们再来看日本hottolink公司(也就是收购effyis的公司,同时也是新浪微博另一家在上海的数据合作公司的母公司,也在新浪微博数据合作名单里面,大家搜索下)的网站报告。
相信即便不懂日语,也能从里面的汉字看个大概吧?看了以上内容,您非要说这两家日美公司只是纯粹的商业分析,我真的无语了。这个告诉我们,他们完完全全就是通过各种渠道搜集中国的商业、政治、社会等信息。而新浪微博,为了钱,把数据合作接口对其开放了,为其创造了极大的便利。
还有更多的内容,大家可以去搜索下。
二、通过新浪微博的数据分析可以得到什么?
有人会问,新浪微博那些数据都是公开的,有什么秘密可言?
先来说说题外话――笔迹分析,关于这个,徽剑我曾经在我的微博上做了短暂的表演,就是让我的粉丝写字,我来分析他们的性格,前后分析了几十个人,貌似没人说我分析错了。可以这么说,像我一样的笔迹性格分析人员,能够通过一个人写的字,来分析出一个人的性格特征。
那么在数据分析领域,特别是语义行为分析的研究前沿,通过语义行为来分析一个人的特征,就跟一个人的笔迹一样,通过一个人的发言,可以判断出这个人的喜好、性格,进而判断出他的消费能力、政治取向,甚至可以评估出一个人是否容易出轨,一个人是否贪财,是否是一个很好的合作伙伴等。
一个人的发言,就是这个人的笔迹。他发言的内容,他选择的语气,都能反映这个人的情况。徽剑我恰好是一名有点数据分析技术水平的“自封小腕”,也曾做过一些数据分析业务,尤其是在汉语语义的大数据分析上,有较深入的研究。比如我们就曾经通过新浪微博董事长曹国伟的阅读习惯,分析出曹国伟是否喜欢情趣内衣。我们还通过新浪微博互相之间的好友关系、互动,分析出一堆名人之间关系。比如当初王石和田朴君的关系,我们就是从他们互相间的微博互动的细节分析出来的。
早期的情报机构,就会从一些媒体报道,来分析一个国家的政府行为特征。往往一个很小的细节,就能暴露细节后的大量问题。有时候一张照片,一段话,就能曝光太多的信息。
那么回到新浪微博,我们知道,新浪微博可以公开提供以下情况:
1、个人的身份信息(特别是认证个人)
2、个人的好友互动
3、个人的微博内容。
4、支持者(即粉丝、转发者)的情况
那么通过对新浪微博的身份信息,可以判断这个人的发言价值。通过其支持者,可以判断出其发言内容被大众认可的程度,或者说对大众群体的影响程度。那么从他的好友互动,可以看到一些比如拉帮结派等行为。从微博内容可以看出的问题太多了,比如他的收入水平,他的性格,进而他的购物特征。比如微博上很多人喜欢把私人问题放微博上讲,比如卖房买车,比如有没小孩子,甚至到那里去旅游等的,一旦把你几百、几千条微博全部汇总,你这个人大致上的情况也就出来了。
一旦对个人情况了如指掌,而且这个人数还不是几个人,而是5亿人,考虑到重复帐号,至少也是上亿人。情况就很恐怖了。
商业角度:中国各个地方的商业消费习惯,大家的各行业购买潜力、消费特征等,都可以轻易被商家获取。如果数据分析光是了如指掌那还是小事。相信很多用户在微博上因为提到某个字眼,比如减肥,就会发现一堆卖减肥药的跑来评论或者@ 你吧?这就是很简单的数据分析应用,发现关键词,就去发广告。
如果换成政治角度:中国上亿人的政治倾向、政治判断能力、对时局的看法等等,也是同样了如指掌。而且是被美国日本了如指掌。甚至实施上面说的这种类似广告的舆情鼓动、传播呢?平时无所谓,战时呢?紧张时期呢?
三、大数据分析就一定侵犯隐私么?
那我们再来谈谈大数据是不是侵犯隐私这个话题。
市面上的大数据分析有两种情况,一种是数据方自己分析,这种也包括分析方为其服务,所有分析成果都是归数据方自己的。还有一种是分析方从数据方处以各种形式获取数据(包括购买许可、自己采集等),然后分析结果归分析方所有,分析方可以拿这个结果去为第三方服务。
显然,第一种数据分析过程情况不会违反任何隐私,因为所有的数据都是数据方自己平台的事情,至于分析结果如何使用,那是另外一个话题。第二种数据分析过程问题就来了,因为第二种涉及到数据交易,换句话说,涉及到数据方向分析方出售数据的行为。
显然在这里,出现的不是数据分析问题,而是数据提供的内容和方式。
我们都知道,法律明文规定,不能买卖出售个人资料。因此数据方向分析方提供数据,必须基于匿名为前提,因为一旦不是匿名,就涉及到明确的个人隐私,这是司法问题。
在我不知道你是谁,不能清晰确定的你的个体身份的话,我对你公开的分析,即使用于商业用途,我也是不违法的,因为我只是在分析一个网络形象个体。但是一旦知道这个人是什么人,清晰知道这个人是谁时候,是在分析一个真实的个人。而这种分析的机会,又是通过商业合作“买”来的,那么你就构成了完整的买卖个人数据产业链。
新浪微博声称自己的对外微博数据合作只是基于关键词检索的,但是他们却忘了,这个关键字检索可以查询到内容,然后内容又可以追溯到个人。
换句话说,对于一个数据分析方,他可以通过数据接口,大量、高效地获取新浪微博上的内容,然后通过web技术对内容做用户匹配,做精确锁定。这种情况下,你是不是公开个人身份,有什么意义么?
再看看新浪微博注册资料里面有什么?
公开的可以获取的,居然就有邮箱和其他通讯资料。有人会说,新浪微博并不提供用户的身份证等信息给第三方,但是确忘了,新浪微博上有大量的认证用户,对于一个认证用户来说,是可以确定他真实身份的,如果同时又把他邮箱等通讯资料提供出去,
我不相信新浪微博的数据分析客户,只是纯粹的、盲目地分析那些内容,而不会去分析这些内容是谁发的,不会去对比下用户的身份信息。更不相信新浪微博会对数据分析客户屏蔽这些认证用户的资料。
同样,我们来看百度、搜狗等的广告联盟,他们也会根据用户使用搜索时候的习惯,记录下来,并加以分析,那么他们是否也涉嫌侵犯隐私呢?我们仔细看看,百度等广告联盟,记录的是你通过百度等搜索时候,输入的搜索词,或者是网民打开了含有推广链接嵌入的页面内容,来评估你的喜好,进而判断你的其他情况。他们给广告主并不提供你的信息(其实他也没太多信息),更不会去关联搜索跟踪。百度、搜狗这种广告联盟,他们的数据分析就是建立在全匿名基础上,因此他们不会构成对用户隐私的侵犯。
我们再看看淘宝的数据分析,那就更简单了,你什么时候见过淘宝把自己用户的资料提供给第三方么?当然那些卖家泄露买家资料,跟淘宝就没关系了。
大家从上面分析可以看出,大数据分析,是没有问题的,问题在于新浪微博违反了大数据分析的基本道德。开放了真实认证用户身份资料给分析方,这是严重泄露隐私的司法问题。
刑法第二百五十三条之一 国家机关或者金融、电信、交通、教育、医疗等单位的工作人员,违反国家规定,将本单位在履行职责或者提供服务过程中获得的公民个人信息,出售或者非法提供给他人,情节严重的,处三年以下有期徒刑或者拘役,并处或者单处罚金。
窃取或者以其他方法非法获取上述信息,情节严重的,依照前款的规定处罚。
单位犯前两款罪的,对单位判处罚金,并对其直接负责的主管人员和其他直接责任人员,依照各该款的规定处罚。
有人会说,这些认证信息不是公开的吗?没错!
新浪微博自己试图在这里规避责任,提供高速的内容数据接口,表面看是盲目的,新浪微博没有提供具体身份信息,但是无论如何数据关键词检索,最终都要找到具体用户,比如有人投诉,你最终必须找到这个投诉用户是谁吧?
然后新浪微博告诉你,我不在数据接口提供这个用户的资料,但是我告诉你用户的名字……然后数据分析方通过web方式去查找这个用户?这不哄鬼么?
简而言之,你网站上有大量用户信息,而且是开放的,别人通过正当的浏览,看到并记录这些信息,是不违法的,因为别人看到或者说获取这些信息的过程是合法的。但是你网站方去向第三方卖这些用户信息,你网站就是违法的,因为网民并没有授权你去卖他们的信息。
新浪微博,其实很清楚这个信息的敏感性,看前面微博的内容,他不停强调自己不提供用户资料,但是数据分析方,很容易找到用户资料这个他回避了。用的是自以为巧妙,有人骂你,微博告诉你,骂你是什么内容、骂你人的名字,至于骂你这个人的资料,请去自行查看。
四、不得不说,在新浪微博发言的隐患
经过徽剑我的分析,您现在明白了吧。
对于普通网友来说,你的言行举止,被商家拿去做真实用户行为分析,你愿意么?
对于官员来说,你的言行举止,被国外机构拿去做政治动向分析,你愿意么?
对于政府来说,你们把新浪微博捧得越高,在上面搞的什么问政越多,海外机构对中国的社会民情获取就会越方便,你愿意么?
那么有人会问,既然新浪把这些数据开放,作为网民,应该怎么做?徽剑在这里给你点小小建议:
如果您是普通个人,尽量减少在新浪微博上的发言,资料不要填详细,或者改成错误的。尤其是不要在新浪微博谈及个人比如家庭收支、购房买车、孩子成长等消费信息。除非你为了忽悠别人把你当股评家,否则谈及你买了那些股票绝对不是好话题。实在要谈,你可以找一些封闭的圈子之类应用去谈。
有人会说,你徽剑以前怎么也在微博上那么积极发言?答:以前我并没有留意到新浪微博对外的数据合作居然到了这种程度,只是在新浪公开其合作伙伴后,我才反应过来。而且这两个月来没有玩微博,颈椎也好了,工作效率也提升了,算是因祸得福吧。
如果您是政府官员,个人建议,不要在新浪微博上开设认证账号,或者发布能够证实你个人身份的言论。更不要在网上谈及任何政府政策有关的话题,包括争辩。如果你是政府智囊机构的人员,更要学会闭嘴。
特别提醒哪些所谓热衷新媒体的政府领导、部门,新媒体是没错,但是新浪微博被海外监控着呢!你可以去其他微博等地方开账号的。后续我会有文章,专门针对在新浪微博开设政务微博的价值做分析,会用严谨的推理告诉你们,在新浪微博上搞政务微博,就是一场闹剧。有人会说一旦发生舆情事件怎么办?徽剑在后面会在这篇里面,分析新浪微博是如何一手制造舆情事件,一手来搞所谓平息手法。这个话题比较大,这里不多谈。
至于司法机关应该做的事情:
第一,公安机关追究新浪微博这种用用户数据牟利的行为,严格处理有关当事人,并限制以后的这种数据出售行为。新浪微博表面上规避了直接提供用户资料的方式,但是基于新浪微博提供的数据,其合作方很容易查看了解用户的资料。
第二,国家安全机关需要清查新浪这种对外出售数据,购买方的背景,以及已经产生的后果做出应对。想想看,中国有关部门能够接入脸书和推特的数据接口么?
因为徽剑我这里提到了国家安全,而徽剑在网上又是比较知名的“五毛大统领”,因此肯定部分“改革”“自由”网民会有逆反心理,会说,我就一普通人,不怕。那么我告诉你一个商业情景:
新浪微博把你的数据出售后,未来随着数据分析水平的提高,你在微博上的账号会收到更多的@或者评论,甚至一旦跟其他渠道产生关联数据后,比如你在新浪微博上讨论如何买房子,结果你手机就收到房地产公司的销售电话。你一讨论生孩子,你邮箱就就收到卖尿布的广告。你愿意么?你到哪里去旅游,你就收到当地酒店甚至小姐发来的拉客短信,你高兴么?
虽然我徽剑是知名的“五毛大统领”,但是我告诉你,你面前确实是一堆狗屎,你不会也非要逆反地去尝尝吧?
当然你们不动脑子,非要去尝,我也没辙,只能看乐子了。
附言:
关于王高飞的一个笑话,这个笑话是我在知乎上看到的。
按照网友说,这个ID是王高飞的,王高飞用这个ID发了一条微博,炫耀观看毛片,这位名叫网友指出其看的是盗版,结果很快发现,新浪微博就把他的账号给封了。
想想也是醉了,作为一家互联网上市公司的负责人,在自己公司平台上,用小号炫耀观看盗版色情影片,被人指出后,恼羞成怒,把指出的网友给封号。如此…….中国互联网,不,全世界互联网能找出第二个么?
好吧,废话不说了。近期徽剑会陆续写5-10篇长篇文章,曝光新浪微博、还有各种自媒体的内容。至于您要看徽剑的文章,都会首发于徽剑个人公众帐号huijianonline不过我个人比较懒,欢迎大家点题。徽剑个人联系方式里面有。
徽剑版权申明:所有徽剑的文字,在保留版权申明情况下,任何传统、网络媒体(包括自媒体)均可以自由转发,无需支付稿酬,但是不得篡改或者断章取义。当然如果能给个样刊或者发个链接通知下,那便是极好的。如果发现篡改或未保留版权申明,同样徽剑本人也将保留司法处理的权利。
相关文章
「 支持!」
您的打赏将用于网站日常运行与维护。
帮助我们办好网站,宣传红色文化!