移动版

主页 > K彩系列 >

当我谈论算命时,我想谈的是大数据(7)

  欧阳墨有个特别好友,叫贾璐。我尝试查看两人的主页,欧阳墨、贾璐的人人网账号设置为所有人可见。我心下大喜。只要有数据,尽管数量不大,但凭借和其他千万个相似用户的比对,我就能进行挖掘。我迅速地将二人主页地址输入我的App,开始抓取上面能取得的所有数据。不过这需要一点时间,目前除了两人都是学物理的,我没办法获得更多的信息。

  “哎……”我叹了口气,把刚看到的信息迅速大致整理了一下,同时开始拖延时间。“按照射手座的运势,去年全年都属于低潮期,尤其是下半年,应该有一次较大的挫折。”

  小姑娘轻轻“嗯”了一声,“我喜欢的男生有了女朋友。”

  “你认识那个女孩子吗?”

  “我不认识,不过佳怡有个同学跟她是室友,间接了解了一些。”小姑娘声音有些低。

  “方便告诉我吗?”

  小姑娘迟疑了片刻。我看得出她并不希望让别人知道她对那个贾璐这么在意。

  这时候她闺蜜发话了。“她不在北京,在上海上学。他们俩好像是高中同学,不过不同班,两人是去年暑假高中同学聚会上认识的,当时两人都有好感,但是没说破。后来十一的时候苗苗喜欢的男生去上海看那个女生,两人就在一起了。就这样了,别的我同学也没告诉我。”小姑娘感激地看了看她闺蜜。想不到她还挺仗义,我对她的评价从负十上升到了负九点五。依旧差评。

  我点了点头,假装问了问两人的名字。

  “男生叫欧阳墨,水墨的墨。女生叫贾璐。玉字旁一个道路的路。你为啥问这个?”她闺蜜问我。

  我心里咯噔一下。大部分不知道把那叫做王字旁。相比起小姑娘,她闺蜜的文学修养似乎要高出那么一点点。当然,我面上仍是满不在乎:“当然是想推算一下二人近期情感状况。怎么,你们不想听?不想听也没关系,我就是好奇。”

  我假装查起短信,其实是在查看App。太棒了,服务器已经完成了对两人数据的抓取,开始根据二人之间的互动计算一些特征统计量。例如,主页访问频率,上传照片查看概率,平均浏览时间长度,等等。不过,有件事还是要确认一下。

  “余苗,有件事不知道方不方便问。”

  “怎么了?”

  “不知道你对这件事情,是什么样的一个想法。”按照她的性格,默默祝福的概率应该比较大。下决心抢应该不是单纯的她的作风。

  “啊?”小姑娘又是脸一红,“我……我……我也不知道……我就是觉得,他俩在一起挺好的……”

  “呵呵,没关系,不用紧张。” 我会意地笑了笑。看得出她还是很喜欢那个欧阳墨。

  这时手机震动一下,表示计算已经完成。我看了一眼结果,心头大叫一个好字。

  有戏!

  在那一分半钟里,我做了如下事情。首先,我取出了储存于服务器端几十万对情侣的资料,对于每一对情侣,计算出他们之间的互动信息统计数据。然后把这些数据放到一个高维空间里面,每一个维度都是一个统计量。几十万对情侣最终的结果——分手还是在一起——被标记在了代表他们的数据点上。之后——最关键的一步——我用了支持向量机这个方法,将那几十万个数据点用高维空间里的一个超平面分割开来。这个超平面,等于是宣判书:超平面的一面,意味着有情人终成眷属,而另一端,则预示劳燕分飞的结局。接着,我将欧阳墨和贾璐两人的数据同样放到这个空间里面,区别在于,事先我并不知道他们的结局如何。

(责任编辑:admin)
Copyright © 2011 - 2016 版权所有 All Rights Reserved