大数据的威力 百度迁徙春运项目揭秘 青岛百度公司
第1页:百度迁徙春运项目揭秘
世界上最大的哺乳动物迁徙莫过于中国春运。每一年红红火火的春运即将结束,但是今年却有些不同,百度推出的一项百度迁徙项目引起大家围观。大家对于百度迁徙也存在许多疑问,今天就在这里为大家解刨一下什么是百度迁徙,它又会给我们的生活带来什么样的变化。
在知乎的讨论版上,我们看到了不少网友关于百度迁徙的讨论,其中涉及了不少专有名词,在讨论百度迁徙之前,我们先为大家解释一下这些常常见到的名词都代表什么意思。
LBS
Location Based Service的缩写,基于位置服务。意思就是这项服务内容是基于位置定位的。现在我们智能手机中LBS服务不少,比如打车服务、周边团购信息查询等,都是先确定了用户的位置再提供相应的服务。
GPS
Global Positioning System,美国军方开发的卫星定位系统,由卫星不断发布精准的时间信息,通过终端产品计算确定用户位置。其特点是覆盖面广、精度高(民用3-10米)、民用免费等特点。
粗略定位
粗定位有很多方式,我们比较常见的就是手机通过基站的粗定位,其原理与卫星定位差别不大,但是精度有限。比如在通讯基站较为密集的城市精度较好,在落后城市中基站较少就会出现很大的偏差。
API
Application Programming Interface缩写,意为应用程序编程接口。我们使用的应用程序并非每一项服务都是有开发商一家完成的,有些服务需要调用其他公司的服务。说到百度迁徙则就意味着百度的LBS服务的API。对于中国严格限制地图服务商的政策下,更多的应用开发商都需要选择不同的位置服务商来调用数据。
手机定位
手机定位主要可以通过上面介绍的两种方式,若要进行连贯导航,必须透过GPS连续定位获取。而手机定位之后会在各种软件、服务中留下“痕迹”,百度迁徙则是透过各种方式获取了用户的位置信息,通过大量的数据演算得来。
那么通过上面的一些名词解释,可能大家不难理解百度迁徙是从何而来。当然伴随着手机定位的数据统计,也会让用户怀疑隐私是否安全等问题,那么下面我们就来看看百度迁徙的内容以及伴随生活的定位服务会给我们带来什么样的优势与隐患。
第2页:迁徙数据从何而来?
首先百度迁徙的数据其实并非完全精准的,只是一个粗略定位数据的统计,“直线模式”就可以证明并非实时定位的数据,那么百度只需要调用春运路程的起点与终点数据既可以收集一个用户的信息。原理有了,我们还需要大量的数据作为基础。
看似非常复杂的迁徙图 其实原理并不复杂 需要大量的数据做支撑
那么百度的数据是从何而来呢?去年3月份统计,国内移动通讯用户达到了11.46亿,而基于百度API的应用程序位置信息请求数量达到每日35亿次(2013年8月数据),也就是说平均到每一个用户,我们每天都会请求差不多3次位置数据,这样庞大的数据量为百度迁徙提供了基础。
如果是实时定位 回家的路线应该类似上图 只取8小时两点位置便形成下图
在日常生活中,我们打开微信、微博甚至玩游戏都有可能请求位置数据,如果我们卸载了百度相关的应用之后其实也不能避免位置信息被收集,百度的LBS服务API已被数十万应用采用,真的是“防不胜防”。
透过了如此大量的数据积累之后,百度迁徙中每一天都可以积累相当的位置信息。但是也有网友对于百度迁徙中8小时为单位的查询表示疑问,8小时为一个循环的数据周期可能不够准确。其实这并不重要,百度迁徙本身是大数据时代下的一个新面貌,而且在样本数量足够多的情况下,就足够了。
动车大大缩短了出行时间 数据才选择8小时为单位
而选择8小时为单位,也是很合理的选择,现在全国高铁线路已经很成熟,使得每个人回家使用的时间大大缩短了,目前运行时间最长的高铁动车组大概也就14个小时,大多都能够在8小时内抵达目的地,乘坐飞机就更短了。如果在没有高铁或者飞机的时代,可能百度就会选择24小时或者更长的时间作为迁徙样本。当然百度也可以通过某些条件筛选合适的样本,并非每一个人的8小时都需要被采用。
第3页:大数据是为了服务大众
百度迁徙是大数据时代的一个具象表现,其实我们日常生活中还有各种各样的数据被收集起来为各种公共事业服务,让商家进行决策,但个人数据的采集一方面会给我们带来很多便利,同时也存在一些隐患,我们一一来说说看。
路况信息的采集来源很多 TomTom的路况技术中就采用了手机定位的技术
LBS服务
位置信息对于用户来说,可能主要是用来定位与导航相关服务;而对于商家来说,他们可以通过具体的位置,为我们提供更直接的服务。比如说我们要团购电影票,基于位置信息,我们可以得到距离由近及远的影院排列,消费者更容易查询。如果位置信息准确度不够高,那么也可以根据所在城市来划分,不会让我们看到其它城市的影院信息,这些是毫无价值的。
公共事务&路况信息
而百度迁徙这个项目其实只是百度大数据的一部分,迁徙地图可以让我们看到一些有趣味的可视化大数据信息。而政府、厂商可以透过百度收集的位置信息大数据来做更多的事情。
比如说TomTom旗下知名的路况技术,其中有一部分就是透过手机定位的数据采集通过合理的演算方式,来得到路况信息以及预估未来路况变化情况的。而政府透过类似上班与下班市民集中的位置数据,对于城市规划更具针对性,比如地铁的线路应该如何规划、商业区应该规划在什么地方、公共部门(警局、医院、办事处)安置在什么地方。这些都是透过大数据来做决策的。
WiFi定位技术
而类似Google的WiFi定位技术,也是通过手机我们用户手机的位置数据来填充数据库的,因为每一个路由器的物理地址是固定的位置也不常变动,收集在数据库中,任何接入Google服务器的用户都可以透过WiFi的信号来确定自己的位置(这也是粗略定位的一种方式)。
第4页:个人隐私也有泄密隐患
那么我们说了一些好处,也来谈谈位置信息泄露给我们带来的隐患。任何技术从不同的侧面来说都是双刃剑,我们只是考虑利弊的比例来选择是否采用。位置信息对于个人来说是一项隐私信息,其实在我们日常生活中也会带来一些隐患,希望大家以后能够有所注意。
内置GPS的相机可以直接标记地理位置
首先我们要说明,单独的位置信息被收集起来,其实并不会对我们造成多大的困扰,因为我们家住在哪里或者在哪里工作,能对我们造成的损失还是有限的。而问题就在于搭配在位置信息一起我们泄露了什么。
许多软件都会调用位置信息 如果不需要可以关闭 特别是照相机
以前有一个新闻,科普节目“流言终结者”主持人住家地址因为他用手机拍摄的图片而泄露出去了,对他造成了不下的困扰。现在很多社交软件以及拍照功能中都会请求位置信息,我们可以选择关闭掉,这样就可以避免一些明星的位置被泄露的问题。
对于普通消费者来说,如果我们发个微博,晒一晒家中的宝贝,一些高昂价格的物品加上你的家庭位置,如果泄露出去就很有可能被小偷盯上,而且不法分子很有可能会根据您拍摄的照片以及一些生活信息来进行诈骗活动。还是俗话说的好:“财不可露白”。在日常生活中多加注意,一方面少分享精准的位置信息,另一方面减少炫富的行为,都可以有效防范财产损失。
当然我们也不必太过担心类似百度LBS收集起来的大数据,因为光是在这样庞大的数据中分析出有价值的个人信息是很困难的,而且小偷小摸有这样的能力自然也不会以身犯法,而且精确的大数据可以为我们生活提供不少的便利,对于城市的发展也意义非凡。
朱旭琪
技术公司CEO
Queenwen
查字典站长
thomasluo骆...
在线科技媒体
老凉
CNET执行总编
葛涵涛
移动新观察创办
小马桶盖
个人电脑副总编
360曹曙
360首席工程师
ibuick
苹果MacOSX达人
当乐姚垚
当乐网副总裁
孙锁军
猫扑网CEO