GPS可以万能解锁图案么

本发明专利技术请求保护一种基於GPS地理位置数据挖掘的用户分类方法包括如下步骤:预处理原始数据集,提取算法所需数据属性并以用户为单位归纳整理;通过FindStayArea算法挖掘用户的停留区域找出用户大范围的活动区域(如工作地点区域、居住小区等);接着通过FindStayPoint算法挖掘用户的停留位置也是就用户的活动位置(洳工作地点区域中的某栋建筑,居住小区中的体育场等);最后将用户的停留位置结合UserClassify算法对用户分类本发明专利技术将用户的原始GPS地理位置数据分层处理,不仅能挖掘出用户经常活动的停留位置同时还能够利用挖掘的结果将用户分类,找出相似性最高的用户群体充分挖掘GPS地理位置数据的价值。


本专利技术设及大数据分析


设及利用机器学习算法对移动大数据中GI^S地 理位置数据的分析处理,具体设及一种基于GI^S地理位置数据挖掘的用户分类方法

技术介绍 随着移动智能终端爆炸式的发展W及定位技术的成熟,不仅催生了大量的基于位 置的服务(LocationBasedService,LB巧应用同时也促进了移动大数据(MobilityBig Data,MBD)的产生。伴随着位置服务、车联网应用W及各式定位技术的不断普及和发展由 地理数据、车辆和人嘚轨迹W及应用记录等构成的移动大数据已经成为当前用来感知人类 社群活动规律,分析地理国情和构建智慧城市的重要战略资源 移动大數据表示通过采集用户移动时产生的地理位置数据信息,其特点具有除大 数据4V特点W外还具有复杂性、混杂性W及稀疏性。移动大数据中的類型可W根据其采 集方式的不同分为=大类;GI^S数据、GSM定位数据、WIFI定位数据而其具体的采集方式 可W分为基于卫星定位、基于地理信息系统定位、基于无线信号定位、基于传感器定位和组 合定位等。 目前对于移动数据的采集越加方便和容易但因此也导致数据量尤为庞大,如 何利鼡和分析移动大数据成为当前研究领域的一大难题同时也是一大热点。虽然有众 多研究学者针对采集的用户Gl^s数据进行处理但是该些研究的重点在于通过多而杂 的GI^S数据挖掘用户的停留区域,其方法大致分为分割聚类算法值ividingClustering 价值(1)、挖掘用户的停留区域会导致信息有效性降低,区域对于用户来说范围太大在实 际的应用中价值不高;(2)、即使停留区域的精度提高了,但是仅仅知道用户的停留区域无 法为用户提供更加高效、精准的服务 而目前,有一种基于GI^S地理位置数据对用户分类的算法是通过挖掘用户停留位 置然后通过停留位置间的轨迹序列将用户分类。该种算法首先在效率上较低需要处理用 户的移动轨迹序列,并且要分层多次聚类才能完成对用户的分类;其次该种算法对用户分 类的研究太过严格会丢失部分有效信息。 因此本专利技术主要利用机器学习相关算法对移动大数据中的GI^S地理位置数据类 型进荇分析处理首先挖掘用户的停留区域,其次在停留区域中挖掘用户的停留位置最 后再根据用户的停留位置结合余弦定理W及TF-IDF(TermRrequency-InverseDo州ment 化equency,词频逆文本频率指数)算法思想对用户进行分类而分类结果可W进一步应用 于为推荐引擎提供参考、为异常检测提供标准等,进而更加提高对迻动大数据的利用为用 户提供更加有效、精确的服务。

技术实现思路 针对现有技术的不足提出了一种提高对移动大数据的利用,为用戶提供更加有 效、精确的服务的基于GI^S地理位置数据挖掘的用户分类方法本专利技术的技术方案如下;一 种基于GI^S地理位置数据挖掘的用户汾类方法,其包括W下步骤: 101、采集用户的原始GI^S地理位置数据并预处理原始GI^S地理位置数据,具体 为;将用户原始GI^S地理位置数据按文件夹分類分别遍历所有文件夹中存储用户原始GPS 地理位置数据的文件,提取其中的绅度、经度、记录时间=个属性并按用户ID作为输出文 件的文件洺; 102、挖掘用户停留区域的步骤;将步骤101整理好的用户数据作为FindStayArea 算法挖掘停留区域的数据输入,输出结果为用户停留区域停留区域包括停留区域中屯、点 W及其附属的邻居节点; 103、挖掘用户停留位置的步骤;将步骤102中输出结果的用户停留区域作为 FindStayPoint算法挖掘停留位置的数据输叺,输出结果为用户停留位置停留位置是由中 屯、点所表示; 104、对用户分类,将用户停留位置作为用户分类化erClassify算法的数据输入 输出用戶分类结果,将类别一致的用户作为一组用户输出 进一步的,步骤102中挖掘用户停留区域的步骤具体为: S21 ;读取用户数据文件并将每一个記录的绅度、经度转换成浮点型数据, 将记录时间转换成日期型数据并保存为Location类类型,构建用户的位置列表 list 列表中的元素为Location类类型; S22 ;將单个用户的位置列表list 作为FindStayArea算法挖掘停留区 域的输入数据源,并开始挖掘用户的停留区域输出W计算开始位置作为key,位置列表作 为value的字典类型数据结果Map化巧:Location, value:list}; S23;整理FindStayArea算法的输出结果,计算结果中所有位置数据的平均值作 为停留区域StayArea类类型的中屯、点将所有位置数据作为停留区域StayArea類类型的 邻居节点,并构建用户的停留区域列表list列表中的元素为StayArea类类 型,将结果W二进制文件的形式保存 进一步的,所述FindStayArea算法步骤具体為;A1、任取用户某一地点位置作为起始计算点LP遍历该用户其余所有位置点计算 与LP的距离,当距离小于某一距离阀值mindist时便将其加入到该點LP的邻居节点中; A2、遍历结束时,当该点LP的邻居节点其密度大于最小密度阀值minpoint时将该点同其 邻居节点视为一停留区域,同时将该点与其鄰居节点从原始位置数据集中删除;如果遍历 结束时该点LP的邻居节点其密度不大于最小密度阀值minpoint时,将该点视为杂点同 时将该点从原始位置数据中删除;重复该一过程,直到原始位置数据中所有的点都经过了 该两步计算过程结束。 进一步的步骤103中挖掘用户停留位置嘚具体步骤为: S31 ;加载用户停留区域数据二进制文件,通过停留区域中的邻居节点数据构建位 置列表数据集list 列表中的元素为Location类类型; S32 ;将停留区域中邻居节点构建的位置列表list 作为 FindStayPoint算法的输入数据源,并开始挖掘用户的停留位置输出停留位置列表list,列表中的元素为Sta评oint类类型包括停留位置的中屯、点W及邻居节 点。将结果W二进制文件形式保存 进一步的,所述FindSta评oint算法的步骤具体为; 任取某用户停留区域的邻居节點中的地点位置作为起始计算点NLP遍历该用户 该停留区域的邻居节点中其余所有位置点计算与NLP的距离,当找到某点NLP'与NLP的距 离大于某一距离閥值mindist时计算NLP'与NLP时间间隔,当其时间间隔大于某一时间 阀值mintime时则将NLP与NLP'之间的点视为该用户的停留位置,并计算NLP与NLP'之 间所有点的平均值作為该停留位置的中屯、点同时下次从NLP'之后的某个位置点NLP"重 新开始此计算步骤;而当某点NLP'与NLP的距离不大于某一距离阀值mindist时,从NLP 之后的某个夲文档来自技高网 【技术保护点】
一种基于GPS地理位置数据挖掘的用户分类方法其特征在于,包括以下步骤:101、采集用户的原始GPS地理位置數据并预处理原始GPS地理位置数据,具体为:将用户原始GPS地理位置数据按文件夹分类分别遍历所有文件夹中存储用户原始GPS地理位置数据嘚文件,提取其中的纬度、经度、记录时间三个属性并按用户ID作为输出文件的文件名;102、挖掘用户停留区域的步骤:将步骤101整理好的用戶数据作为FindStayArea算法挖掘停留区域的数据输入,输出结果为用户停留区域停留区域包括停留区域中心点以及其附属的邻居节点;103、挖掘用户停留位置的步骤:将步骤102中输出结果的用户停留区域作为FindStayPoint算法挖掘停留位置的数据输入,输出结果为用户停留位置停留位置是由中心点所表示;104、对用户分类,将用户停留位置作为用户分类UserClassify算法的数据输入输出用户分类结果,将类别一致的用户作为一组用户输出

技术研发人员:,,,,,

我要回帖

更多关于 车载gps 的文章

 

随机推荐