普渡大学研究者使用AI从Wi-Fi数据中预测学生的位置,可用于个性化推荐
2018年11月20日 由 浅浅 发表
59180
0
基于位置的签到能显示关于一个人的很多信息,特别是对于大学生来说。普渡大学的研究人员发表了一篇论文“Exploring Student Check-In Behavior for Improved Point-of-Interest Prediction”,描述了使用Wi-Fi访问日志来识别用户、位置和学术环境中的活动之间的相关性。
使用AI预测位置数据中的位置和朋友可能听起来有点令人担忧,但从好的方面来说,它不是那种通过眼球运动来预测人格特质的技术。
“在兴趣点(POI)任务中,目标是使用用户行为数据来模拟用户在不同位置和时间的活动,然后根据他们当前的背景进行预测(或针对相关场所的建议),”研究人员写道,“在这项工作中,我们首先分析了时空教育登记数据集,目的是使用POI预测来为学生个性化推荐,并了解提高学生保留率和满意度的行为模式。结果还可以更好地了解校园设施的使用方式以及学生之间的联系方式。”
该团队指出,在大多数之前的POI研究中,数据集主要包括来自Foursquare或Yelp等社交网络应用程序的自愿签到。因此,餐馆和娱乐热点的信息丰富,但平常的活动没有多少信息,比如到办公室,离开家,或办一些差事。此外,由于为他们做出贡献的用户经常只访问一次场地,因此他们可能会得出有偏见的结论,并且难以确定一致的模式。
研究人员选择用Wi-Fi解决问题——普渡大学的Wi-Fi。他们在论文中提出的优势是“更好的时间分辨率”,因为每个用户的Wi-Fi访问历史数据量非常大(当他们的设备无线发送或接收数据包时,参与研究的学生签到,导致最终达到376GB的日志文件)。在将这些数据与位置的场地信息配对后,论文的作者能够分析所有新生普渡大学学生在2016-2017学年的运动。
数据集中的每个条目包含四个项目:用户,兴趣点,兴趣点功能(例如,居住或娱乐)和时间跨度(在给定位置花费的时间量)。在处理之后,处理的样本包括少于100个签入和其他步骤的用户,处理后的样本有5.4亿个日志。
它揭示了一些有趣的趋势。例如,在工作日,学生们在下午12点和下午6点前往餐厅,并在晚上8点左右去健身房。可以预见的是,新生学生很快(在前2-3周内)熟悉了校园,然后坚持在固定的熟悉的范围活动。而且偏好因专业而异,计算机科学专业的学生和药剂学学生同时用餐,但后者在上午11点到下午12点之间更多地上课。计算机科学专业学生从早上到下午读书,花更多的时间在学术上,而药剂学学生稍晚会到健身房。
经过额外的处理和索引后,研究人员按照时间顺序对前80个登记记录中的一系列机器学习模型进行了训练,并保留了剩下的20%用于测试。他们提出的AI系统,即为密集的异构图形嵌入(EDHG),能够准确地预测学生访问过的前三的位置,准确率为85%到31%,前十位置的准确度为90%到71%。
接下来,当两个学生同时在同一个地方的时候,论文的作者就会放松对联谊活动的限制。他们从理论上推测它可以表示人际关系。
EDHG在这方面做得很好,它建议为每个用户列出10个潜在的朋友,表现优于基线中最先进的方法。然而,研究人员指出,针对不太活跃的用户(即签到次数较少的用户)的建议不太准确。
之后的工作时将合作数据纳入AI模型,他们希望这将显示社交互动是否会影响学生的登记行为,“这些初步结果表明,将学生轨迹信息用于教育应用中的个性化推荐,以及学生满意度的预测模型是很有希望的。”
论文:arxiv.org/pdf/1811.06912.pdf