像性一样,金钱是大多数人避免公开讨论的话题。然而,即使在Twitter的140个字符的限制中表达自己,我们经常留下经济实部的数字痕迹。

在分析大约1080万次推文的在线社交媒体网络发布,发现精辟的信息,提供足够的信息来揭示用户的收入支架。宾夕法尼亚州自然语言处理的博士后研究人员DanielPreot¸Iuc-Pietro和他的同事依赖于自我确定的专业,将90%的样品分为相应的收入群体。然后,它们使用了一个机器学习模型,可以从数据中学习并基于它们进行预测,以识别每个组唯一的功能。当他们在剩下的10%的受试者上测试了Savvy模型时,它成功地预测了这些用户的财务意义。

正如研究人员在今年秋天的杂志上描述的那样普罗斯一体收入较高的人倾向于讨论业务,政治和非营利性工作。较低括号中的人大多困扰着个人科目,如美容提示和经验。“更高收入的人正在使用Twitter作为传播信息的手段;“较低的人民使用它更多的社交沟通,”Preot¸Iuc-Pietro说。分析还透露,那些赚更多金钱的人的推文是表达恐惧或愤怒的可能性。

在以前的机器学习研究中,Preot¸IUC-Pietro和他的同事能够预测推特用户的性别,年龄和政治倾斜。他们甚至可以检测推文中产后抑郁和创伤后的创伤后应激障碍的迹象。该团队继续发展其模型,但最终“机器学习只是我们可以获得的数据的强大,”PreotȱIuc-Pietro说。“人们应该意识到他们无意中披露了自己。”