什么是小数据?小数据就是个体化的数据,是我们每个个体的数字化信息。比如我天天都喝一两酒,突然有天喝完酒胃疼,我就想了,这天和之前有何不同?原来,这天喝的酒是个新牌子。这就是我生活中的“小数据”,它不比大数据那样浩瀚繁杂,却对我自己至关重要。
第一个意识到“小数据”重要性的是美国康奈尔大学教授德波哈尔·艾斯汀。艾斯汀的父亲去年去世了,而早在父亲去世之前几个月,这位计算机科学教授就注意到老人在数字社会脉动中的些许不同—他不再发送电子邮件,不去超级市场买菜,到附近散步的距离也越来越短。
然而,这种逐渐衰弱的状态,到医院去检查心电图,却不一定能看出来,不管是测脉搏还是查病历,这个90岁的老人都没有表现出特别明显的异常。可事实上,追踪他每时每刻的个体化数据,他的生活其实已经明显与之前不同。这种日常小数据带来的生命讯息的警示和洞察,启发了这位计算机科学教授—小数据可以看做是一种新的医学证据,它是“your row of their data”(他们数据中属于你的那行数据)。
假设你是一名患者,精确个体化的小数据也许可以帮助你回答:我每次服药应该用怎样的剂量?当然了,药物说明书上会有一个用药指导,但那个数值是基于大量病人海量数据统计分析得来的,它适不适合此时此刻的你呢?于是,你就需要了解关于你自己的“小数据”。
再比如癌症治疗。同一肿瘤细胞的DNA引起不同的病人不同的变化,所以,治疗不能仅是“对症下药”,而要同时“对人下药”。这些个性化的治疗都需要记录和分析个人行为随时间变化的规律,这就是小数据的意义。