|
|
论文思路:
跟大家汇报一下论文的思路吧
其实数据并不复杂,就是一组二维数据(供应量,价格).数据量也不算太大.每天24小时*365天*3年.
首先要进行数据分类,将人为操纵导致的异常价格与市场供需正常的价格分开.开始时想用SAS的聚类分析,后来来发现行不通,无法分离开来。只好自己想了一个土办法:
1 将这一组数据映射到一个二维坐标上;
2 假设正常的点的周围的点的密度应该比较大---正常的市场供求量与价格的函数是连续的。
3 异常点(即人为操纵点)的周围的点比较稀疏.然后编了一个程序,对每一个点,取长为a ,宽为b的一个长方形区域。计算落在这个区域内的点的数目.然后对所有的点的密度进行排列.根据前面的假设,排在后面的点为异常点。
4 取前n个点,映射到二维坐标上,从图形上来看,可以用线性模型来拟合.于是用SAS的程序(现在都记不得是什么语句了:)来进行假设检验,发现符合线性模型。于是得出正常市场供求价格模型。
5 计算异常点的残差,然后利用SAS对残差进行分布拟合.就计算出:价格波动超过一个定值所对应的概率. |
|