本章内容
- 时间序列的定义
- 时间序列分析方法简介
- 时间序列分析软件——R简介(本合集不收纳,就是R的安装之类的)
时间序列:
按照时间顺序把随机事件变化发展的过程记录下来,构成了一个时间序列。它是现实的、真实的一组数据,而不是数理统计中做实验得到的,是反映某一现象的统计指标,因而,时间序列背后是某一现象的变化规律。
时间序列分析:
对时间序列进行观察、研究、找寻它变化发展的规律,预测它将来的走势就是时间序列分析。
第一节 时间序列的定义
一、时间序列的定义
时间序列 (time series) 是按照时间顺序排列的一组随机变量。
随机过程 (stochastic process) 是一组有序的随机变量,可以记为{Xt,t∈T}
随机过程一般是定义在连续的集合上的。
定义在离散集合上的随机过程则通常称为时间序列。时间序列通常表示为:{Xt,t=...,-2,-1,0,1,2,...}
定义在特定时间段上的观测样本可以视为随机过程的一次实现,通常称为样本序列。
随机序列:按时间顺序排列的一组随机变量
观察值序列:
随机序列和观察值序列的关系:观察值序列是随机序列的一个实现,由于时间的不可重复性,时间序列通常仅有一次实现,即只有一个观察值序列。理论上,时间序列可以有无限个观测时间点,但从实际可获得的样本数据看,观察值序列都是有限的。
我们研究的目的是想揭示随机时序的性质。实现的手段都是通过分析观察值序列的性质,由观察值序列的性质来推断随机序列的性质。
**数理统计中的随机样本和时间序列的区别?
尽管随机样本与时间序列都可以表示成相同形式,但二者具有明显不同。
1.随机样本中个变量是同分布的,从而每个样本观察值可以看作来自同一个总体。而时间序列没有这个要求,时间序列每个变量只有一个样本观察值。
2.随机样本中各变量相互独立,从而样本是独立同分布的随机变量序列,而时间序列则研究非独立性的结构。
二、时间序列分析的目的
分析的基本任务(时间序列分析的三个目的):
(1)解释支配观测到的时间序列的随机规律;
(2)通过所了解的这个随机规律,我们可以理解要考虑的动态系统,预报未来的事件;(3)并且通过干预来控制将来事件。
任务1:建模
导入数据
准备数据:清洗、描述,时序图等。
模型建立:参数估算、假设检验、模型选择
适当的模型
任务2:预测
基于模型的方法与数据驱动的方法:平滑方法、回归方法、神经网络
第二节 时间序列分析方法简介
一、描述性时间序列分析
(一)定义:通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律。
(二)特点:操作简单、直观有效。通常是人民进行统计时序分析的第一步。
>如何看待描述性统计规律?两种统计哲学思想:
- 统计相关:关注点是HOW:例如:“六岁穰,六岁旱,十二岁一大饥”
- 真实相关:关注点是WHY:例如:太阳黑子与小麦产量与价格波动
(三)局限性:只能展示非常明显的规律性
二、确定性因素分解方法
(一)定义
因素分解方法认为所有的序列波动都可以归纳为受到如下四大类因素的综合影响:
- 长期趋势(Trend):序列呈现出明显的长期递增或递减的变化趋势
- 循环波动(Circle):序列呈现出从低到高再由高到低的反复循环波动。循环周期可长可短,不一定是固定的。
- 季节性变化(Season):序列呈现出和季节变化相关的稳定周期波动。
- 随机波动(Immediate):除了长期趋势、循环波动和季节变化之外,其他不能用确定性因素解释的序列波动,都属于随机波动。
即任何一个时间序列都可以用这四个因素的某个函数进行拟合。
(二)常用模型
- 加法模型:xt=Tt+Ct+St+It
- 乘法模型:xt=Tt×Ct×St×It
(三)发展一:指数平滑预测方法
- 简单指数平滑(平稳序列预测)
- Holt两参数指数平滑(趋势序列预测)
- HoltWinters三参数指数平滑(周期序列预测)
(四)发展二:以X11模型为核心的各季节调整模型
X11模型是第二次世界大战之后,美国人口普查局委托统计学家进行的基于计算机自动进行的时间序列因素分解方法。
(五)发展三:随机性因素分解方法(也称:频域分析方法/频谱分析/谱分析)
- 原理:假定任何一种无趋势的时间序列都可以分解为若干个不同频率的周期波动,借助傅里叶变换,用正弦、余弦之和来逼近某个函数。
- 特点
(1)非常有用的纵向数据分析方法
(2)使用局限性大:数学门槛高;数据量与计算量非常大;计算结果抽象,不易进行直观解释
(3)主要使用在某些特殊领域,如:地震研究领域、电子信号领域、医学研究领域、海洋学、天文学、军事领域等。
(4)随着电子信息技术的发展,谱分析方法在高频数据场合越来越受到重视和使用。
三、时域分析方法
(一)定义
时域分析方法主要是从序列自相关的角度揭示时间序列的发展规律。
(二)原理
事件的发展通常都具有一定的惯性。这种惯性用统计的语言来描述就是序列值之间存在一定的相关关系,这种相关关系通常具有某种统计规律。
(三)目的
寻找出序列值之间相关关系的统计规律,并拟合出适当的数学模型来描述这种规律,进而利用这个拟合模型来预测序列未来的走势。
(四)特点
理论基础扎实,操作步骤规范,分析结果易于解释。应用广泛,成为现代时间序列的分析主流方法。
(五)分析步骤
- 考察观察值序列的特征
- 根据序列特征选择适当的拟合模型
- 根据序列的观察数据确定模型的口径
- 检验模型,优化模型
- 利用拟合好的模型来推断序列其他的统计性质或预测序列将来的发展
(六)发展过程
*ARIMA模型的实质:主要应用于单变量、同方差场合的线性模型。