| このページについて |
概要:このページでは、統計言語Rを使う上で有益なプログラムを蓄積します。主にSUGIYAMA Shunsukeが作ったプログラムを公開します。ご使用は自己責任で。
(今後、随時updateしていく予定)
親ページ:このページの親ページはRです。
| 目次 |
xに株価系列を入れると対数階差で近似した収益率を返してくれる。
diff(log(x))
以下でも同じ結果を返す。
#収益率
#yの増加率diff(log(y))で近似可能。
profitrate <- function(x)
{
z <- log(x[-1])-log(x[-length(x)])
z
}
#歪度
skew <- function(x){
z1 <- mean(z(x)^3)
z1
}
#尖度
kurt <- function(x){
z2 <- mean(z(x)^4)
z2
}
#異常値の数(標準偏差の±2 倍、± 3 倍、± 4 倍を超えた標本数))
abnormal.number2 <- function(x){
z <- length(x[x>2*sd(x) | x< -2*sd(x)])
z
}
abnormal.number3 <- function(x){
z <- length(x[x>3*sd(x) | x< -3*sd(x)])
z
}
abnormal.number4 <- function(x){
z <- length(x[x>4*sd(x) | x< -4*sd(x)])
z
}
上記を一般化すれば、以下となる。
#異常値の数(標準偏差の±k 倍を超えた標本数)
abnormal.number <- function(x,k){
z <- length(x[x>k*sd(x) | x< -k*sd(x)])
z
}
#標本分散 sample.variance<-function(a) var(a)*(length(a)-1)/length(a) #以下でも同じ。 #sample2.variance<-function(x) mean(x^2)-(mean(x))^2 #標本共分散 sample.covariance<-function(x,y) mean(x*y)-mean(x)*mean(y)
#相関係数 cor(x,y)という組み込み関数があるが、一応練習も兼ねて作成。
sugi.soukan<-function(x,y){
sample.covariance<-mean(x*y)-mean(x)*mean(y) #標本共分散を定義
variance1<-function(a) var(a)*(length(a)-1)/length(a) #標本分散を定義
#xの標準偏差を求める
x1<-variance1(x)
sdx<-sqrt(x1)
#yの標準偏差を求める
y1<-variance1(y)
sdy<-sqrt(y1)
#最後の相関係数を計算
soukan<-sample.covariance/(sdx*sdy)
soukan
}
######################################################
# 基本統計量
######################################################
#xに1変量株価データ(つまりベクトル)を入れると収益率の基本統計量を返してくれるプログラム。
sugi.basic<-function(x){
x1<-diff(log(x)) #まずは対数階差をとって収益率データに変換
variance1<-function(a) var(a)*(length(a)-1)/length(a) #標本分散を定義
sdx<-sqrt(variance1(x1)) #標本標準偏差を定義
#異常値の数を返すプログラムを定義
abnormal.number <- function(p,k){
z <- length(p[p>k*sd(p) | p< -k*sd(p)])
z
}
T<-length(x1)
R<-mean(x1)
x2<-(x1-R)/sdx #x2を標準化
s<-mean(x2^3) #歪度
k<-mean(x2^4) #尖度
max<-max(x1)
min<-min(x1)
a2<-abnormal.number(x1,2)
a3<-abnormal.number(x1,3)
a4<-abnormal.number(x1,4)
#ここまで計算した基本統計量をまとめて返す。
return(list ("T"=T,"R"=R,"SD"=sdx,"skew"=s,"kurt"=k,"max"=max,"min"=min,"a2"=a2,"a3"=a3,"a4" =a4))
}