1. 統計のためのアプリケーションとして、SAS の代わりに R を使う
統計解析というと、大学時代に、SAS を使ったのを思い出す。あの頃、全く勉強してなかった ^^;
今ではフリーの統計ソフトとして、
を使える。いい時代だ。久しぶりに統計のお勉強を。 o(^^)o
R言語 - Wikipedia によると、
R言語の構成には広義の関数型言語の一つであるSchemeの影響があり、リストを基本にした内部処理、遅延評価、静的スコープなどの特徴を持つ。
これは、おもしろそうだ。
2. R のインストール
より、Download R 2.14.0 for Windows をダウンロードして、インストールした。
3. ドキュメントの探し方
R Console において、
help()
と入力すると、マニュアルが表示される。
help(関数名)
により、関数のヘルプを表示。
例えば、平均 のヘルプを見たい場合、
help(mean)
HTML でヘルプを読みたい場合、メニューより
- Help > html help
Packages > base > M > Mean と辿れる。ただし、これはローカルにあるファイルが表示される。ネット上で読むなら、The R Language 。検索するなら、R: Search Engine 。
その他、R – Search を見ると、いつくか検索サイトがある。
4. 平均、分散、標準偏差を求める
R: Arithmetic Mean によると、
Usage
mean(x, ...)Arguments
x
An R object. Currently there are methods for numeric data frames, numeric vectors and dates. A complex vector is allowed fortrim = 0
, only.Examples
x <- c(0:10, 50)xm <- mean(x)
データをベクターに変換
例を見ると、mean に直接データを渡すのではなく、
C( )
に渡してから、計算が行われている。
c( ) とは、R: Combine Values into a Vector or List によると、
This is a generic function which combines its arguments.
The default method combines its arguments to form a vector.
ベクターに変換する関数のようだ。
データ解析用統計言語Rによる統計的プログラミング: 第1回 豊富な統計機能で遊ぶ によると、
Rでの基本的なデータ・オブジェクトはベクターです。ベクターの変種の幾つかによって、(多次元)配列やデータ・フレーム、(異種)リスト、マトリックスなどのような機能が追加されます。
平均
では、平均を求めてみる。
> mean(c(1,2,3,4,5))
[1] 3
分散
分散を求める。
R: Variance-Covariance Matrices (deprecated)
> var(c(1,2,3,4,5))
[1] 2.5
ただし、R-Source によると、
データの不偏分散を求める関数 var() は不偏分散を求める関数であって,標本分散を求める関数ではないことに注意.
「不偏分散」については、以下を参考に。正直未だよくわからず... ^^;
標準偏差
標準偏差を求める。R: Standard Deviation
> sd(c(1,2,3,4,5))
[1] 1.581139
参考
- R のセットアップ+ R 入門 には、contrib のインストールの方法が参考になる。R Commander というのが便利そう。 今度使ってみよう。 CCC
- 不偏分散の (n-1)で割る理由、、、 - 教えて!goo
関連記事
(更新日: 2011.12.11)
2コメント:
R言語、面白いですね。
比較的違和感の無い制御構文と、変数にベクトルや行列があることによる統計演算の容易さ、ユーザーによる追加パッケージ作成機能がいい感じの相乗効果をもたらしていると思います。
私も興味を持っていて、モンテカルロ実験ですが、OLSをかけて、F検定を行う練習を行ってみました。
(;゚д゚) R言語を使え!
R もやりたいのですが、最近いじってませんでした。 ^^;
コメントを投稿