統計ER

統計ソフトRの使い方を中心に、統計解析方法の解説をするブログ。ありそうでなかなか見つからないサンプルサイズ計算などニッチな方法について紹介しています。

統計ソフトRにデータを読み込むにはどうしたらいいか?

ブログランキングに参加しています。
まずはぽちぽちっとお願いします。
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 科学ブログ 数学へ

統計ソフトRにデータを読み込ませるにはどうしたらいいのか?「開く」が使えるか?

統計ソフトRにデーを読み込むには?

統計ソフトRのとっかかりにくさの一つに、データファイルの読み込み方の難しさがある。「開く」は使えない。

WindowsMacしか触れたことがない人が増えた。パスとかディレクトリとか言われても、( ゚д゚)ぽか~ん

例えば、Windows10で、Cドライブの直下にdataというフォルダを作って、そこにデータファイルを置くとする。

データの置き場所がC:/data、StantonAGrantz-anova-tukey-dunnett.txtがデータファイルの名前。全部をダブルクオーテーション(")で囲む。

dat <- read.delim("C:/data/StantonAGrantz-anova-tukey-dunnett.txt")

エンターを叩くと、datと名前がついたデータフレームとして読み込まれ、 Rでの統計解析ができるようになる。

> dat <- read.delim("C:/data/StantonAGrantz-anova-tukey-dunnett.txt")
> str(dat)
'data.frame':   78 obs. of  2 variables:
 $ group: Factor w/ 3 levels "cont","jog","run": 1 1 1 1 1 1 1 1 1 1 ...
 $ times: num  9 9.5 10 10 10 10.5 10.5 10.5 11 11 ...

ちなみに、read.delim()で読み込むのは、タブ区切りテキストデータだ。エクセルからタブ区切りテキスト形式で保存すればいい。

delimはdelimiter(区切り記号)の意味。

変数名がないデータファイルを読み込む場合

変数名がないデータの場合、header=F(Falseの意味)を使って、 変数名がないことを明示する。

StantonAGrantz-anova-tukey-dunnett.txtから変数名を削除し、StantonAGrantz-anova-tukey-dunnett-noname.txtとした。

以下のようにすると、データフレームdatに、V1, V2などという変数名で、格納される。

> dat <- read.delim("C:/data/StantonAGrantz-anova-tukey-dunnett-noname.txt", header=F)
> str(dat)
'data.frame':   78 obs. of  2 variables:
 $ V1: Factor w/ 3 levels "cont","jog","run": 1 1 1 1 1 1 1 1 1 1 ...
 $ V2: num  9 9.5 10 10 10 10.5 10.5 10.5 11 11 ...

編集後記

データの読み込みが一つのハードルだろう。

統計ソフトRの敷居の高さが如実に表れるところだ。

データを使えるように読み込ませるためには、メニューバーの「開く」から開くという行為ではない方法を使うからだ。

しかし、一回わかれば大したことはない。

要は慣れだ。

編集後記2

Windowsの場合、統計ソフトRが最初に探しに行く場所は「ドキュメント」フォルダに設定されている。

つまり、「ドキュメント」フォルダに、たとえばStantonAGrantz-anova-tukey-dunnett.txtというファイルを置いたとすると、以下のスクリプトで読むこむことができる。

これはディレクトリを気にしなくてよいので気が楽になる。

dat <- read.delim("StantonAGrantz-anova-tukey-dunnett.txt")