統計ソフトRにデータを読み込ませるにはどうしたらいいのか?「開く」が使えるか?
統計ソフトRにデーを読み込むには?
統計ソフトRのとっかかりにくさの一つに、データファイルの読み込み方の難しさがある。「開く」は使えない。
WindowsやMacしか触れたことがない人が増えた。パスとかディレクトリとか言われても、( ゚д゚)ぽか~ん
例えば、Windows10で、Cドライブの直下にdataというフォルダを作って、そこにデータファイルを置くとする。
データの置き場所がC:/data、StantonAGrantz-anova-tukey-dunnett.txtがデータファイルの名前。全部をダブルクオーテーション(")で囲む。
dat <- read.delim("C:/data/StantonAGrantz-anova-tukey-dunnett.txt")
エンターを叩くと、datと名前がついたデータフレームとして読み込まれ、 Rでの統計解析ができるようになる。
> dat <- read.delim("C:/data/StantonAGrantz-anova-tukey-dunnett.txt") > str(dat) 'data.frame': 78 obs. of 2 variables: $ group: Factor w/ 3 levels "cont","jog","run": 1 1 1 1 1 1 1 1 1 1 ... $ times: num 9 9.5 10 10 10 10.5 10.5 10.5 11 11 ...
ちなみに、read.delim()で読み込むのは、タブ区切りテキストデータだ。エクセルからタブ区切りテキスト形式で保存すればいい。
delimはdelimiter(区切り記号)の意味。
変数名がないデータファイルを読み込む場合
変数名がないデータの場合、header=F(Falseの意味)を使って、 変数名がないことを明示する。
StantonAGrantz-anova-tukey-dunnett.txtから変数名を削除し、StantonAGrantz-anova-tukey-dunnett-noname.txtとした。
以下のようにすると、データフレームdatに、V1, V2などという変数名で、格納される。
> dat <- read.delim("C:/data/StantonAGrantz-anova-tukey-dunnett-noname.txt", header=F) > str(dat) 'data.frame': 78 obs. of 2 variables: $ V1: Factor w/ 3 levels "cont","jog","run": 1 1 1 1 1 1 1 1 1 1 ... $ V2: num 9 9.5 10 10 10 10.5 10.5 10.5 11 11 ...
編集後記
データの読み込みが一つのハードルだろう。
統計ソフトRの敷居の高さが如実に表れるところだ。
データを使えるように読み込ませるためには、メニューバーの「開く」から開くという行為ではない方法を使うからだ。
しかし、一回わかれば大したことはない。
要は慣れだ。
編集後記2
Windowsの場合、統計ソフトRが最初に探しに行く場所は「ドキュメント」フォルダに設定されている。
つまり、「ドキュメント」フォルダに、たとえばStantonAGrantz-anova-tukey-dunnett.txtというファイルを置いたとすると、以下のスクリプトで読むこむことができる。
これはディレクトリを気にしなくてよいので気が楽になる。
dat <- read.delim("StantonAGrantz-anova-tukey-dunnett.txt")