統計ER

統計ソフトRの使い方を中心に、統計解析方法の解説をするブログ。ありそうでなかなか見つからないサンプルサイズ計算などニッチな方法について紹介しています。

テキストマイニング

対応分析でテキスト分析 - KH Coderでテキストマイニング

対応分析は、コレスポンデンス分析 correspondence analysisとも言われる分析方法だ。 テキストマイニングでの対応分析では、どのグループでどんな発言が多かったかの傾向を図でつかむ方法。 テキストマイニングソフト KH Coder で実際にやってみたので共有。

KH Coderで階層的クラスター分析をするには?

テキストマイニングソフト KH Coder で、階層的クラスター分析を行うにはどうやったらいいか? 簡単にHow toをご紹介。

自己組織化マップ Self-organizing map を描く - KH Coderでテキストマイニング

自己組織化マップは、ニューラルネットワークアルゴリズムのひとつである。 KH Coderで自己組織化マップを描くにはどうやったらよいか?

共起ネットワーク - KH Coderによるテキストマイニング

個々人のコメント間の共通性をネットワーク図にして示す方法が共起(きょうき)ネットワークだ。 TwitterのTweetを使って、無料で使えるテキストマイニングソフト KH Coder で共起ネットワーク図を描いてみた。

多次元尺度構成法とは? - KH Coderでテキストマイニング

多次元尺度構成法は、多次元尺度法 Multi-Dimensional Scaling, MDS とも言われる。 テキストマイニングソフト KH Coderでは、出現パターンが似ている抽出語がどれなのかが一目でわかる散布図が描かれる。 多次元尺度構成法とはどんな方法か?KH Coderではど…

Ward法 ウォード法とは? - クラスター化の方法

テキストマイニングソフトウェアの KH Coder では、階層的クラスター分析のクラスター化の方法として、ウォード Ward 法、群平均法、最遠隣法の3つから選べる。 Ward法がデフォルト設定で、Ward法がおすすめだ。 Ward法とはどういう方法なのか?

Jaccard係数とは?―文章と文章の距離を測る方法

テキストマイニングツールKH Coderでは、文章と文章の距離をJaccard(ジャッカード)係数で計算するのが標準になっている。 Jaccard係数とは一体何だろうか?

統計ソフトRでテキストマイニングをやろう!

統計ソフトRでテキストマイニングをやろう! もちろん全部無料!

テキストマイニングはKH Coderがおすすめ!

KH Coderは、立命館大学の先生が作成し無料で提供しているソフトウェア。 特に、図示表現が秀逸。 難しいこと抜きでパッときれいな図ができる。

ツイッターからツイートを取り出す方法

ツイッター(Twitter)からツイート(Tweets、つぶやき)を取り出す方法。 自分がつぶやいたことやリツイート(Retweet、RT)したことを解析に使うことができる。