こんにちは。

キャスレーコンサルティングSI部の杉です。

前回に引き続き、R言語の記事になります。

丸2年にわたってR言語について書いてきました。
回帰分析、主成分分析、因子分析、ベイズ推定について記述しましたが、
今回は仮説検定について説明します。
(R言語について触れるのは一旦今回で最後かなと思ってます)

いつものように、検定についてサラッと説明して実際にデータを扱って仮説を立てて検定を行ってみたいと思います。

■仮説検定とは

まずは仮説検定について簡単に説明します。そのまま仮説して検定するという二つの手順になります。

【手順1】

あるデータに対して、まず最初に仮説を立てます。仮に二種類の変数からなるデータとします。
※なんでもいいです。例えば開発中の新薬実験データなど。
新薬の効果が旧薬の効果よりも効果が高いという傾向が『多かった』とします。

仮説として『二つの変数は互いに関係がないのでデータの偏りは偶然』という仮説を立てます。
※これを帰無仮説という

【手順2】

もしも、『データの偏りは偶然生じる』確率が無視できるほど低ければこの仮説は棄却されることとなります。
つまり、仮説が間違っていたということになり、新薬と旧薬の効果は同じという仮説は「正しくない」ということになります。
言い換えると、新薬の方が効果が高いという仮説が立てられます。

例によって大雑把すぎる言い方ですが、まとめると
自分の持っているデータをもとに仮説を立てて、その仮説が『正しそう』か、『正しくなさそう』かを判断をするということです。

graph_hypothesis

また、
帰無仮説では『新薬も旧薬も効果は同じ』という仮説を立てるのに対し、対立仮説では『新薬は旧薬よりも効果が高い』という仮説を立てます。
ただし、効果が高いというデータをいくら持ってきても厳密に証明するのが難しいので帰無仮説を用いて効果を判定することが比較的一般なようです。
(つまり帰無仮説を否定することで検定を行うわけです) (続きを読む…)


Rで因子分析

Posted on 08月 27, 2014

こんにちは、SI部の杉です。

Rによる統計解析を紹介させていただいて今回で4回目となります。

一回目二回目で統計解析の基本である回帰分析(単・重)
三回目にデータの要約を行う主成分分析を紹介しました。

データの予想として回帰分析、まとめ・要約として主成分分析を見てきました。

今回は統計解析のもう一つの代表的な解析手法である因子分析について説明します。 (続きを読む…)


Rで主成分分析

Posted on 05月 28, 2014

こんにちは、SI部の杉です。
前回までで単回帰重回帰の分析方法に関して説明させていただきました。
Rを用いて基本的な分析の方法を客観的にご覧いただけたと思います。
今回は、解析方法として回帰分析とは違った切り口で分析を行う手段である、主成分分析について説明したいと思います。
主成分分析とは何かを説明した上で、実際の解析手法をRを用いて客観的にお見せします。

(続きを読む…)



  • Profile
    キャスレーコンサルティングの技術ブログです。
    当社エンジニアが技術面でのTips、技術系イベント等についてご紹介いたします。
  • CSV社長ブログ
  • チーム・キャスレーブログ