rbootcamp2017 最近の更新履歴 草薙邦広のページ fü[â^é≡ùvû±é╖éΘ

2. データを要約する
入門編

ーワー
代表値,散布度,中心傾向,平均値,中央値,最頻値,
偏差,分散,標準偏差,度数分布,

,正規分布,歪度,尖度,記述統計

代表値
個々



。教育







,誰



反応

重大

意義

場面

,個人

成績



いう情報




個人









価値



,あ
,本質的









基本的

A型







。実

代表性




,集団

, c

要約



確率

,6 分

要素

,代表性,



1人



可能性
1

A



いえ





値や情報




値や情報



性質







,実



く考え

, b

順序


念頭



要素

う。







いい

3



, 6 人



。代表値



, 6人


節約

く考え



いい



,情報量

頻度



,一般性や斉一性

違う

距離

性質

。個々

情報



,複数

, a



いい

集団

複数

,基本的


ュニ



いえ

現実



斉一性



A型





,あ

ープ



,別





,場合

ータ

いう



方略

いう

,一般性

代表



考え



, あ

代表値 average


ほう



共有

ータ分析

有効



いわ

=



学問



一般性

考え

A型





,複数

。関心

いう情報





いう情報

1人

性質

情報自体



対象

一般化 generalization

集合



集団
A型

,ほ





,集団自体

。 カ




特性


関心

知識や知見





。教育評価





程度,ほ

一般性



,個人



大事



ータ分析

いえ

吟味
,誰



いえ

,通常,







代表性

考え


考え

う。
1

総和


考え

ータ

最初









,以

数列

う。
7, 7, 8, 5, 7, 9, 10, 3


,10



集団全体





,8 人

実施

8 個

要素



いう



成績




。代表値



あえ



,全部

う。
7 + 7 + 8 + 5 + 7 + 9 + 10 + 3 = 56

56
総和

いう数



sum

いい









比較

高い


。総和







いえ

,総和

いえ

,実

,集団

特性



いほ

,あ

変数






,あ

学校











特性



,集団

総和

,集団

成績

,ほ



,要素





n,変数

x





総和 =
いう





。Σ

値,


,i 番目
i=1







7,i = 2








,危険

考え







値,i



7,i = 3



いう



,総和

,要素









成績

,人数

総和

3

,最

わし






,1

n番



,最初
い,

いう



比較

多い

さ自体

す。





,n = 8

,総和

すし,そ



い, いう意味

8 人い

ータ



順番


8

,総和







,実



ータ

解釈



,必然的



す。

平均



,少



ータ

い集団



対等









,10



,総和

要素



要約









,値
,10

超え

,平均

mean



,人数

1 人あ



多い集





2

平均 =
,平均

通例的

ュー

,µ

使







。英語

総和

要素









1



mean

要素

いう記号
μ=

Σ

総和

。µ
頭文

数,

,場合

,M

平均

関係





多い




μ=
=



,平均,総和,要素

計算


。平均

,総和

要素数



要素数

総和

平均




,い





μ



,2







平均





,総和



,算術平均や相加平均


,残

資料

平均

要素数

いう



種類
,基本的

簡単



,平均

,平均

算術平均





偏差,平均偏差,分散,標準偏差



平均

,距



要素

考え




,距


値,



し,

ータ

,50

,61

3

いう

ータ

程度

ータ

中心



,中心









,前者
平均

平均

50







近い


厳密

,各要素




総合的



50









,49







,50

ータ

平均

遠い






。中心傾向

。あ

中心傾向
ータ

散布度 dispersion ,

要約




平均

要素

いう

情報

平均



考え



代表値

,中心傾向







,各要素

,51


要素
中心

いい

,39











3

代表値
最初



,各要素



平均値

偏差

deviation

。前者

,全体的

引い



う。

いい

正確

。差

。総和










体的

,各要素

程度



,要素








,各要素

平均



,偏差



ープ



,集団









値 − 平均値

要素




いう



,距

,n 人



。大事

偏差 = あ
う少

,散布度

中心

いい
,偏

,各要素

ほう

j



偏差



1


,例 1

計算








う。



,平均

偏差

,各要素,

,最初

総和

。平均

計算

,総和





例1
77- 70 = 7

77

点数


偏差

65

65- 70 = -5

66

66- 70 = -4

54



54- 70 = -16

88



77+ 65 + 54+ 88 + 66 = 350



5

総和
要素

350÷5 = 70



平均

偏差


,個々










要約

い値


偏差



中心

中心








いえ
いう





,偏差



ータ

い,






88- 70 = 18

,平均

,偏差

総和

,個々



,0





,偏差

総和




集団




4

7 − 5 − 16 + 18 − 4 = 0
,べ






不思議


,練習




。偏差
いう数式





考え


自明



平均



冗長

う。
'

sum of deviations =
=

− μ

− μ(


1

μ=



,nµ

要素

数×平均

総和

,総和

総和




sum of deviations =


=

'

=







,絶対値



,符号

ータ

要約







消しあ



1



=

,正負

=0





(

考え



,総和
,負

− μ





いい

う。

計算
情報




,負






。絶対値




5

平均



,両方



比較



0

総和


)
。例 2



計算例



,偏差



− μ*

。絶対値

絶対値





総和

[x] いう

,値







例2
77

点数


65- 70 = -5

66

66- 70 = -4

総和

要素

50



変数,別

ープ

総和



,要素

1

平均偏差
ータ

いほ



いい,散布度



,絶対値

,平均

±1







,平均



ータ

外国語教育研究
deviation

いほ

近い

,実

総和

,平均

平均的

,平均偏差

ほう



50

いう

平均的



いう

。偏差

いう






英語

頭文

偏差

平均

,平均




考え




総和

,要素





10



,あ





や,標準偏差

standard

,平均






,分散




多い



違う


1

いう





指標

平均

外国語教育研究

,平均偏差

書い

,要素

,偏差



,50 ÷ 5 = 10




偏差

偏差

多い,

いう指標

σ

書い

ータ

結局

7+5+16+18+4=







,例 2

偏差




average deviation

偏差

総和

)-4* = 4

350÷5 = 70

平均

絶対値

偏差

)18* = 18

5





)-16* = 16

88- 70 = 18

77+ 65 + 54+ 88 + 66 = 350



絶対値

)-5* = 5

54- 70 = -16

88



偏差

65
54



)7* = 7

77- 70 = 7
偏差

variance

。分散

V





,SD

,場合

。標準


s



要約

6

平均偏差


,偏差

符号

2 乗


計学



,元

,2 乗

覚え



操作



,絶対値

手順

符号
非常

















,結局



。統
いい

,自乗や平方

2 乗

,偏差

要素





。数式





総和

。平方和

1



偏差

2 乗

要素



平均値

いえ



,解釈







分散

平方

− μ(,




2 乗

単位



。平方偏差



偏差




'

平均値



,平方根

,複数

分散
+=

いう



。2 乗



2 乗

偏差





いい





,数学的

い。

分散
平方和

符号



戻し







。1

,標準偏差

σ= .

1

'

− μ(,

= √+
例 3

計算

手順

2 乗

偏差




場合
標準偏差

一致



標準偏差





い 11.57



134

いい

。平均偏差

要素
平方根





ほう






1, 2, 3

,偏差



う。

一致

2.16



標準偏差,

指標







,正

要約





ほう

散布度

ータ

標準偏差

,標準偏差


1

総和



,基

平均偏差

2

,一般的









平均偏差
タ分析



, い

平均偏差





開平

,11.57

本的

う。

わす重要

平方根



指標








いう問題









, いう

便宜的



省略

,実
あえ









理由



標準偏差



重大

,平均偏差

覚え



い。



7

例3
77

点数


77- 70 = 7

65- 70 = -5

-5×-5 = 25

66

66- 70 = -4

-4× -4 = 16

54- 70 = -16

88



総和

350÷5 = 70

平均

18×18 = 324

49 + 25 + 256

+ 324 + 16 = 670

偏差平方和

5

要素数

-16×-16 = 256

88- 70 = 18

77+ 65 + 54+ 88 + 66 = 350



偏差自乗

65
54



7×7 = 49

偏差

670÷5 = 134

11.57×11.57 ≒

分散

134

標準偏差

中央値
,基本的

,代表性

,順序
考え

考え

う。







, う

ータ

順番

中心



,そ




,順序



,距





,最初


いい



中心傾向



,全要素

, いうや

中央





。例 4



考え

考え

,中央値 median



Med

いう




ン,



ン,

う。

例4
77

点数


65

4

66

3

54



5

88





,距







,値






2

2

順位

ータ

66




考え

偶数

,や

1



ータ
,中心






中央値


中央値



。2


,基本的














ータ

厳密

要約

いい



。詳

応用編



い。

8

,平均
70


66

,中央値


中央値



いう

問題







,値







研究

。実際,









,両方

,平均


必要

, い

場合

多い


中央値

,対象

順序尺度

,加減



考え



順序尺度
代表値

ータ

順序尺度

操作



い。平均
代表値









平均値
いい







多い

,順

間隔尺度以









,中央値

す。
,対象

え代表値



総和



す。

,中央値





ータ

,中央

間隔尺度以

義尺度









最頻値
義尺度

,数値

操作



数え

。あ

,集計 いい









,あ









要素




数え



男,男,男,男,女,女

いう

ータ

今度

,男 4,女 2



,好

映画

要素














い。




う集計

大学生 100 人



。例 5



いう


頻度

,以




頻度 frequency



集計







いい

。27,21… い



例5
SF



27

21




,最
,中心傾向



集中







多い要素

ータ

要約

現象

数,

SF








高い頻度





,一番多



最頻値 mode



場合,100 人中,27 人


通,






19

,27

意味,中心

。最頻値





12



応用


社会派

,あ

いう

,連続的現象


多い

代表値



ョン
21

要素



い,




数えあ

散的現象




応用

,無限
,現実的

間隔

9



3

,名義尺度

中心傾向
一般的



代表値

,こ

す。

average


現象

,表

適用


書い

枠組

すべ

,average

中心傾向

す。実 ,平均



代表値

average,中央




3

。○

,基本的





平均,中央値,最頻

,英語

平均,中央値,最頻値





,最頻値




average,最頻値



代表値

。注意

示し


応用

示す代表値

,中心傾向

3



対し



。△



,今





代表値

,枠組

,適用

適用

尺度,

,☓

複雑

事情

基本的







い。

名義尺度

順序尺度

間隔尺度

比尺度

離散

連続

平均

距離













中央値

順序3













最頻値

頻度













正規分布
,話


,前

ほう



, ータ分析
考え







非常





,頻度









期待値

要素

数え


要約

いう

ターン

く,標準偏差






。階





順番

要素











。階



10

。階



いう






中心傾向

数値

,階



。詳

数え

あえ









境界


ータ









ータ

本章







,通常,平方根選択や,






,階級数

,実



要素

必要不可







要素
い。個々

ータ

考え



,個々





,各値

,中央値 距

ータ



いう

いう

,度数分布



使い



ターン,特

考え





標準偏差





frequency distribution



連続的現象

3

ータ




度数分布



平均偏差

,平均偏差

役割

。分布




的現象



う。

,今



代表値



重要

,度数分布
度数

,散布度

10 分割
最適

ター


理解編

代表



考え,



違い

公式

いう


い。

10

expectancy

期待値


,100

う。



。階 数

期待値

5

,全要素




成績

,0―10,11―20




いい

いう



…95

いう

期待値



書い





範囲



考え


















histogram





期待値




数えあ



設定



度数分布表 ,例 6



,度数分布

10 階




通常,度数分布

ータ

10



10


15





多い
。例 7

いい

。度数分布

, 型的



例6
5点

15 点

25 点

35 点

45 点

55 点

65 点

75 点

85 点

95 点

0人

5人

26 人

44 人

39 人

24 人

10 人

2人

0人

0人

0

20

40

Frequency

60

例7

10 20 30 40 50 60 70 80
Score

,階
場合







境界

目盛







度数





40

,30

中心

,山型

,鐘形曲線 bell curve






ータ

あい

隙間



ータ

正規分布



分布

中心

要約

, ータ
平均

左右対称






あい




。正規分布

。正規分布
正規分布



,期待値








例7









期待値

35

。山型


,釣

, ータ

normal distribution

,正規分布




,平均

鐘型

度数分布



Gaussian distribution
中心







いう

ほう




ターン
近い値







11

遠い値

ほう

一般






,わ
,厳密







,形





,わ







。厳密

,具体的

,真

正規分布
ほう

関わ






いい
ータ








考え

正規分布



,正規分布

ータ

数値,



母数

平均





必要



,ひ






,縦線





,山

変わ



くいえ

す。正規分布

平均

平均

,分布

中心傾向



。例 8





。 数

ター,parameter

,具体的

左右

現象


い。




母数



山自体

ターン



,2





,外国語教育研究

数値

名前


















体的



日常生活



正規分布



左右対称

,正規分布

平均




い。平

,赤

平均



例8

うひ





変わ

母数


,山

,散布度

広さ,頂









わす


変わ

す。



,正規分布

ータ
,例 9



例9

ータ

要約

12



散布度





わす,

,正規分布

す。

いう

2





正規分布

うひ

数値
ータ



母数こそ

従う

,2



平均,σ

係数

2乗

い人

自分

要素





,平均


ータ

ータ





全部示





分布

分析

いう意味

起こ

やすい





要約

,実際,い
N



傾向

,平均





。x = 14

関数

積確率
いう





,正規分布

使え


う統計的


x



使う分析




分析








使う,


,確率的

考え



平均





要素





。1,000 人

全体像

,正規分布




いう



いい

確率

.24



大変
ータ







表現



標準偏差





的確

可能






側確率

,x 以





いう

累積分布関数 cumulative distribution function
,確率密度関数

直線 x

空間



x

対応

密度関数,例 11



。 積分布確率

, 積分布関数
。確率 p

規定

分散

関数

確率



,確率密度関数

いい



う標準偏差

考え

対応




面積

全体

,あ





指数関数

,2

す。σ

解くこ

分析



。 う

ータ



parametric analysis

側確率 場合,x 以

正確

,こ

正規分布

使え





いう







正規分布






推定

,確率密度関数


ータ



解釈







正規分布

いう 2

標準偏差,



,x



標準偏差

,あ

σ=2

書く



ータ

平均

,標準偏

2







' − :(,
;
26 ,

。うえ

重要



えわ

1,000 人



い。正規分布

由来

覚え



標準偏差



調べ

,µ = 10,σ = 1,x = 11
.05



円周率,exp

。π

頭文

重要
,あ

√256 ,

,N μ, σ2



関数自体

7 8 9−



,normal distribution



関数

1

標準偏差

,N μ, σ




ータ全体



わすこ

4' ( =

,詳

場合,

平均偏差

確率密度関数, probability density function

関数

。µ

ータ

,実

,逆
,p

積分布関数

,あ
ーセン


確率 p

対応

x



点 percentile

いい


。例 10

確率

,µ = 10,



13

0.00

0.05

p

0.10

0.15

0.20

例 10

0

5

10

15

20

x

0.0

0.2

0.4

p

0.6

0.8

1.0

例 11

0

5

10

15

20

x


そ 68%

要素



,み 2 標準偏差

,正規分布
合,

,平均 ± 1 標準偏差

,確率密度関数

非常







重要


あい

そ 95%

要素

特性

,ほ



,あ



あい


,全体

計算

正規分布
利用

す。


,あ





ータ

標準得点 標準化得点,z 得点,standardized/normalized score ,偏差値

各要素


標準得
10



,測定
単語






0,標準偏差



ータ

要約

変換
分散



統計的

,標準化
1

,得

影響

操作





,直接的


,標準化
ータ

。標準正規分布
いう

い値

TOEIC







い定義

normal distribution

,990



影響


いい










正規分布



比較

い場合



standardization

,N 0, 1 ,



標準正規分布



standard
,平均



14

0

操作

方法

。最初

,平均
µ1

,各要素





,偏差



,標準偏差
要素

σ1



標準偏差



0

いい





,ai











µ1,σ1

0



,前




う。読者



答え

, 個々


b

ータ
う。µ1 = 0

,平均



1
いい

,得



1





う。

変換



総和

考え





総和



1

標準偏差
う人

,各






>
?
,Σ

性質
1
?
思い出

い。

1=.
=.

,分散

>
応用

1

1 1
σ,

@

−μ ,
A
σ

'

− μ(,




+=

1

'

− μ(, = σ,



ータ

要約

15

1=B

1
V
σ,

=B

V
V

= √1
いう



計算
,xi



0,標準偏差

平均

,zi

標準化

いいわ

,平均



50,標準偏差

10

T



。偏差値

使

−:
6

,逆
いう

合,平均



いう



関係

変わ



,得

偏差値



偏差値

−:
A + 50
6
あい

1

,-1

。例 12

, いう





,標準化

0,標準偏差 1




, 平均 ± 1 標準偏差





規格化


左側

68% 要素



,z 得



簡便

68%

あい

標準正規分布,

,確率密度関数



右側



0.04
-4

-2

0
z

ータ

要約

0.02
0.00

p

p

例 12
0.0 0.1 0.2 0.3 0.4





,標準正規分布



E = 10 @





D =

計算

1

2

4

20

30

40

50

60

70

80

T

16





,平均

差, z 得

標準偏差

,偏差値,

積分布

関係

簡単











標準偏差
z 得点
T

偏差値
累積分布

一般

-4σ

-3σ

-2σ

-1σ

-4

-3

-2

-1

0

1

2

3

4

10

20

30

40

50

60

70

80

90

0%

0.1%

2.3%

15.9%

50.0%

84.1%

97.7%

99.9%

0%

,緑2 標準偏差





見込







超え









,い

。外



証拠



確固





分布

いう証拠



見込












い,









いう

い,

,除外



,実際

処理

。外






,そ

現実







す。




基準

身長

,教育







分析





いう



分布



,非常

結構い

う,




見込

,確率論的





超え





確率論的

要素

,統計的

210cm

,身長

,確率論的


outlier

場合

確率論的







措置




偏差

,外
,ほ

,ほ

いう





,基本的

いう可能性




0 平均

分布






ータ



い,






。外



超え

いう

ータ


身長

,平均















歪度

尖度


,正規分布



ータ

, ータ

基本的

,2








ータ



分布

観測





例 13
10 程度

ータ

要約

綺麗

ータ


対象

ータ分析





数,平均
ータ

可能性


ータ





いい

,非常





標準偏差

集約









有用


。正規分布





,考察




,外国語教育研究


現実

間違い

く,

,大事

情報

,実際





す。



分布

様子



,平均 50,標準偏差



17

0.00

0.02

p

0.04

0.06

0.08

例 13

0

20

40

60

80

100

T











kurtosis

いう



数値

使い







程度



や,尖度
歪度




分布

,左右

,黒い


。一応,山型

。例 14


特徴

,統計的





左右





,頂

,歪度 skewness

記述




,正確

,左右非対称

分布

,分布

非対称性







例 14




い原理

標準化

。標準化




ータ


3乗

FG7H 7FF =

ータ

要約

特性

平均値
1

I

数値化

歪度








−: K
J
6

18




。歪度




分散
0

中心
引い





方向

引い


左側


,正

方向

3

歪度

ータ

自体

2乗

左右対称





場合,平均値





平均,2



いい

。例 14
表現








,通常,山

,右,



。場合

い,

多い

有用
,歪

,平均



,歪度


ータ



ほう


いう


一致



標準偏差
い。

。やや





思い出

平均値









中央値

,3

。歪度



分布



いえ

,正





,偏差

正規分布

,そ

,歪度



, 慣習的

超え

正規分布









,絶対値



, ータ

右側,尾

期待値 平均

1



。標準偏差

,歪度


,3 乗



い場合

多い

分布

一致

要素

過半数




す。



いう

,慎重


一方,

ータ



,裾












,尖度

いう



,特





。尖


重い



いう

,例 14



。通常,歪度





, 通
尖度

正規分布




尖度

4

,実



歪度




。計算

3



いう値

基準

い値

場合

,尖

歪度や尖度




値自体






ほう






1

多い


−: P
J −3
6

I

,尖




,平均値









。通常,尖度

,通常,


−: P
J
6

I

い値

歪度や尖度



1



GLMNQFOF =
,0




GLMNoFOF =



,3







分析

0や3



基準

い,

いい



いわ

分析方法

標準偏差,


,う

要素


,歪度や尖度


意味






t 検定


場合,




いえ,

ータ

要約



重要

。歪度や尖度

,分析

条件

19

。正規分布



基本的


分析


指標

歪度



割い



人間



ータ



自体

学習





場合






個別指




場合





,限

時間や



う。





,分布


,成績



。極端





,人





,正規分布





集中

, ータ

処遇

要約




違い



いえ







影響



考え

や尖




方法

,複数









,成績





ータ





歪度

散布度





指標



情報

集合





,個々

代表値,

いい

。記述統計

。複雑

統計技術



,中心傾向





代表値









。平均値,中

代表値,

,平均偏

,正規分布





ータ





知識



使う場合,



ータ要約

吟味

い人

,い

要約

記述

意味



,単


理解

う。記述統計や
理解編や応用編






統計量 statistical value

ううえ

記述統計




,要約統計量 い



,研究



,記述統計自体


要約



方法



記述統計 descriptive statistics





要約





使

観察





差,標準偏差,分散

ータ

調



央値,最頻値









考え

机間支援



1 変数

ータ













場合

別活動,

本章





いう事情

支援時間





い,





認知さ

報告

観測

ータ

,十分


興味



特定



確認




正規分布



,教室

,教師

報告

,いう



,学術的



歪度

報告さ



,平均値や標準偏差



,尖度

学会発表や論文





尖度

外国語教育研究





大事

ータ

要約
い。

20

入門編
代表値

ータ


要約



中心



中心傾向,

平均

総和

平均



中心傾向

偏差

要素

平均

要素

絶対値



偏差



統計量


平均

平均偏差

分散,

平方根

平均値

平均偏差

標準偏差

正規分布

山型,左右対称,中心


散布度

平均

標準正規分布

変換





歪度,尖

ータ

要約



散布度



偏差自乗

正規分布





=平均





標準偏差

統計量


標準偏差
標準化




尖度

21

Show more