狠狠撸

狠狠撸Share a Scribd company logo
2
Most read
4
Most read
5
Most read
SPSS Statistics Small TIPS
より効果的にご利用いただくために
1/12
IBM SPSS Statistics Small TIPS
アンケート分析に統計的な手法を取り入れる
(2)
~ IBM SPSS Custom Tables ~
SPSS Statistics Small TIPS
より効果的にご利用いただくために
2/12
簡単操作で、きめ細やかなクロス表を作成する
with IBM SPSS Custom Tables
データ分析結果を第3者に伝える際、まず見せるのはデータの基礎統計です。度数はいくつか、カテゴリの中で何%を占め
ているのか、平均値はいくつかなどを確認することで、データの概要を把握することができます。データ分析レポートにはど
こかに必ず表やグラフが登場します。表は数が多くなりがちな基礎統計量を把握するのに一番簡単かつ分かりやすい集約
方法ですし、グラフは一目で見て一番伝わりやすい表現方法だからです。IBM SPSS Statisticsでは作表を詳細な統計量と
共に簡単に出力できるオプションをご用意しています。例えば列%の出力や、カイ2乗検定やt検定。マルチアンサー(MA)
形式の変数からも作表できます。
このTIPSではIBM SPSS Statisticsを使って、作表の仕方や設定、多重回答の扱い方などをご紹介します。
SPSS Statistics Small TIPS
より効果的にご利用いただくために
3/12
1.カスタムテーブルを使って、クロス表を作成する
以下の例では、サンプルファイルとして用意してある“Demo.sav”を使用します。
[分析] >> [カスタムテーブル] >> [カスタムテーブル]
変数リストに変数一覧が表示され、変数を選択すると、そのカテゴリ情報がカテゴリリストの中に表示されます。マウスを使
い、表したい変数を選んで、右のワークスペースの中の[行]および[列]のバーの部分にドラッグ&ドロップします。
ここでは「勤続年数」変数を行、「性
別」変数を列に投入しており、プレビュ
ーで確認することができます。
OKを押すとテーブルが出力されま
す。これで、基本的な2変数のクロス
表が完成です。デフォルト設定では、
それぞれの度数が出力されます。
また、プレビュー内でドロップした変数を選択した
状態で、左下[定義]の[カテゴリと合計]ボタンをク
リックすると、カテゴリ変数のうち除外する項目の
選択、値によっての並び替えの指定や、合計を表
示させるかどうかを選択できます。
SPSS Statistics Small TIPS
より効果的にご利用いただくために
4/12
2.クロス集計表から、グラフを作成する
表を出してみると、今度はその統計出力結果を使ったグラフを出力したい思うことがあると思います。IBM SPSS Statistics
では、出力したクロス集計表結果から、グラフを出力することができますのでその手順をご紹介しましょう。
IBM SPSS Statisticsの出力は、表もグラフも全てダブルクリックをして編集可能です。実際に出力したクロス表をダブルクリ
ックすると、それぞれのセルが選択できるようになります。その状態で右クリックすると新たに編集メニューが表示されます。
ここでは合計値を除いた集計値をハイライトした状態で、[グラフを作成] >> [棒]を選択して、該当集計値の棒グラフを出して
みます。
出力されたグラフはダブルクリックをすることで図表エ
ディタを使って、色変えやなどの編集も可能です。
また、[テーブルルック]を使うと、すでに存在しているテ
ンプレートを適用したり、新規テンプレートを作成する
ことができます。
下のテーブルは、「Academicテンプレート」を適用した
結果のテーブルです。
SPSS Statistics Small TIPS
より効果的にご利用いただくために
5/12
3.変数の積み重ね、入れ子、層化をする
ここからさらに、この表に手を加えていきます。まず、集計に使用する変数を増やしていきます。複数の変数情報を入れる
には大きく分けて3つの考え方(積み重ね、入れ子、層)があります。
積み重ねは、変数を平行して同列に表示させていくやり方です。IBM SPSS Custom Tablesでは、いくつでも変数を追加して
いくことができます。行方向にも列方向にも追加可能です。
入れ子は、上位の次元に下位の次元が入っている状態で、例の場合、仕事に対する満足度全カテゴリそれぞれに勤続年
数のカテゴリが含まれている状態です。IBM SPSS Statisticsでは、行/列共に原則いくつでも追加可能ですが、あまり入れ
子し過ぎると各セルに該当するデータが少なくなるため、特に次に紹介する検定を行う際には注意が必要です。
SPSS Statistics Small TIPS
より効果的にご利用いただくために
6/12
層は入れ子や積み重ねとほとんど同じですが、主な違いは 一度に表示できるのが層内の1つのカテゴリだけという点です。
例えば性別を層に入れると、行/列で指定している表を、男性もしくは女性のみ集計した表を作成します。
右上の[層]のボタンを押し、層項目を表示させ、該当変数を枠内にドラッグします。
仕事に対する満足度を層に入れた結果、まず1つめのカテゴリである「非常に不満」のみを集計した結果が出てきます。グ
ラフをダブルクリックすると、層のカテゴリを選択するドロップダウンが現れますので、そこで着目したい1カテゴリを選択し、
結果を表示させることが可能です。
表をダブルクリックした状態で、[ピボット] >> [ピボットトレイ]を選択すると、ピボットトレイウィザードが立ち上がります。ここ
で、変数を左上の層へ移動させ、層構造にすることもできます。
SPSS Statistics Small TIPS
より効果的にご利用いただくために
7/12
4.様々な統計量を出力する
次に出力する項目を増やしてみます。デフォルトでは度数のみですが、他にも様々な統計量を出力できます。この例では、
テーブルに投入した変数のうち、行変数を選択した状態で左下[定義]の[要約統計量]ボタンをクリックすると、ウィザードが
立ち上がります。ここでは、行のN%と列のN%を出してみましょう。
[統計量]から行N%、列N%を選択し表示に投入します。ラベルや形式、小数桁数は変更可能です。表示順序を変えたいと
きには、右の上下矢印で変更してください。設定ができたら、[選択項目に適用]を押します。
設定ができると、まずプレビ
ューに項目が追加されてい
る こ と が 分 か り ま す 。
さらに真ん中下の[要約統計
量]が選べるようになります。
[位置]で項目の表示方法が
選べます。
[列]を選択すると項目が横並びにな
り、[行]を選択すると、項目が縦なら
びに出力されます。
SPSS Statistics Small TIPS
より効果的にご利用いただくために
8/12
5.検定を行う
クロス表でセルの度数やパーセンテージを確認できますが、では2つの変数には関係があるのか、以下の例では、性別と
仕事に対する満足度の関係性をみていきます。具体的表現すると、性別により仕事に対する満足度には差が出るのか、性
別による違いがあると言っていいのか、それを統計的に証明するためには、統計的検定を使います。
カスタムテーブルでは、作表と併せてカイ2乗検定、t検定(平均値の比較)、z検定(列の比率の比較)ができます。
カスタムテーブルウィザードで、[検定統計量]タブを選択します。ここでは、[独立性の検定(カイ2乗)]と、[列の比率を比較
(z検定)]にチェックを入れます。またここでは変数に、行に「仕事に対する満足」、列に「性別」と「婚姻状況」を入れ、OKを
押します。
最初に Pearson のカイ 2 乗検定出力を見ま
す。有意水準=0.05 で判断すると、この結果
は、性別も婚姻状況も仕事に対する満足度
は有意ではないことを示しています。つま
り、性別や婚姻状況により、仕事に対する満
足度に違いがあるとはいえない、ことを示し
ています。
SPSS Statistics Small TIPS
より効果的にご利用いただくために
9/12
次に列比率の比較出力です。列の比率の検定で作成したテーブル表では、列変数の各カテゴリに文字キーが割り当てら
れます。ここでは教育レベルのカテゴリにそれぞれ順番に(A),(B)が割り当てられています。
セルの中にアルファベットが入っています。これは、各有意確率ペアについて、小さな列比率を持ったカテゴリのキーが大き
い列比率を持ったカテゴリの下に表示される、という定義に基づき表出されます。この定義は表の出力の脚注に出ていま
すが、もう少し具体的に読み取ってみましょう。
上から順番に見ていきます。「普通」の「女性」セルにBが入っています。これは普通と回答した人の中で、女性の比率は、
男性の比率よりも高い」ことを示しています。つまり、(A)である「女性」カテゴリが、(B)である「男性」カテゴリに表示されて
いるので、この列=普通カテゴリにおける列比率は、(B)男性<(A)女性、ということを示していることになります。
同様に「非常に満足」では(B)男性の下にAが表示されているので、非常に満足カテゴリにおける列比率は、(A)女性<
(B)男性であることを示します。「非常に不満」や「やや不満」、「やや満足」、加えて「婚姻状況」変数の全カテゴリにはアル
ファベットの出力がありません。これはそれぞれのカテゴリ間で、比率に統計的な差を確認することができないことを示して
います。是非、クロス表の度数と併せて、これら検定の結果を眺めてみてください。
SPSS Statistics Small TIPS
より効果的にご利用いただくために
10/12
6.多重回答データ(MA)を集計する
ここからは少し視点を変えて、多重回答データ、マルチアンサーデータ、MAデータと呼ばれる変数を扱い、集計するやり方
をご紹介します。
そもそもMAデータというのはどういうデータでしょうか?簡単に言ってしまうと、アンケートなどで「いくつでもいいので選んで
ください」「複数選択可能」と書いてあるような収集方法をしているデータのことです。そのような回答は集計しやすいように
データとして保存をするとき、独特な方法を使います。
「Q. 以下の電話機の機能から、使用しているものをいくつでもよいので選んで下さい」という質問に対して、
1.ボイス、
2.ワイヤレス、ボイス、ポケベル、コールID、キャッチホン
3.ワイヤレス、ボイス、
4.ワイヤレス、複数回線、ボイス
5.なし
…
というデータが集まってくると思います。そのときには、上のようにデータ入力をします。0/1のデータで、2値型、フラグ型とも
呼ばれる形式ですが、0であれば使っていない、1ならば使っていると決めて情報を入力します。このようにデータを持つこ
とで、ワイヤレス機能を使用している人が何人か?また、使用頻度が高い機能は何であるのか?など個別のデータ集計が
しやすくなります。このやり方は、アンケートの複数回答だけでなく、顧客がある商品を買った?買わないか、テキスト解析を
した際に単語を言った?言わないといったデータを保存するときなどにも使われる一般的な方法です。しかしこのようにデー
タ入力をしていくと、困ったことが起きることもあります。複数の変数が独立しているため、複数の情報を総合した集計がし
にくくなることです。
そこでIBM SPSS Statisticsでは、複数の変数であっても、本当は1つの質問に対する答えですよ、と定義することができ、そ
の定義したグループをその他の変数と同様な扱いで集計することができます。これをIBM SPSS Statisticsでは?多重回答グ
ループ?を設定する、といいます。それでは次に、このようなMAデータ処理方法をご紹介します。
SPSS Statistics Small TIPS
より効果的にご利用いただくために
11/12
MAデータとして保存されているデータの例として、引き続きDemo.savファイルを使用します。
[分析] >> [テーブル] >> [多重回答グループ] を選択しウィザードを開きます。
変数一覧から、グループにまとめる変数を全て[変数グループ内の変数]に投入します。
[変数のコード化]で2分変数が選択されていることを確認し、ここでは集計値を”1”とします。これは1となっているものを数
えるという意味です(1or2で、2がYESならば2とし、T/Fと入っているデータならばTと入力します)。
[グループ名]にグループの名前、[グループラベル]にグループとしてのラベルを設定します。これは変数でいう変数名とラ
ベルと同様です。この設定ができたら、追加を押すと、[多重回答グループ]に$果物という変数グループが追加されます。
多重回答グループはすべて$で始まります。これで設定は終了ですので、OKを押しますがここでグループの定義を変更、
削除する必要があるときには、右の一覧からグループをハイライトし、情報を変更して[変更]ボタン、もしくは[削除]ボタンを
押します。
データセットに戻っても、変数として追加されるわけではなく特に見た目上の変化はありません。しかし [分析] >> [カスタム
テーブル] >> [カスタムテーブル] を選択すると、多重回答グループアイコンと共に、新たに[ 使用している機能 [$機能] ]と
いう項目が追加されています。
SPSS Statistics Small TIPS
より効果的にご利用いただくために
12/12
? IBM Corporation 2017. All Rights Reserved.
ワークショップ、セッション、および資料は、IBM またはセッション発表者によって準備され、それぞれ独自の見解を反映した
ものです。それらは情報提供の目的のみで提供されており、いかなる参加者に対しても法律的またはその他の指導や助言
を意図したものではなく、またそのような結果を生むものでもありません。本講演資料に含まれている情報については、完
全性と正確性を期するよう努力しましたが、「現状のまま」提供され、明示または暗示にかかわらずいかなる保証も伴わな
いものとします。本講演資料またはその他の資料の使用によって、あるいはその他の関連によって、いかなる損害が生じた
場合も、IBM は責任を負わないものとします。 本講演資料に含まれている内容は、IBM またはそのサプライヤーやライセン
ス交付者からいかなる保証または表明を引きだすことを意図したものでも、IBM ソフトウェアの使用を規定する適用ライセン
ス契約の条項を変更することを意図したものでもなく、またそのような結果を生むものでもありません。
本講演資料で IBM 製品、プログラム、またはサービスに言及していても、IBM が営業活動を行っているすべての国でそれら
が使用可能であることを暗示するものではありません。本講演資料で言及している製品リリース日付や製品機能は、市場
機会またはその他の要因に基づいて IBM 独自の決定権をもっていつでも変更できるものとし、いかなる方法においても将
来の製品または機能が使用可能になると確約することを意図したものではありません。本講演資料に含まれている内容は、
参加者が開始する活動によって特定の販売、売上高の向上、またはその他の結果が生じると述べる、または暗示すること
を意図したものでも、またそのような結果を生むものでもありません。 パフォーマンスは、管理された環境において標準的
な IBM ベンチマークを使用した測定と予測に基づいています。ユーザーが経験する実際のスループットやパフォーマンスは、
ユーザーのジョブ?ストリームにおけるマルチプログラミングの量、入出力構成、ストレージ構成、および処理されるワークロ
ードなどの考慮事項を含む、数多くの要因に応じて変化します。したがって、個々のユーザーがここで述べられているものと
同様の結果を得られると確約するものではありません。
記述されているすべてのお客様事例は、それらのお客様がどのように IBM 製品を使用したか、またそれらのお客様が達成
した結果の実例として示されたものです。実際の環境コストおよびパフォーマンス特性は、お客様ごとに異なる場合があり
ます。
IBM、IBM ロゴ、ibm.com、SmarterPlanet アイコンは、世界の多くの国で登録された International Business Machines
Corporation の商標です。他の製品名およびサービス名等は、それぞれ IBM または各社の商標である場合があります。
現時点での IBM の商標リストについては、www.ibm.com/legal/copytrade.shtml をご覧ください。
Microsoft, Windows, Windows NT および Windows ロゴは Microsoft Corporation の米国およびその他の国における商標で
す。
Ad

Recommended

Linked Open Data (LOD)の基礎講座
Linked Open Data (LOD)の基礎講座
Kouji Kozaki
?
Isolation forest
Isolation forest
kataware
?
DBpedia Japaneseとは?
DBpedia Japaneseとは?
National Institute of Informatics (NII)
?
Linked Open Data(LOD)を用いた オープンデータの活用事例と今後の展望
Linked Open Data(LOD)を用いた オープンデータの活用事例と今後の展望
Kouji Kozaki
?
[DL輪読会]Revisiting Deep Learning Models for Tabular Data (NeurIPS 2021) 表形式デー...
[DL輪読会]Revisiting Deep Learning Models for Tabular Data (NeurIPS 2021) 表形式デー...
Deep Learning JP
?
罢谤补苍蝉蹿辞谤尘别谤を多层にする际の勾配消失问题と解决法について
罢谤补苍蝉蹿辞谤尘别谤を多层にする际の勾配消失问题と解决法について
Sho Takase
?
これから始める人のためのディープラーニング基础讲座
これから始める人のためのディープラーニング基础讲座
NVIDIA Japan
?
Data mining
Data mining
Kinza Razzaq
?
機械学習 / Deep Learning 大全 (1) 機械学習基礎編
機械学習 / Deep Learning 大全 (1) 機械学習基礎編
Daiyu Hatakeyama
?
Criando e consumindo webservice REST com PHP e JSON
Ambiente Livre
?
RDF Refineの使い方
RDF Refineの使い方
National Institute of Informatics (NII)
?
宫崎大学キャリア讲演20170111微修正版
宫崎大学キャリア讲演20170111微修正版
Takayuki Itoh
?
3DFeat-Net
3DFeat-Net
Takuya Minagawa
?
2018/02/27 Recurrent Neural Networks starting with Neural Network Console
2018/02/27 Recurrent Neural Networks starting with Neural Network Console
Sony Network Communications Inc.
?
流行りの分散表現を用いた文書分類について Netadashi Meetup 7
流行りの分散表現を用いた文書分類について Netadashi Meetup 7
Teruyuki Sakaue
?
条件付き确率场の推论と学习
条件付き确率场の推论と学习
Masaki Saito
?
ソフトウェア开発工程とテスト入门
ソフトウェア开発工程とテスト入门
tadaaki hayashi
?
[DL輪読会]Xception: Deep Learning with Depthwise Separable Convolutions
[DL輪読会]Xception: Deep Learning with Depthwise Separable Convolutions
Deep Learning JP
?
セマンティック奥别产とオントロジー:现状と将来展望
セマンティック奥别产とオントロジー:现状と将来展望
National Institute of Informatics (NII)
?
搁の滨顿贰である搁厂迟耻诲颈辞で驰辞耻罢耻产别を再生できるようにした话
搁の滨顿贰である搁厂迟耻诲颈辞で驰辞耻罢耻产别を再生できるようにした话
LINE Corporation
?
【DL輪読会】Transporters with Visual Foresight for Solving Unseen Rearrangement Tasks
【DL輪読会】Transporters with Visual Foresight for Solving Unseen Rearrangement Tasks
Deep Learning JP
?
200611material ozaki
200611material ozaki
RCCSRENKEI
?
入門 異常検知 -これを読めば異常検知がわかる-
入門 異常検知 -これを読めば異常検知がわかる-
Natsuki Hirota
?
研究発表を準备する
研究発表を準备する
Takayuki Itoh
?
第126回 ロボット工学セミナー 三次元点群と深層学習
第126回 ロボット工学セミナー 三次元点群と深層学習
Naoya Chiba
?
【DL輪読会】Representational Continuity for Unsupervised Continual Learning ( ICLR...
【DL輪読会】Representational Continuity for Unsupervised Continual Learning ( ICLR...
Deep Learning JP
?
研究室リテラシー教育スライド
研究室リテラシー教育スライド
Nobutaka Shimada
?
アンケート分析に统计的な手法を取り入れる(1)
アンケート分析に统计的な手法を取り入れる(1)
IBM Analytics Japan
?
中古车贩売の価格予测モデル(1)
中古车贩売の価格予测モデル(1)
IBM Analytics Japan
?

More Related Content

What's hot (20)

Data mining
Data mining
Kinza Razzaq
?
機械学習 / Deep Learning 大全 (1) 機械学習基礎編
機械学習 / Deep Learning 大全 (1) 機械学習基礎編
Daiyu Hatakeyama
?
Criando e consumindo webservice REST com PHP e JSON
Ambiente Livre
?
RDF Refineの使い方
RDF Refineの使い方
National Institute of Informatics (NII)
?
宫崎大学キャリア讲演20170111微修正版
宫崎大学キャリア讲演20170111微修正版
Takayuki Itoh
?
3DFeat-Net
3DFeat-Net
Takuya Minagawa
?
2018/02/27 Recurrent Neural Networks starting with Neural Network Console
2018/02/27 Recurrent Neural Networks starting with Neural Network Console
Sony Network Communications Inc.
?
流行りの分散表現を用いた文書分類について Netadashi Meetup 7
流行りの分散表現を用いた文書分類について Netadashi Meetup 7
Teruyuki Sakaue
?
条件付き确率场の推论と学习
条件付き确率场の推论と学习
Masaki Saito
?
ソフトウェア开発工程とテスト入门
ソフトウェア开発工程とテスト入门
tadaaki hayashi
?
[DL輪読会]Xception: Deep Learning with Depthwise Separable Convolutions
[DL輪読会]Xception: Deep Learning with Depthwise Separable Convolutions
Deep Learning JP
?
セマンティック奥别产とオントロジー:现状と将来展望
セマンティック奥别产とオントロジー:现状と将来展望
National Institute of Informatics (NII)
?
搁の滨顿贰である搁厂迟耻诲颈辞で驰辞耻罢耻产别を再生できるようにした话
搁の滨顿贰である搁厂迟耻诲颈辞で驰辞耻罢耻产别を再生できるようにした话
LINE Corporation
?
【DL輪読会】Transporters with Visual Foresight for Solving Unseen Rearrangement Tasks
【DL輪読会】Transporters with Visual Foresight for Solving Unseen Rearrangement Tasks
Deep Learning JP
?
200611material ozaki
200611material ozaki
RCCSRENKEI
?
入門 異常検知 -これを読めば異常検知がわかる-
入門 異常検知 -これを読めば異常検知がわかる-
Natsuki Hirota
?
研究発表を準备する
研究発表を準备する
Takayuki Itoh
?
第126回 ロボット工学セミナー 三次元点群と深層学習
第126回 ロボット工学セミナー 三次元点群と深層学習
Naoya Chiba
?
【DL輪読会】Representational Continuity for Unsupervised Continual Learning ( ICLR...
【DL輪読会】Representational Continuity for Unsupervised Continual Learning ( ICLR...
Deep Learning JP
?
研究室リテラシー教育スライド
研究室リテラシー教育スライド
Nobutaka Shimada
?
機械学習 / Deep Learning 大全 (1) 機械学習基礎編
機械学習 / Deep Learning 大全 (1) 機械学習基礎編
Daiyu Hatakeyama
?
Criando e consumindo webservice REST com PHP e JSON
Ambiente Livre
?
宫崎大学キャリア讲演20170111微修正版
宫崎大学キャリア讲演20170111微修正版
Takayuki Itoh
?
2018/02/27 Recurrent Neural Networks starting with Neural Network Console
2018/02/27 Recurrent Neural Networks starting with Neural Network Console
Sony Network Communications Inc.
?
流行りの分散表現を用いた文書分類について Netadashi Meetup 7
流行りの分散表現を用いた文書分類について Netadashi Meetup 7
Teruyuki Sakaue
?
条件付き确率场の推论と学习
条件付き确率场の推论と学习
Masaki Saito
?
ソフトウェア开発工程とテスト入门
ソフトウェア开発工程とテスト入门
tadaaki hayashi
?
[DL輪読会]Xception: Deep Learning with Depthwise Separable Convolutions
[DL輪読会]Xception: Deep Learning with Depthwise Separable Convolutions
Deep Learning JP
?
セマンティック奥别产とオントロジー:现状と将来展望
セマンティック奥别产とオントロジー:现状と将来展望
National Institute of Informatics (NII)
?
搁の滨顿贰である搁厂迟耻诲颈辞で驰辞耻罢耻产别を再生できるようにした话
搁の滨顿贰である搁厂迟耻诲颈辞で驰辞耻罢耻产别を再生できるようにした话
LINE Corporation
?
【DL輪読会】Transporters with Visual Foresight for Solving Unseen Rearrangement Tasks
【DL輪読会】Transporters with Visual Foresight for Solving Unseen Rearrangement Tasks
Deep Learning JP
?
200611material ozaki
200611material ozaki
RCCSRENKEI
?
入門 異常検知 -これを読めば異常検知がわかる-
入門 異常検知 -これを読めば異常検知がわかる-
Natsuki Hirota
?
研究発表を準备する
研究発表を準备する
Takayuki Itoh
?
第126回 ロボット工学セミナー 三次元点群と深層学習
第126回 ロボット工学セミナー 三次元点群と深層学習
Naoya Chiba
?
【DL輪読会】Representational Continuity for Unsupervised Continual Learning ( ICLR...
【DL輪読会】Representational Continuity for Unsupervised Continual Learning ( ICLR...
Deep Learning JP
?
研究室リテラシー教育スライド
研究室リテラシー教育スライド
Nobutaka Shimada
?

Similar to アンケート分析に统计的な手法を取り入れる(2) (9)

アンケート分析に统计的な手法を取り入れる(1)
アンケート分析に统计的な手法を取り入れる(1)
IBM Analytics Japan
?
中古车贩売の価格予测モデル(1)
中古车贩売の価格予测モデル(1)
IBM Analytics Japan
?
安全在库を确保するための売上予测
安全在库を确保するための売上予测
IBM Analytics Japan
?
[Tokyor08] Rによるデータサイエンス 第2部 第3章 対応分析
[Tokyor08] Rによるデータサイエンス 第2部 第3章 対応分析
Yohei Sato
?
2015-1003 英語コーパス学会ワークショップ使用スライド
2015-1003 英語コーパス学会ワークショップ使用スライド
Mizumoto Atsushi
?
惭辫濒耻蝉の使い方 中级编
惭辫濒耻蝉の使い方 中级编
Hiroshi Shimizu
?
SAS Enterprise Minerを使用した機械学習
SAS Enterprise Minerを使用した機械学習
SAS Institute Japan
?
惭辫濒耻蝉の使い方 初级编
惭辫濒耻蝉の使い方 初级编
Hiroshi Shimizu
?
アンケートデータ集计?分析のための贰虫肠别濒
アンケートデータ集计?分析のための贰虫肠别濒
Shibaura Institute of Technology
?
アンケート分析に统计的な手法を取り入れる(1)
アンケート分析に统计的な手法を取り入れる(1)
IBM Analytics Japan
?
中古车贩売の価格予测モデル(1)
中古车贩売の価格予测モデル(1)
IBM Analytics Japan
?
安全在库を确保するための売上予测
安全在库を确保するための売上予测
IBM Analytics Japan
?
[Tokyor08] Rによるデータサイエンス 第2部 第3章 対応分析
[Tokyor08] Rによるデータサイエンス 第2部 第3章 対応分析
Yohei Sato
?
2015-1003 英語コーパス学会ワークショップ使用スライド
2015-1003 英語コーパス学会ワークショップ使用スライド
Mizumoto Atsushi
?
惭辫濒耻蝉の使い方 中级编
惭辫濒耻蝉の使い方 中级编
Hiroshi Shimizu
?
SAS Enterprise Minerを使用した機械学習
SAS Enterprise Minerを使用した機械学習
SAS Institute Japan
?
惭辫濒耻蝉の使い方 初级编
惭辫濒耻蝉の使い方 初级编
Hiroshi Shimizu
?
アンケートデータ集计?分析のための贰虫肠别濒
アンケートデータ集计?分析のための贰虫肠别濒
Shibaura Institute of Technology
?
Ad

More from IBM Analytics Japan (20)

Db2 v11.5.4 高可用性構成 & HADR 構成パターンご紹介
Db2 v11.5.4 高可用性構成 & HADR 構成パターンご紹介
IBM Analytics Japan
?
Db2 & Db2 Warehouse v11.5.4 最新情報アップデート2020年8月25日
Db2 & Db2 Warehouse v11.5.4 最新情報アップデート2020年8月25日
IBM Analytics Japan
?
Db2 Warehouse on Cloud Flex テクニカルハンドブック 2020年3月版
Db2 Warehouse on Cloud Flex テクニカルハンドブック 2020年3月版
IBM Analytics Japan
?
Db2 Warehouse on Cloud Flex ご紹介資料 2020年3月版
Db2 Warehouse on Cloud Flex ご紹介資料 2020年3月版
IBM Analytics Japan
?
Db2 Warehouse v3.0 運用管理ガイド 基礎編 20190104 Db2 Warehouse v3.0 Basic Operation G...
Db2 Warehouse v3.0 運用管理ガイド 基礎編 20190104 Db2 Warehouse v3.0 Basic Operation G...
IBM Analytics Japan
?
Db2 Warehouse v3.0 SMP 導入ガイド 20190104 Db2 Warehouse SMP v3.0 configration Ins...
Db2 Warehouse v3.0 SMP 導入ガイド 20190104 Db2 Warehouse SMP v3.0 configration Ins...
IBM Analytics Japan
?
【jena X IBM】ビーコンを活用した働き方改革とは?
【jena X IBM】ビーコンを活用した働き方改革とは?
IBM Analytics Japan
?
IBM Integrated Analytics System DSX R Studio 利用ガイド
IBM Integrated Analytics System DSX R Studio 利用ガイド
IBM Analytics Japan
?
IBM Integrated Analytics System Webコンソール利用ガイド 20180213
IBM Integrated Analytics System Webコンソール利用ガイド 20180213
IBM Analytics Japan
?
IBM Integrated Analytics System ユーザー利用ガイド 20180213
IBM Integrated Analytics System ユーザー利用ガイド 20180213
IBM Analytics Japan
?
IBM Cloud を利用したデータ分析ことはじめ
IBM Cloud を利用したデータ分析ことはじめ
IBM Analytics Japan
?
Db2 V11 GUIツール
Db2 V11 GUIツール
IBM Analytics Japan
?
Db2リブランディングと製品動向 201707
Db2リブランディングと製品動向 201707
IBM Analytics Japan
?
顿辞肠办别谤と诲产2
顿辞肠办别谤と诲产2
IBM Analytics Japan
?
IBM Cloudのデータベース
IBM Cloudのデータベース
IBM Analytics Japan
?
【株式会社ラック様】ハイブリッド?クラウド時代の データベース活用 ~事例?スタートアップ?メニューご紹介~
【株式会社ラック様】ハイブリッド?クラウド時代の データベース活用 ~事例?スタートアップ?メニューご紹介~
IBM Analytics Japan
?
Db2 Warehouse セッション資料 db tech showcase
Db2 Warehouse セッション資料 db tech showcase
IBM Analytics Japan
?
Db2 Warehouse Spark利用カ?イト? チュートリアル編
Db2 Warehouse Spark利用カ?イト? チュートリアル編
IBM Analytics Japan
?
Db2 Warehouse Spark利用カ?イト? テ?ータ操作編
Db2 Warehouse Spark利用カ?イト? テ?ータ操作編
IBM Analytics Japan
?
Db2 Warehouse こ?紹介資料 20170922
Db2 Warehouse こ?紹介資料 20170922
IBM Analytics Japan
?
Db2 v11.5.4 高可用性構成 & HADR 構成パターンご紹介
Db2 v11.5.4 高可用性構成 & HADR 構成パターンご紹介
IBM Analytics Japan
?
Db2 & Db2 Warehouse v11.5.4 最新情報アップデート2020年8月25日
Db2 & Db2 Warehouse v11.5.4 最新情報アップデート2020年8月25日
IBM Analytics Japan
?
Db2 Warehouse on Cloud Flex テクニカルハンドブック 2020年3月版
Db2 Warehouse on Cloud Flex テクニカルハンドブック 2020年3月版
IBM Analytics Japan
?
Db2 Warehouse on Cloud Flex ご紹介資料 2020年3月版
Db2 Warehouse on Cloud Flex ご紹介資料 2020年3月版
IBM Analytics Japan
?
Db2 Warehouse v3.0 運用管理ガイド 基礎編 20190104 Db2 Warehouse v3.0 Basic Operation G...
Db2 Warehouse v3.0 運用管理ガイド 基礎編 20190104 Db2 Warehouse v3.0 Basic Operation G...
IBM Analytics Japan
?
Db2 Warehouse v3.0 SMP 導入ガイド 20190104 Db2 Warehouse SMP v3.0 configration Ins...
Db2 Warehouse v3.0 SMP 導入ガイド 20190104 Db2 Warehouse SMP v3.0 configration Ins...
IBM Analytics Japan
?
【jena X IBM】ビーコンを活用した働き方改革とは?
【jena X IBM】ビーコンを活用した働き方改革とは?
IBM Analytics Japan
?
IBM Integrated Analytics System DSX R Studio 利用ガイド
IBM Integrated Analytics System DSX R Studio 利用ガイド
IBM Analytics Japan
?
IBM Integrated Analytics System Webコンソール利用ガイド 20180213
IBM Integrated Analytics System Webコンソール利用ガイド 20180213
IBM Analytics Japan
?
IBM Integrated Analytics System ユーザー利用ガイド 20180213
IBM Integrated Analytics System ユーザー利用ガイド 20180213
IBM Analytics Japan
?
IBM Cloud を利用したデータ分析ことはじめ
IBM Cloud を利用したデータ分析ことはじめ
IBM Analytics Japan
?
Db2リブランディングと製品動向 201707
Db2リブランディングと製品動向 201707
IBM Analytics Japan
?
【株式会社ラック様】ハイブリッド?クラウド時代の データベース活用 ~事例?スタートアップ?メニューご紹介~
【株式会社ラック様】ハイブリッド?クラウド時代の データベース活用 ~事例?スタートアップ?メニューご紹介~
IBM Analytics Japan
?
Db2 Warehouse セッション資料 db tech showcase
Db2 Warehouse セッション資料 db tech showcase
IBM Analytics Japan
?
Db2 Warehouse Spark利用カ?イト? チュートリアル編
Db2 Warehouse Spark利用カ?イト? チュートリアル編
IBM Analytics Japan
?
Db2 Warehouse Spark利用カ?イト? テ?ータ操作編
Db2 Warehouse Spark利用カ?イト? テ?ータ操作編
IBM Analytics Japan
?
Db2 Warehouse こ?紹介資料 20170922
Db2 Warehouse こ?紹介資料 20170922
IBM Analytics Japan
?
Ad

アンケート分析に统计的な手法を取り入れる(2)

  • 1. SPSS Statistics Small TIPS より効果的にご利用いただくために 1/12 IBM SPSS Statistics Small TIPS アンケート分析に統計的な手法を取り入れる (2) ~ IBM SPSS Custom Tables ~
  • 2. SPSS Statistics Small TIPS より効果的にご利用いただくために 2/12 簡単操作で、きめ細やかなクロス表を作成する with IBM SPSS Custom Tables データ分析結果を第3者に伝える際、まず見せるのはデータの基礎統計です。度数はいくつか、カテゴリの中で何%を占め ているのか、平均値はいくつかなどを確認することで、データの概要を把握することができます。データ分析レポートにはど こかに必ず表やグラフが登場します。表は数が多くなりがちな基礎統計量を把握するのに一番簡単かつ分かりやすい集約 方法ですし、グラフは一目で見て一番伝わりやすい表現方法だからです。IBM SPSS Statisticsでは作表を詳細な統計量と 共に簡単に出力できるオプションをご用意しています。例えば列%の出力や、カイ2乗検定やt検定。マルチアンサー(MA) 形式の変数からも作表できます。 このTIPSではIBM SPSS Statisticsを使って、作表の仕方や設定、多重回答の扱い方などをご紹介します。
  • 3. SPSS Statistics Small TIPS より効果的にご利用いただくために 3/12 1.カスタムテーブルを使って、クロス表を作成する 以下の例では、サンプルファイルとして用意してある“Demo.sav”を使用します。 [分析] >> [カスタムテーブル] >> [カスタムテーブル] 変数リストに変数一覧が表示され、変数を選択すると、そのカテゴリ情報がカテゴリリストの中に表示されます。マウスを使 い、表したい変数を選んで、右のワークスペースの中の[行]および[列]のバーの部分にドラッグ&ドロップします。 ここでは「勤続年数」変数を行、「性 別」変数を列に投入しており、プレビュ ーで確認することができます。 OKを押すとテーブルが出力されま す。これで、基本的な2変数のクロス 表が完成です。デフォルト設定では、 それぞれの度数が出力されます。 また、プレビュー内でドロップした変数を選択した 状態で、左下[定義]の[カテゴリと合計]ボタンをク リックすると、カテゴリ変数のうち除外する項目の 選択、値によっての並び替えの指定や、合計を表 示させるかどうかを選択できます。
  • 4. SPSS Statistics Small TIPS より効果的にご利用いただくために 4/12 2.クロス集計表から、グラフを作成する 表を出してみると、今度はその統計出力結果を使ったグラフを出力したい思うことがあると思います。IBM SPSS Statistics では、出力したクロス集計表結果から、グラフを出力することができますのでその手順をご紹介しましょう。 IBM SPSS Statisticsの出力は、表もグラフも全てダブルクリックをして編集可能です。実際に出力したクロス表をダブルクリ ックすると、それぞれのセルが選択できるようになります。その状態で右クリックすると新たに編集メニューが表示されます。 ここでは合計値を除いた集計値をハイライトした状態で、[グラフを作成] >> [棒]を選択して、該当集計値の棒グラフを出して みます。 出力されたグラフはダブルクリックをすることで図表エ ディタを使って、色変えやなどの編集も可能です。 また、[テーブルルック]を使うと、すでに存在しているテ ンプレートを適用したり、新規テンプレートを作成する ことができます。 下のテーブルは、「Academicテンプレート」を適用した 結果のテーブルです。
  • 5. SPSS Statistics Small TIPS より効果的にご利用いただくために 5/12 3.変数の積み重ね、入れ子、層化をする ここからさらに、この表に手を加えていきます。まず、集計に使用する変数を増やしていきます。複数の変数情報を入れる には大きく分けて3つの考え方(積み重ね、入れ子、層)があります。 積み重ねは、変数を平行して同列に表示させていくやり方です。IBM SPSS Custom Tablesでは、いくつでも変数を追加して いくことができます。行方向にも列方向にも追加可能です。 入れ子は、上位の次元に下位の次元が入っている状態で、例の場合、仕事に対する満足度全カテゴリそれぞれに勤続年 数のカテゴリが含まれている状態です。IBM SPSS Statisticsでは、行/列共に原則いくつでも追加可能ですが、あまり入れ 子し過ぎると各セルに該当するデータが少なくなるため、特に次に紹介する検定を行う際には注意が必要です。
  • 6. SPSS Statistics Small TIPS より効果的にご利用いただくために 6/12 層は入れ子や積み重ねとほとんど同じですが、主な違いは 一度に表示できるのが層内の1つのカテゴリだけという点です。 例えば性別を層に入れると、行/列で指定している表を、男性もしくは女性のみ集計した表を作成します。 右上の[層]のボタンを押し、層項目を表示させ、該当変数を枠内にドラッグします。 仕事に対する満足度を層に入れた結果、まず1つめのカテゴリである「非常に不満」のみを集計した結果が出てきます。グ ラフをダブルクリックすると、層のカテゴリを選択するドロップダウンが現れますので、そこで着目したい1カテゴリを選択し、 結果を表示させることが可能です。 表をダブルクリックした状態で、[ピボット] >> [ピボットトレイ]を選択すると、ピボットトレイウィザードが立ち上がります。ここ で、変数を左上の層へ移動させ、層構造にすることもできます。
  • 7. SPSS Statistics Small TIPS より効果的にご利用いただくために 7/12 4.様々な統計量を出力する 次に出力する項目を増やしてみます。デフォルトでは度数のみですが、他にも様々な統計量を出力できます。この例では、 テーブルに投入した変数のうち、行変数を選択した状態で左下[定義]の[要約統計量]ボタンをクリックすると、ウィザードが 立ち上がります。ここでは、行のN%と列のN%を出してみましょう。 [統計量]から行N%、列N%を選択し表示に投入します。ラベルや形式、小数桁数は変更可能です。表示順序を変えたいと きには、右の上下矢印で変更してください。設定ができたら、[選択項目に適用]を押します。 設定ができると、まずプレビ ューに項目が追加されてい る こ と が 分 か り ま す 。 さらに真ん中下の[要約統計 量]が選べるようになります。 [位置]で項目の表示方法が 選べます。 [列]を選択すると項目が横並びにな り、[行]を選択すると、項目が縦なら びに出力されます。
  • 8. SPSS Statistics Small TIPS より効果的にご利用いただくために 8/12 5.検定を行う クロス表でセルの度数やパーセンテージを確認できますが、では2つの変数には関係があるのか、以下の例では、性別と 仕事に対する満足度の関係性をみていきます。具体的表現すると、性別により仕事に対する満足度には差が出るのか、性 別による違いがあると言っていいのか、それを統計的に証明するためには、統計的検定を使います。 カスタムテーブルでは、作表と併せてカイ2乗検定、t検定(平均値の比較)、z検定(列の比率の比較)ができます。 カスタムテーブルウィザードで、[検定統計量]タブを選択します。ここでは、[独立性の検定(カイ2乗)]と、[列の比率を比較 (z検定)]にチェックを入れます。またここでは変数に、行に「仕事に対する満足」、列に「性別」と「婚姻状況」を入れ、OKを 押します。 最初に Pearson のカイ 2 乗検定出力を見ま す。有意水準=0.05 で判断すると、この結果 は、性別も婚姻状況も仕事に対する満足度 は有意ではないことを示しています。つま り、性別や婚姻状況により、仕事に対する満 足度に違いがあるとはいえない、ことを示し ています。
  • 9. SPSS Statistics Small TIPS より効果的にご利用いただくために 9/12 次に列比率の比較出力です。列の比率の検定で作成したテーブル表では、列変数の各カテゴリに文字キーが割り当てら れます。ここでは教育レベルのカテゴリにそれぞれ順番に(A),(B)が割り当てられています。 セルの中にアルファベットが入っています。これは、各有意確率ペアについて、小さな列比率を持ったカテゴリのキーが大き い列比率を持ったカテゴリの下に表示される、という定義に基づき表出されます。この定義は表の出力の脚注に出ていま すが、もう少し具体的に読み取ってみましょう。 上から順番に見ていきます。「普通」の「女性」セルにBが入っています。これは普通と回答した人の中で、女性の比率は、 男性の比率よりも高い」ことを示しています。つまり、(A)である「女性」カテゴリが、(B)である「男性」カテゴリに表示されて いるので、この列=普通カテゴリにおける列比率は、(B)男性<(A)女性、ということを示していることになります。 同様に「非常に満足」では(B)男性の下にAが表示されているので、非常に満足カテゴリにおける列比率は、(A)女性< (B)男性であることを示します。「非常に不満」や「やや不満」、「やや満足」、加えて「婚姻状況」変数の全カテゴリにはアル ファベットの出力がありません。これはそれぞれのカテゴリ間で、比率に統計的な差を確認することができないことを示して います。是非、クロス表の度数と併せて、これら検定の結果を眺めてみてください。
  • 10. SPSS Statistics Small TIPS より効果的にご利用いただくために 10/12 6.多重回答データ(MA)を集計する ここからは少し視点を変えて、多重回答データ、マルチアンサーデータ、MAデータと呼ばれる変数を扱い、集計するやり方 をご紹介します。 そもそもMAデータというのはどういうデータでしょうか?簡単に言ってしまうと、アンケートなどで「いくつでもいいので選んで ください」「複数選択可能」と書いてあるような収集方法をしているデータのことです。そのような回答は集計しやすいように データとして保存をするとき、独特な方法を使います。 「Q. 以下の電話機の機能から、使用しているものをいくつでもよいので選んで下さい」という質問に対して、 1.ボイス、 2.ワイヤレス、ボイス、ポケベル、コールID、キャッチホン 3.ワイヤレス、ボイス、 4.ワイヤレス、複数回線、ボイス 5.なし … というデータが集まってくると思います。そのときには、上のようにデータ入力をします。0/1のデータで、2値型、フラグ型とも 呼ばれる形式ですが、0であれば使っていない、1ならば使っていると決めて情報を入力します。このようにデータを持つこ とで、ワイヤレス機能を使用している人が何人か?また、使用頻度が高い機能は何であるのか?など個別のデータ集計が しやすくなります。このやり方は、アンケートの複数回答だけでなく、顧客がある商品を買った?買わないか、テキスト解析を した際に単語を言った?言わないといったデータを保存するときなどにも使われる一般的な方法です。しかしこのようにデー タ入力をしていくと、困ったことが起きることもあります。複数の変数が独立しているため、複数の情報を総合した集計がし にくくなることです。 そこでIBM SPSS Statisticsでは、複数の変数であっても、本当は1つの質問に対する答えですよ、と定義することができ、そ の定義したグループをその他の変数と同様な扱いで集計することができます。これをIBM SPSS Statisticsでは?多重回答グ ループ?を設定する、といいます。それでは次に、このようなMAデータ処理方法をご紹介します。
  • 11. SPSS Statistics Small TIPS より効果的にご利用いただくために 11/12 MAデータとして保存されているデータの例として、引き続きDemo.savファイルを使用します。 [分析] >> [テーブル] >> [多重回答グループ] を選択しウィザードを開きます。 変数一覧から、グループにまとめる変数を全て[変数グループ内の変数]に投入します。 [変数のコード化]で2分変数が選択されていることを確認し、ここでは集計値を”1”とします。これは1となっているものを数 えるという意味です(1or2で、2がYESならば2とし、T/Fと入っているデータならばTと入力します)。 [グループ名]にグループの名前、[グループラベル]にグループとしてのラベルを設定します。これは変数でいう変数名とラ ベルと同様です。この設定ができたら、追加を押すと、[多重回答グループ]に$果物という変数グループが追加されます。 多重回答グループはすべて$で始まります。これで設定は終了ですので、OKを押しますがここでグループの定義を変更、 削除する必要があるときには、右の一覧からグループをハイライトし、情報を変更して[変更]ボタン、もしくは[削除]ボタンを 押します。 データセットに戻っても、変数として追加されるわけではなく特に見た目上の変化はありません。しかし [分析] >> [カスタム テーブル] >> [カスタムテーブル] を選択すると、多重回答グループアイコンと共に、新たに[ 使用している機能 [$機能] ]と いう項目が追加されています。
  • 12. SPSS Statistics Small TIPS より効果的にご利用いただくために 12/12 ? IBM Corporation 2017. All Rights Reserved. ワークショップ、セッション、および資料は、IBM またはセッション発表者によって準備され、それぞれ独自の見解を反映した ものです。それらは情報提供の目的のみで提供されており、いかなる参加者に対しても法律的またはその他の指導や助言 を意図したものではなく、またそのような結果を生むものでもありません。本講演資料に含まれている情報については、完 全性と正確性を期するよう努力しましたが、「現状のまま」提供され、明示または暗示にかかわらずいかなる保証も伴わな いものとします。本講演資料またはその他の資料の使用によって、あるいはその他の関連によって、いかなる損害が生じた 場合も、IBM は責任を負わないものとします。 本講演資料に含まれている内容は、IBM またはそのサプライヤーやライセン ス交付者からいかなる保証または表明を引きだすことを意図したものでも、IBM ソフトウェアの使用を規定する適用ライセン ス契約の条項を変更することを意図したものでもなく、またそのような結果を生むものでもありません。 本講演資料で IBM 製品、プログラム、またはサービスに言及していても、IBM が営業活動を行っているすべての国でそれら が使用可能であることを暗示するものではありません。本講演資料で言及している製品リリース日付や製品機能は、市場 機会またはその他の要因に基づいて IBM 独自の決定権をもっていつでも変更できるものとし、いかなる方法においても将 来の製品または機能が使用可能になると確約することを意図したものではありません。本講演資料に含まれている内容は、 参加者が開始する活動によって特定の販売、売上高の向上、またはその他の結果が生じると述べる、または暗示すること を意図したものでも、またそのような結果を生むものでもありません。 パフォーマンスは、管理された環境において標準的 な IBM ベンチマークを使用した測定と予測に基づいています。ユーザーが経験する実際のスループットやパフォーマンスは、 ユーザーのジョブ?ストリームにおけるマルチプログラミングの量、入出力構成、ストレージ構成、および処理されるワークロ ードなどの考慮事項を含む、数多くの要因に応じて変化します。したがって、個々のユーザーがここで述べられているものと 同様の結果を得られると確約するものではありません。 記述されているすべてのお客様事例は、それらのお客様がどのように IBM 製品を使用したか、またそれらのお客様が達成 した結果の実例として示されたものです。実際の環境コストおよびパフォーマンス特性は、お客様ごとに異なる場合があり ます。 IBM、IBM ロゴ、ibm.com、SmarterPlanet アイコンは、世界の多くの国で登録された International Business Machines Corporation の商標です。他の製品名およびサービス名等は、それぞれ IBM または各社の商標である場合があります。 現時点での IBM の商標リストについては、www.ibm.com/legal/copytrade.shtml をご覧ください。 Microsoft, Windows, Windows NT および Windows ロゴは Microsoft Corporation の米国およびその他の国における商標で す。