クリスマス?なにそれ美味しいの?実際どーなのよ?調査してみた
@hashimomaru
調査背景
• Buztterを拝見中、「クリスマス」のワードが上位に上がっている・・・
• 実際、twitterユーザの皆様は「クリスマス」をどのように感じているのか調査したくなった
⌒ヽ / / |_ノ ∠_____________/ .|
/\ \ | |.\\ \ | |
○ / \\ \ | //> / / \\ \ , "⌒ヽ /
/// ./ / .\\ \ i .i ././\\\ / / \\ \ .ヽ、_ノ /
/ .\\ ./ / ∧∧ \\ \ .| /\ \\ ./ .(・ω・) /.\\ \ | / /\ \\ ∪ ノ ' \\ \ .| /| ./
o .\ \\⊂ノ / \\ \ | / | /"⌒ヽ . \\/ \\ \| / | /
i i \\ ○ _\\/|/ | ./○ヽ_.ノ .\ \\ _,. - ''",, - ̄ _| /
\ \\_,. - ''",. - '' o  ̄ .|/\ \\ ''  ̄ヘ _/ ̄ ̄ ̄ ̄ ̄
○ \ \\//。 \ そろそろ゚ o 。 .\ \/ | クリスマスか・・・。  ̄ ̄ ̄ \__________
調査目的
• 「クリスマス」に対してのユーザの印象、感情の変化を調査し、「クリスマス」が美味しかったのか検証する
☆|\
☆ ∴∴∴,ィ‰、 (´・ω・`) <ところで、クリスマスって美味しいの?ノ☆从、 //\ ̄ ̄旦~ノノノ人∂ // ※.\___\''⌒┃⌒`゛\\※※※※※ヽ田 \`ー──────ヽ
────────
クリスマス?なにそれ美味しいの?実際どーなのよ?
①コンテンツの収集
日本語評価極性辞書
p/n判定
②評価情報の抽出
センチメント分析
感情表現辞書
解析対象切り分け
コンテンツDB
③評価極性,感情表現の出現数を正規化
-1.5
-1
-0.5
0
0.5
1
1.5
19 20 21 22 23 24 25 26 27
喜
調査方法と手法
• 調査期間– 2010年12月16日~28日
• 調査対象– “クリスマス”を含む投稿
①コンテンツの収集
• Twitter Search API を利用
–詳細
• http://watcher.moenifty.com/memo/docs/twitterAPI49.txt
• 使用例– http://search.twitter.com/search.atom?q=“クリスマス”
–特徴
• 最大使用数:twitterのトラフィック状況に依存– APIの使用制限を増加できるWhiteListの適応対象外
• オプション付加で最大直近の1500件まで取得可能
②評価情報の抽出
• p/n判定
– コンテンツを肯定的/否定的に分類する手法
• 肯定極性と否定極性=評価極性に分類
–日本語評価極性辞書を使用
• センチメント分析
– コンテンツの感情を抽出する手法
• 喜・怒・哀・怖・恥・好・厭・昂・安・驚の10種類の感情表現に分類
–感情表現辞書を使用
③評価極性,感情表現の出現数を正規化
• 抽出した評価極性,感情表現の抽出数を正規化し,その変化の値を見る
その他細かいこと
• 別途、うp予定
/)///)
/,.=゙''"// i f ,.r='"-‐'つ____ こまけぇこたぁいいんだよ!!
/ / _,.-‐'~/⌒ ⌒\/ ,i ,二ニ⊃( ●). (●)\
/ ノ il゙フ::::::⌒(__人__)⌒::::: \,イ「ト、 ,!,!| |r┬-| |
/ iトヾヽ_/ィ"\ `ー'´ /
調査結果
①日毎の投稿数の推移– 期間中の取得した投稿数の推移– +RT(QT)を含むコンテンツの取得推移
②調査期間中の一日ごとの1. p/n判定結果の推移2. センチメント分析結果の推移
③イブ~クリスマスの1時間ごとの1. p/n判定結果の推移2. センチメント分析結果の推移
0
5000
10000
15000
20000
25000
30000
35000
40000
18 19 20 21 22 23 24 25 26 27 28
count
RT_count
調査結果①投稿数の推移ほぼ投稿数は毎日同じなぜかイブとクリスマスは少なかったクリスマスはあまりRetweetされないらしい
調査結果②.1p/n判定結果の推移
-3
-2.5
-2
-1.5
-1
-0.5
0
0.5
1
1.5
19 20 21 22 23 24 25 26 27
positive
negative
24日にnegativeが逆転・・・やはり。
p/n判定が上手くできていない。はず。
調査結果②.1p/n判定結果の推移
• 結果–イブ前日まで ポジテイブ > ネガティブ
–イブ~クリスマス ポジテイブ < ネガティブ
• 考察–イブ~クリスマスではネガティブな発言が多かった、これはry
–とりま、p/n変化が少なく、クリスマスは美味しいのか分からなかった
そこで、センチメント分析
調査結果②.2センチメント分析結果の推移
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
3
19 20 21 22 23 24 25 26 27
Z-score
喜
怒
哀
怖
恥
好
厭
昂
安
なるほど。分からん。なので、レーダーチャートで失礼します
-2
-1
0
1
2
3喜
怒
哀
怖
恥好
厭
昂
安
19日
19日結果:クリスマスまで,あと6日・多かった感情: “怖”,“好”, “安”<考察・感想>まだ日にちもあるので、みんな安心していた様子
-2
-1
0
1
2
3喜
怒
哀
怖
恥好
厭
昂
安
19日
20日
20日結果:クリスマスまで,あと5日・多かった感情: “怒”,“好”<考察・感想>好き嫌いが分かれたようです
-2
-1
0
1
2
3喜
怒
哀
怖
恥好
厭
昂
安
20日
21日
21日結果:クリスマスまで,あと4日・多かった感情:---<考察・感想>いわゆる中だるみ
-2
-1
0
1
2
3喜
怒
哀
怖
恥好
厭
昂
安
21日
22日
22日結果:クリスマスまで,あと3日・多かった感情:---<考察・感想>いわゆる中だるみ②
-2
-1
0
1
2
3喜
怒
哀
怖
恥好
厭
昂
安
22日
23日
23日結果:クリスマスまで,あと2日・多かった感情:“喜”,“哀”, “昂”<考察・感想>・・・。リア充 vs. 非リア充の開始か?
-2
-1
0
1
2
3喜
怒
哀
怖
恥好
厭
昂
安
23日
24日
24日結果:クリスマスまで,あと1日・多かった感情:“喜”, “怒”, “怖”, “恥”,“好”, “厭”<考察・感想>
リア充 vs. 非リア充で差が?この日は泣きそうだったなー。
-2
-1
0
1
2
3喜
怒
哀
怖
恥好
厭
昂
安
24日
25日
25日結果:クリスマス・多かった感情: “怒”,“恥”<考察・感想>怒と恥は忘れない
-2
-1
0
1
2
3喜
怒
哀
怖
恥好
厭
昂
安
25日
26日
26日結果:クリスマスが終わって1日目・多かった感情:---<考察・感想>さすが日本人w切り替え早い!大事!
-2
-1
0
1
2
3喜
怒
哀
怖
恥好
厭
昂
安
26日
27日
26日結果:クリスマスが終わって2日目・多かった感情:“喜”,“安”<考察・感想>聖戦終了に歓喜と安堵の声が!!!
調査結果②.2センチメント分析結果の推移
• 結果まとめ– 23日~25日の感情の変化が著しい
– 26日以降,変化は全体的に減少,しかし“喜”,“安”は増加
• 考察– 23日以降、感情が爆発したと推測
• ウキウキ気分な人↑ orzな人↓
– クリスマスは美味しかったのか?• 美味しかった人は美味しかったのでしょう
③イブ~クリスマスの1時間ごとの
1. p/n判定結果の推移
2. センチメント分析結果の推移 を調べてみた
/ ̄\__0⌒> ヽ
/ ∩⊂ニニニ⊃∩/ | ノ ヽ| / ● ● | メリークリクマース!| | ( _●_) ミ| 彡、 |∪| 、`\| / __ ヽノ /´> )\ (___) / (_/\ | / ̄ ̄| /\ \
| / ) )∪ ( \
\_)
イブ~クリスマスの1時間ごとのp/n判定結果の推移
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
3
0 2 4 6 8 10 12 14 16 18 20 22 0 2 4 6 8 10 12 14 16 18 20 22
positive
negative
24日 25日
21時にポジティブが増加!サンタさんくるおー?
ポジティブ増加クリスマス終盤で、次への切り替えか?
イブの朝は辛い?
イブ~クリスマスの1時間ごとのセンチメント分析結果の推移
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
0 2 4 6 8 10 12 14 16 18 20 22 0 2 4 6 8 10 12 14 16 18 20 22
喜怒哀怖恥好厭昂
厭→怒→昂→厭
怒→怖→恥
哀&昂昂
哀→安
怒→恥→喜
好→恥→安&好
恥&安→厭&怒
24日 25日
いわゆる例のあれ
今回のまとめ
• p/n判定とセンチメント分析により,「クリスマス」に対する評価と感情の推移を調査した
• 結果より– 全体の投稿数は変化が少なかった– 23日以降,「クリスマス」に対して感情の変化は顕著に現れていた
• クリスマスは美味しかったのか?– 美味しかった人も入れば、美味しくなかった人もいる
感想
• 「クリスマス」はRTされていないことに驚いた
• p/nの変化に相関があるのかも?
• センチメントに着目することで変化を抽出できた– 例のあれの時間における感情の変化は面白かった
☆|\
☆ ∴∴∴,ィ‰、 ( ̄∀ ̄) <ははwワロスw俺もwノ☆从、 //\ ̄ ̄旦~ノノノ人∂ // ※.\___\‘’⌒┃⌒`゛\\※※※※※ヽ田 \`ー──────ヽ
────────
ご覧いただきありがとうございました
ふろく
0
0.5
1
1.5
2
2.5
3
19 20
21 22
23 24
25 26
27
喜
怒
哀
怖
恥
好
厭
昂
安
センチメント分析(3D)
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
0 2 4 6 8 10 12 14 16 18 20 22 0 2 4 6 8 10 12 14 16 18 20 22
喜
怒
哀
怖
恥
好
厭
昂
安
24日~25日:センチメント分析3D
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
喜
怒
哀
怖
恥
好
厭
昂
安
24日:センチメント分析3D
0
0.5
1
1.5
2
2.5
3
3.5
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
喜
怒
哀
怖
恥
好
厭
昂
安
25日:センチメント分析3D
Top Related