BigQuery に Twitter のツイートを流し込み始めました
さらに過去の自分から見えるツイートも取り込みました。
これで、例えば、誰が「おっぱい」とよく言っているのかもすぐに分かります。
SELECT screen_name,COUNT(*) as cnt
FROM `project.source.my_timeline`
WHERE `text` LIKE '%おっぱい%'
GROUP BY screen_name ORDER BY cnt DESC
LIMIT 30
2009年度からのデータだと以下のようになりました
クエリ完了(経過時間: 1.4 秒、処理されたバイト数: 399.9 MB)
速い!
そして、ymsrさん言い過ぎ・・・
同様に「おっぱい」と呟かれるのが多い日は?
SELECT FORMAT_DATETIME("%F", at_created) as the_day, COUNT(*) as cnt
FROM `project.source.my_timeline`
WHERE `text` LIKE '%おっぱい%'
GROUP BY the_day ORDER BY cnt DESC
LIMIT 30
日時 | 回数 |
2017-06-30 | 15 |
2011-01-19 | 15 |
2011-03-13 | 12 |
2011-07-25 | 11 |
2011-08-21 | 11 |
2011-04-23 | 11 |
... | ... |