BigQuery に Twitter のツイートを流し込み始めました

さらに過去の自分から見えるツイートも取り込みました。
これで、例えば、誰が「おっぱい」とよく言っているのかもすぐに分かります。

SELECT screen_name,COUNT(*) as cnt
FROM `project.source.my_timeline`
WHERE `text` LIKE '%おっぱい%'
GROUP BY screen_name ORDER BY cnt DESC
LIMIT 30

2009年度からのデータだと以下のようになりました

クエリ完了（経過時間: 1.4 秒、処理されたバイト数: 399.9 MB）

速い！
そして、ymsrさん言い過ぎ・・・

同様に「おっぱい」と呟かれるのが多い日は？

SELECT FORMAT_DATETIME("%F", at_created) as the_day, COUNT(*) as cnt
FROM `project.source.my_timeline`
WHERE `text` LIKE '%おっぱい%'
GROUP BY the_day ORDER BY cnt DESC
LIMIT 30

日時	回数
2017-06-30	15
2011-01-19	15
2011-03-13	12
2011-07-25	11
2011-08-21	11
2011-04-23	11
...	...

時間がUTCなので、若干ずれていますが、大きな地震があった日が呟かれやすそうです。

やや濃厚なソース

プログラミングやゲームについて。

BigQuery に Twitter のツイートを流し込み始めました