やや濃厚なソース

プログラミングやゲームについて。

BigQuery に Twitter のツイートを流し込み始めました

さらに過去の自分から見えるツイートも取り込みました。
これで、例えば、誰が「おっぱい」とよく言っているのかもすぐに分かります。

SELECT screen_name,COUNT(*) as cnt
FROM `project.source.my_timeline`
WHERE `text` LIKE '%おっぱい%'
GROUP BY screen_name ORDER BY cnt DESC
LIMIT 30

2009年度からのデータだと以下のようになりました

クエリ完了(経過時間: 1.4 秒、処理されたバイト数: 399.9 MB)

速い!
そして、ymsrさん言い過ぎ・・・

同様に「おっぱい」と呟かれるのが多い日は?

SELECT FORMAT_DATETIME("%F", at_created) as the_day, COUNT(*) as cnt
FROM `project.source.my_timeline`
WHERE `text` LIKE '%おっぱい%'
GROUP BY the_day ORDER BY cnt DESC
LIMIT 30

日時 回数
2017-06-30 15
2011-01-19 15
2011-03-13 12
2011-07-25 11
2011-08-21 11
2011-04-23 11
... ...

時間がUTCなので、若干ずれていますが、大きな地震があった日が呟かれやすそうです。