データ分析基盤の他社調査

読んだ日:2023/07/16

著者:メルカリ 

3行まとめ

定量(Audit log)と定性(ヒアリング)でどのデータが使われているかを調査

・業務が目指している成果まで把握して優先順を決める

・会社が実現するべき成果に注目する

技術や手法のキモはどこ?

チームごとに使用しているSQLを調査すること

議論はある?

現状、実現するべき成果まで提案してお膳立てしないといけない

作ったものはメンテナンスしていかないといけない

speakerdeck.com

 

読んだ日:2023/07/16

著者:10X

3行まとめ

・サービスのコア体験を洗い出し、CUJ(クリティカル ユーザー ジャーニー)

APIであれば、サクセスレートと95パーセンタイルレイテンシ

トップダウンで決めて浸透させる


技術や手法のキモはどこ?

サクセスレートと95%パーセンタイルレイテンシに絞って実装を進めていた


議論はある?

「遅すぎて使い物にならない」と感じる時間はどれくらいなんだろう

CoreWebVitalみたいな基準はないのかな

 

speakerdeck.com

読んだ日:2023/07/16

著者:バクラク

3行まとめ

・データの認知負荷、属人化が問題

・1時間に1回のデータ更新

・データカタログはOpenMetaData


技術や手法のキモはどこ?

dbt使っている


議論はある?

アクセス管理などガバナンスはどこも後回しにしているところ多い

speakerdeck.com

読んだ日:2023/07/16

著者:10X

3行まとめ

・あとになればなるほど補記が難しくなる

・dbt-meta-testingを使えばCIでデータ詳細が記載されているかチェックできる


技術や手法のキモはどこ?

仕組み化しているGithubActions


議論はある?

データ詳細もコード管理することが大事、ただめちゃくちゃリポジトリ重くなるので、管理方法は悩む

レビューの際にサジェストしてくれるような機能あるのかな

speakerdeck.com