71. データ分析における「品質を考える会」 ~ 品質はコミュニケーション ~
2023年06月25日
内容紹介
ブレインパッドのデータサイエンティストである川崎さん、中道さんと品質について語りました
出演者
感想などは白金鉱業.FMのハッシュタグ #白金鉱業fm につぶやいてもらえるととても喜びます!
匿名でのお便りもgoogle formにてお待ちしております!
—
目次
- 00:27〜:ゲスト紹介
- 04:24〜:品質を考える会とは
- 08:37〜:そもそも品質ってどうやって担保するんですかね?
- 12:10〜:データサイエンス分野のテストについて
- 20:00〜:要望、要求、要件について
- 31:15〜:品質はコミュニケーション
- 46:32〜:判断と決断の違い 決断のコツ
- 52:17〜:アウトロ
- 余談:盛り上がりすぎて収録後に1時間のオフレコ延長戦をしました
※ podcastの各プラットフォームでは下記詳細が見切れることがあります。
その場合は白金鉱業FMホームページをご参照ください。
00:27~:ゲスト紹介
- 川崎さん
- Doors オフィシャルブログ:機械学習プロジェクトの実地検証&開発フェーズを推進するポイント
- 新卒のときに書いた書籍:現場で使える!Python深層強化学習入門 強化学習と深層学習による探索と制御
- 中道さん
- Doors オフィシャルブログ:【シリーズ】リスキリング×データサイエンティスト CASE2:中道亮介
04:24〜:品質を考える会とは
- 川崎さんと中道さんの雑談から始まった活動
- 品質担保のノウハウを継続的にためて体系化していきたい
08:37〜:そもそも品質ってどうやって担保するんですかね?
- 分析における品質は集計・可視化→PoC→システム運用の順で品質のレベルを上げなければいけない=考えることが増えていく
- まずは「正しい状態がどういう状態かを言語化する」「テストしやすい状態にする」
12:10〜:データサイエンス分野のテストについて
- テストを書きたくなりがちだけれど、まずは処理ごとに出力結果を目視で確認しよう
- とはいえ将来的に新しいデータを処理するケースは定型的なテストを書いて品質担保を図る
- 「1回限りの分析のデータマートに対する品質担保」と「継続的な運用を見据えた品質担保」は求められるレベルが異なる
20:00〜:要望、要求、要件について
- 要望:〜したい。望んでいること、目的
- 要求:〜してほしい。要望に沿って具体化したもの ※ 要求する側が間違えていることもある
- 要件:〜でよいか。要求を実現するために決めること
- 要件に対しての正しさは例えばデータマートの品質担保=テストで満たせる
- そもそもの話として「要望から真にしたいことに対する要求のすり合わせ」が必要
- PoCとシステム運用の考え方の違い
31:15〜:品質はコミュニケーション
- クライアントと要件を握るためのコミュニケーション
- PMとメンバーで品質観点を合わせるためのコミュニケーション
- 人を信じてタスクを疑う:65. 分析PM Three Essentials WITH Moe Uchiike
- 品質を確認する粒度を徐々に大きくしていく
- ウォーターフォール開発におけるV字モデル
- 設計時=分析開始時に「分析結果の中間ファイルを出力する」というコミュニケーションをメンバーとする
- 手戻りが少なくなるコントロールが大事
46:32〜:判断と決断の違い 決断のコツ
52:17〜:アウトロ
- 余談:盛り上がりすぎて収録後に1時間のオフレコ延長戦をしました