ポジティブに生きていく

長い文章を書く

yo

※執筆途中なので後ほど加筆予定 この記事は、Kogakuin Univ Advent Calendar 2019 - Adventar 9日目の記事です。


はじめに

社会に飲まれて記事を更新してなかったです。お久しぶりです。 昨年の記事で主催するのは最後と書いてましたが、今年も開催されるあたりこの辺の感度が高い人がまだ大学にいることを嬉しく思ってたりします。5年目ですね。

さすがに卒業生が主催ってのもどうかって考えもあるので私が開くのは今年が最後かな. summer-art.hatenablog.com

今何やっているのか

都内の某社でtoCアプリのデータ分析および機械学習モデルを構築しています。名刺の肩書きは、データサイエンティスト()です。 最近は、21卒や22卒の人になぜか御社はどうなんですか?!と相談されることが多くてどこまで詳しく話すか迷っています。

そんなことで喜ばれる

データ分析を生業としていると書きましたが、そんな高度なことをしたのは入社してから片手で数えるぐらいで、それ以外は本当に単純なことしかしていません。 例えば、弊社ではアプリのログがBigQueryに保存されているため、このBigQueryから営業や企画が必要なデータを抽出するためにクエリを書く作業、BIツールであるタブローのレポート作成やスプレッドシートからBigQueryのクエリを定期抽出できるデータコネクタを用いたツール作成などをしています。

本当に単純な集計と可視化が中心で仮説ベースでしっかりと分析したことはほとんどないです。


機械学習やりたい人は多いのですが、基本的に機械学習はあくまで手段の一つであってそれが目的ではない。 解決したい問題がないのにデータ分析もモデリングをやりたいのは正直、気持ちはわかるけど仕事ではあまり意味ないです。 結局、問題ベースで行動しないといけないのです。(弊社のML職でも、この辺勘違いしてる人が多くて辛い)

先にストーリーが決まっている

上が定めたストーリーに対する裏付けでデータ分析することが多少ある。本来ならばストーリーを決める段階でデータ分析が介入すべきなのに、そこがなっていない。経験則の方がまだまだ多いことを痛感する。(スピード感や経験則もバカにはできないですがモヤモヤする) 施策をするにしても、その施策がどの程度いけてるかの定量的分析をせめてしてほしい。

データ出し業務

データサイエンティストと響はいいが、会社によってその業務は異なる。例えば、データベースから必要な条件でフィルターしたデータ抽出のためのクエリを無限に書き、分析とは程遠い人もデータサイエンティストを名乗っている。 弊社でも、クエリを書けない関係部署からのデータ抽出依頼が引っ切り無しにやってくる。BIツールで定常レポート化をするけど、そこじゃカバーできない内容がどんどん降ってくる。 なので、データサイエンティストになりたい人は騙されず実際に希望社の社員と話して具体的な業務やその割合を効くと良い。人事は詳しく知らないから。。

ギャップを超えて

データサイエンティストの魅力は、輝かしい分析や泥臭い分析を行なって、意思決定に携われるのが魅力。ただし、意思決定にどこまで携われるかは会社次第。下手したらあらかじめ決まった意思決定の裏付けとしてデータを出力する機械となる可能性もある。また、裏付けしたデータをスルーされることもある。なので、文化や人は本当に重要だけど残念なことにそれは外側からは見えにくい。

ポジティブ目も一応しておくと、データ分析においてデータ品質と環境は非常に重要である。幸いにもこの辺りは整備されており、配属すぐにデータ分析を行うことができる。上のようなことを書いたが、自分の精神が強いならば意思決定にも携われるし、仮説から分析・検証まで一貫して行うこともできる。なので、その辺りは恵まれている。

おわりに

絶望を迎えながらも割とやっていってる。前述にも明記したが、そんなことで喜ばれる世界がたくさんある。本当にこれで給料をもらっていいのかみたいな世界もある。ただ、若いうちは成長>給与だと思ってるのでそんなぬるま湯に一生浸かってるとやばいって気持ちが共存してぐちゃぐちゃになったのがこの一年だった。

昨年は修論で死んだ目をした魚になってたが、今は仕事がこんな状態だから死んだ目をした魚になっている。 それでも生きようと努力する。

この記事は、ナナヲアカリのライブ後に飲酒した人が書いてるので多少適当なので、まともな状態になったら加筆予定です。