学歴・職歴
- 2019年3月:数学の修士課程を修了
- representation theory of quantum groups を研究
- 2019年4月〜2021年7月:データサイエンティスト
- データ分析支援、コンサル
- 2021年8月〜2022年9月:機械学習エンジニア
- 受託、自社SaaS開発、R&D
- 2022年10月〜現在:データアナリスト
- 事業会社でデータ分析
関わった案件(一部)
Webサイト(PC、スマホ)のログデータの分析
- AdobeAnalytics から BigQuery に入ってきたデータを分析
- 100万UU/日、1000万UU/月
- 50万商品
- 機械学習モデルの作成
- 価格の相場予測→商品のソート順に利用
- 商品のCV予測→レコメンドに利用
- LightGBM、catboost、item2vec など
- GitHub でのバージョン管理、共同作業
- A/Bテストの効果検証
- カイ2乗検定など
- サイト利用者の行動の分析
製造業の歩留まり改善
- CMA-ES による数理最適化
活かせる技術
- numpy、pandas などによるデータ分析
- matplotlib、seaborn、plotly による可視化
- Polars や asyncio などによる高速化
- 機械学習や統計モデル
- LightGBM、XGBoost、catboost
- item2vec
- Field-aware Factorization Machines (FFM)
- ランダムフォレスト、SVM、線形回帰、Lasso、Ridge、ロジスティック回帰、LOWESS、……
- 数理最適化
- CMA-ES
- BERT や spaCy、GiNZA による自然言語処理 (NLP)
- VGG16 を用いた画像処理(異常検知)
- streamlit によるアプリ化
- MLflow
- Optuna などによるハイパーパラメータチューニング
- Docker、pipenv、conda などのコンテナ、仮想環境
- Rによる共分散構造分析 (SEM)
- git (GutHub、GitLab、CodeCommit)
- データベース、DWH:BigQuery、Snowflake、RedShift、Azure Synapse Analytics、PostgreSQL など
- Azure Data Factory (ADF)
- Tableau (Desktop、Server)
- Excel マクロ
- Google Cloud の Professional Data Engineer (PDE) を勉強中(2023年7月に取得予定)
以下は業務外
- Django、Flask、FastAPI
- Kotlin
- Flutter
- Rust
- JavaScript
- Java
- Haskell
など
資格
- 2018年10月 応用情報技術者試験 (AP)
- 2019年10月 情報処理安全確保支援士試験 (SC)
- (試験だけで登録セキスペではない)
- 2022年10月 データベーススペシャリスト試験 (DB)
など