kaggle関連(機械学習全般)のリンクをなんでも書いていくページ。迷ったら書いてOK。新しいのを上に追加していく(記事の日付順でなく、見つけた順でOK)。
コンペティションサイト
時期によっては、手頃なコンペがKaggleで開催されていないこともあります。その際には、次のようなKaggle以外のプラットフォームも検討すると良いでしょう。日本発のサイトの場合、言語が日本語でも記載されているため取っつきやすいかもしれません。その他、「KDD CUP」などの学会併設のコンペや、企業が独自に開催するコンペもあります。
| リンク | 備考 |
|---|---|
| SIGNATE | 日本語 |
| ProbSpace | 日本語 |
| Nishika | 日本語 |
| atmaCup | 日本語 |
| Solafune | 日本語 |
| DrivenData | 英語 |
| Topcoder | 英語 |
| AIcrowd | 英語 |
| 2020年に学会コンペに3つ参加したので感想など | |
| Kaggleの「おすすめコンペは何?」への答えを考えた |
日々の情報収集
| リンク | 備考 |
|---|---|
| Weekly Kaggle News - substack | 日本語でKaggle関連の話題を取り扱っているニューズレター |
| Weekly Kaggle News - archive | Archive |
| twitter Kaggle リスト | twitterのkagglerリスト |
イベント
Kaggle Meetup Tokyo
| リンク | 備考 |
|---|---|
| https://www.youtube.com/watch?v=2RydQQDeIGU | Kaggle meetup 2023の配信動画 |
| https://togetter.com/li/2265790 | Kaggle meetup 2023の toggeter |
| https://connpass.com/event/105298/presentation/ | Kaggle meetup #5の資料 |
| https://www.youtube.com/playlist?list=PLkBjLQIGEjJlciM9lEz1AsuZZ8lDgyxDu | Kaggle meetup #4の動画プレイリスト |
| http://yutori-datascience.hatenablog.com/entry/2018/05/14/113131 | Kaggle meetup #4の資料が沢山 |
| http://yutori-datascience.hatenablog.com/entry/2017/10/29/205433 | Kaggle meetup #3の資料が沢山 |
| Kaggle Meetup2 | Kaggle meetup #2の資料 |
| Kaggle Meetup1 | Kaggle meetup #1の資料 |
Kaggle Advent Calendar
分析コンペLT会
| リンク | 備考 |
|---|---|
| 第3回分析コンペLT会 | |
| 第2回分析コンペLT会 | |
| ニッチな分析コンペLT会 | |
| 分析コンペLT会 |
その他
| リンク | 備考 |
|---|---|
| ML Study #3「機械学習コンペ」 , YouTube |
コンペ全般
| リンク | 備考 |
|---|---|
| Kaggle Past Solutions , | |
| KaggleDB , | |
| Tips for data science competitions | Owenさんの超有名スライド |
探索的データ分析
| リンク | 備考 |
|---|---|
| Advanced exploratory data analysis (EDA) with Python |
交差検証
| リンク | 備考 |
|---|---|
| Cross Validationはなぜ重要なのか | |
| validationの切り方いろいろ(sklearnの関数まとめ) | |
| CPCV(Combinatorial Purged Cross-Validation)法 | |
| 時系列データのvalidationに関する質問に回答します |
特徴量エンジニアリング
アルゴリズム
勾配ブースティング決定木
| リンク | 備考 |
|---|---|
| LightGBM | |
| 勾配ブースティングで大事なパラメータの気持ち | |
| 有名ライブラリと比較した LightGBM の現在 | |
| lightgbm カテゴリカル変数と欠損値の扱いについて+α | |
| CatBoost | |
| XGBoost |
ニューラルネットワーク
不均衡データ
| リンク | 備考 |
|---|---|
| 私のブックマーク:不均衡データ分類 |
アンサンブル
| リンク | 備考 |
|---|---|
| KAGGLE ENSEMBLING GUIDE | kaggler御用達のアンサンブル手法について紹介。2022年現在閲覧できない状況になっている(アーカイブ ) |
| 黒魔術への招待:Neural Network Stacking の探求 |
自然言語処理
画像認識
音
| リンク | 備考 |
|---|---|
| HuggingSoundによる音声認識モデルのfine-tuning | |
| 鳥コンペ三部作についてざっくり振り返りたい |
推薦
| リンク | 備考 |
|---|---|
| 推薦システム実践入門――仕事で使える導入ガイド , 書評 | |
| recsys-python |
強化学習
| リンク | 備考 |
|---|---|
| 2020年のKaggle強化学習コンペティションとか強化学習フレームワークをざっと紹介 | |
| シミュレーションコンペで強化学習を始める時のTips | |
| ゼロから作るDeep Learning ❹ 強化学習編 | 書籍 |
環境構築
計算資源
実験・コード管理
体験記
GrandMaster・Master
メダル・Expert獲得
その他
| リンク | 備考 |
|---|---|
| 対談!Kaggle Grandmasterの仕事とは【DeNA TechCon 2022】 | |
| Kaggle スキルのビジネス活用 | |
| Kaggle Expert(銅2)は転職で役に立つのか | |
| CompetitionだけではないKaggleの魅力 | |
| 【Kaggle挫折しそうな方向け】AtCoderのススメ |