こんにちは、中塚と申します。
今回の記事では、私が先日参加したKaggle Days x Z by HP World Championship (以降、Kaggle Days Championship) について紹介します。ただし、どれくらいCompetitionの内容に触れていいのかが不明なので、今回はタスクや解法の詳細には触れませんのでご理解願います。
私はチームで参加しましたが、チームメンバに恵まれたこともあり、上海開催ではPublic (暫定順位) 11位 / Private (最終順位) 14位、ニューデリー開催ではPublic 4位 / Private 3位でした!各開催のいずれかで3位以内に入ると、バルセロナのオフラインでの最終開催への参加権を得ることができるので、私はスペインへ行くことができそうです。
Kaggle Days Championshipとは?
Kaggle Days Championshipは、KaggleとLogic AIが主催のMeetupイベントで、オンラインで12開催した後、最終イベントがバルセロナでオフライン開催される予定です。本記事執筆時点 (2021/12) では、2開催はすでに終了しています。参加費用は無料で、各MeetupではKaggle Grandmaster (GM) のプレゼンテーションの後、Competitionが開催されます。上述した通り、各オンラインの開催のいずれかで3位以内に入ると、バルセロナのオフラインでの最終開催への参加権を得ることができます。
各開催のタイムテーブルとしては、大体以下の通りです。
- Opening・GMのプレゼンテーション: 計1-1.5時間程度
- Competition: 4時間
- Closing: 0.5時間程度
以上の通り、Meetupは計6時間近く掛かります。また、仮に3位以内に入賞した場合、その後2時間以内にソリューションの提出が求められます。
下に、公式の告知ビデオのリンクを貼っておきます。
Competitionについて
CompetitionはKaggleのInclass competitionとして開催されます。タスクは開始の10分前くらいに公開されます。チームは最大4人までで、チームを組むデメリットは私が知る限りはないので、できるだけチームを組んで参加することをお薦めします。ソロで参加している場合でも、公式のSlack内でチームメンバを募集できます。
タスクの詳細は開始時間の直前に公開されます。そのため、様々なタスクについてのコードの準備を予めしておかないと、あっという間にCompetitionの時間が終わってしまいます。第1回の上海開催は画像の分類、第2回のニューデリー開催では匿名化されたテーブルデータの回帰がタスクでした。なお、第1回の開催は直前のGMのプレゼンが画像タスクにおけるアプローチに関するもので、実際のCompetitionも画像に関するタスクでしたが、第2回は自然言語処理に関するプレゼンの後、テーブルデータを使ったタスクが行われました。私はプレゼンを聞きながら、大量の事前学習モデルをひたすらダウンロードしていましたが、それらを全く使うことはありませんでした・・・。
いずれの開催でもCompetitionの時間内で試行錯誤ができるようにデータは比較的軽量にはなっているものの、特に画像や自然言語処理では大きなモデルを使って精度が上がることが多いので、計算リソースがある方が有利になるのは否めないと思います。とはいえ、Kaggle NotebookやGoogle Colabで参加しているユーザもいます。いずれにせよ、効率よく実験を行うことが求められているでしょう。
また、ここまでの2開催に参加した限りは、DiscussionやNotebookの公開が盛んな訳ではないので、勉強目的でCompetitionに参加するより、腕試しや楽しむことを目的にして参加することを個人的にはお薦めします。もちろん、GMのプレゼンテーション目的に参加するのも良いと思います。
今後の開催について
本記事執筆時点では、残り10開催あります。既に終了した開催も含めて、下表に日本のタイムゾーンでの開催日時をまとめました。時差は私が調べたものですので、誤りを含む可能性があります。参加を検討する場合はご自身で確認してください。
Location | 開催日 (UTC+9) | 開始時間 (UTC+9) |
---|---|---|
Shanghai | 2021/11/18 (木) | 17:00 |
New Delhi | 2021/12/09 (木) | 19:30 |
Moscow | 2022/01/13 (木) | 22:00 |
San Francisco | 2022/02/18 (金) | 9:00 |
Mumbai | 2022/03/10 (木) | 19:30 |
Beijing | 2022/03/31 (木) | 17:00 |
Tokyo | 2022/04/21 (木) | 16:00 |
New York | 2022/05/13 (金) | 6:00 |
Dubai | 2022/06/02 (木) | 21:00 |
Berlin | 2022/06/23 (木) | 24:00 |
London | 2022/07/15 (金) | 1:00 |
Paris | 2022/08/04 (木) | 24:00 |
いずれも木曜日の現地時間16時開始なので、翌日も仕事や学校がある場合、日本在住の人が常識的な時間に参加できそうなのはものはそこまで多くないのかもしれません。
参加したい場合は、公式ホームページから参加登録を予めしておく必要があります。開催日の3週間前に登録が開始されますが、こちらのページからSubscribeしておくと登録が開始されたときにメールで通知されるので、登録忘れせずに済みそうです。
まとめ
短期間のCompetitionは難しいですが、ハッカソンのような楽しさがあるので、興味が湧けば是非参加してみてください。公式のホームページを見ると、「WORLD CHAMPIONになろう」的なことが書いてあり、開催時間的には少しハードなものが多いですが、なんとなく参加したくなりますよね。
最後に、弊社ではアプリエンジニア、デザイナー、プロダクトマネージャー、データエンジニア、機械学習エンジニアなど募集中です。もしご興味があれば下記のリンクからご応募いただけると幸いです。