こんにちは。 Money Forward Lab 研究員 森田大樹です。
マネーフォワードには、データ活用を目的とした研究組織『Money Forward Lab』があります。 今回、研究に活用できそうな技術や先端の機械学習技術を調査するために、ACMLという国際会議に参加してきました。 その様子をレポートします。
学会名
Asian Conference on Machine Learning (ACML) http://www.acml-conf.org/
開催日時
11月17日[日]〜11月19日[火](来年も11月開催)
開催場所
名古屋 WINC AICHI (来年はタイ・バンコク !)
対象領域
機械学習系の基礎技術及びそのアプリケーション (今回はアプリケーション系の成果が46%を占めていたそうです)
プログラム
こちらをどうぞ:http://www.acml-conf.org/2019/program/
概要
主にアジア・オセアニア領域の研究者が集う機械学習系国際会議です。 今回の記事では主にBest Student Paperの内容をご紹介しますが、取り扱う課題・手法・データは多岐に渡っており、満遍なく知見を得られる学会だったと思います。
ちなみにBest Paperは名古屋の能楽堂での発表。 人生初の能楽堂が学会発表とは思いませんでした。
Best Student Paper
ある「状態」で何かしらの「行動」をする度に「報酬」が貰えなら、その報酬が沢山貰えるような「方策」を発見したくなる。 そのような方策を自動で発見できたら尚更嬉しい。 強化学習と呼ばれるアルゴリズムです。 今回のBest Student Paperは強化学習についての発表でした。 http://www.acml-conf.org/2019/conference/accepted-papers/116/
報酬を決めるための基本的な要因が「状態」と「行動」ですが、取りうる状態の数と行動の数が増えるにつれて、考えられる方策の数も膨大に増えていきます。
これでは計算コストがどんどん増えていきそう。ということで「状態と行動の組み合わせの数が少なくなれば嬉しい」ということになります。
この研究では状態と行動のペアからなる「クラス」という概念を導入することにより、その組み合わせの数を減らす工夫を入れています。これによりまず学習速度の向上が期待できます。
もう少し詳細にこの論文の貢献を説明しますと、
まず 強化学習の基本モデルである「状態・行動・報酬及び遷移確率」で定義されるマルコフ決定過程と同値な「クラス・報酬・遷移確率」で定義されるモデルを構築します。
新しいモデルを構築しても学習できなければ意味がないのですが、この論文では新モデルに対しても適用できる「C-UCRL」という学習アルゴリズを開発します。こちらがまず一つ目の貢献。
最後にクラスが既知の場合には解析的に、未知の場合には数値的にregretを評価し、既存の学習アルゴリズムよりもregretが小さいという結果を出しています。
なお、クラスが未知すなわちモデルが未知の場合であっても「ApproxEquivalence」というアルゴリズムによりクラスを推定することができます。この手法もこの論文で開発されたもの。
まさにいたれりつくせりな感じです。
私的、参加して良かったこと
学会に受理された論文はWeb上でも閲覧できます。 http://www.acml-conf.org/2019/conference/accepted-papers/
研究成果を見るだけであれば現地まで行って参加する必要はないのですが、やはり実際に参加すると色々と特典があるなあと思います。
まず人がいます(学生・研究者・企業)。 発表を聞いて気になったことはその場で聞いてしまえるというのがまず分かりやすく良いところです。
また、そういった人が「動いている」という点もとても重要だと考えます。 例えばポスターセッションでは、「各ポスターに均等に人が聞きに来る」ということはまずありません。 ある程度の「人集り」ができるものです。
Abstract及びスピーチセッションを見て「これ、、、魔法?」と思った技術がありました。
ちなみにその技術はドメイン適応についてです。ターゲットドメインに対する知識が全くない(教師ラベルなし)の場合もドメイン適応が可能であるという話でした。 http://www.acml-conf.org/2019/conference/accepted-papers/237/
これは直接話を聞きたいなと思いスピーチセッション後にポスターに向かったのですが、そのポスターの前にはまさに「人集り」。
こういった様子は、アカデミック領域で研究をしている方々にとっても「魔法」つまり「革新的」であったということの根拠になり得ます。 この情報はWebページを見るだけでは分からないですね。 「そこに人がいて、さらに動いている」こんなにダイナミックで有益な情報はないと思います。
もう1つ、セッション中の質疑応答で電撃が走る思いをしました。それは、
「なぜ平均・分散以外の高次統計量使わないのか?」(おそらく3次以上のモーメントのこと)
という質問。これには私は強い刺激を受けました。
データの分布を見るために平均と分散を使うというのは最も良く行われる方法であり、これら2つはあまりにも「御馴染み」なのです。(この御馴染みというのがポイント)
私程度の研究者は、正直発表を聞いて目的と結論を逃さないことだけで精一杯。基本「御馴染み」は重要度を極端に下げてしまいがち。
「物事をフラットに見る」
この難しさ。
これができるのは、「専門の知識と興味そして心の余裕を持ち、頭をフル回転させながら話を聞く」ことが必要だと考えています。
聞き手としてのレベルの高さを感じます。そういった人にいつかなれるのでしょうか。
終わりに
結論、参加して非常に良かったです。 レベルの高い学会であったと感じます。
「研究、頑張ろう」 という気持ちに落ち着いてしまうわけですが、参加前後では私の頭に入っている情報は全然違います。 発表内容は正直数割しか理解できていないでしょうが、「自分の研究に使える・使えない」のふるいには掛けられていますし、「この研究者の成果はこれからも追っていこう」といった発見もあります。
また頭の中には「学会の熱」が記憶としてあるわけです。 ただその熱もきっと少しは冷めてしまう。人間だから。 幸いなことに、感性を刺激するような学会が他にも沢山あります。 だからまた学会に参加すればいい。発表することも、もちろん目標に入れて。
--
マネーフォワードでは、エンジニアを募集しています。 ご応募お待ちしています。
【採用サイトのご案内】 ■マネーフォワード採用サイト ■Wantedly
【プロダクトのご紹介】 ■お金の見える化サービス 『マネーフォワード ME』 iPhone,iPad Android
■ビジネス向けバックオフィス向け業務効率化ソリューション 『マネーフォワード クラウド』