Money Forward Developers Blog

株式会社マネーフォワード公式開発者向けブログです。技術や開発手法、イベント登壇などを発信します。サービスに関するご質問は、各サービス窓口までご連絡ください。

20230215130734

NLP2025に参加してきました

Money Forward Lab(以下、Lab)で自然言語処理(NLP)のリサーチャーをしている山岸(@hargon24)です。 この記事では、Labから発表&プラチナスポンサーとして参加した、言語処理学会第31回年次大会(NLP2025)の参加報告をします。

NLP2025とは

言語処理学会の年次大会は、自然言語処理(NLP)の研究者・技術者が年に一度集まって研究発表や議論、懇親会などを行う国内最大規模のイベントです。 今回は長崎の出島メッセ長崎にて、2025年3月10日から14日まで行われました。

参加者2,320名(去年は2,121名)、発表777件(去年は599件)と、どちらも過去最多だったそうです。

スポンサーブース

集合写真。左からケッサイの山内さん、Labの張さん、久井さん、山岸 集合写真。左からマネーフォワードケッサイ株式会社(以下、ケッサイ)の山内さん、Labの張さん、久井さん、山岸。

マネーフォワードはNLP2023からブースを出展しています。気がつけば3年目になりました。 今年も多くの方にお越しいただけたようです。継続して行うことで、当社がNLPに関心があることが徐々に伝わっていると感じます。

今回からノベルティとして配布したサコッシュがとても人気で、会場内で使っていただいている方も数名いました。 当社ノベルティのサコッシュ

また、スポンサーセッションの龍踊り(じゃおどり)も迫力があってよかったです。舞もそうですが、音の迫力もすごかったです。 龍踊りのみなさんが入場しているところ

会場で実施した、「よく使うLLMサービスは?」というアンケートの結果です。119票の回答がありました。圧倒的な支持を集めたのはChatGPT(65票)で、Claude・Geminiがそれに続いています。また、SB Intuitionsさんの組織票としてSarashinaに8票が投じられていました。 会場で実施した「よく使うLLMサービスは?」というアンケート

Labの発表

山岸から1件発表しました。

  • 大規模言語モデルを用いた生成による企業の業種体系の拡張
    • 企業の業種を特定するにあたり、そもそも既存の業種体系では企業の事業内容をカバーしきれない課題がある
      • 製造業や小売業が細かく区分けされている一方、IT系の粒度が粗い。たとえば"Webサイトの制作・運営"を表す業種名がない
      • 更新頻度が低いため、最新の動向に追いつけていない
    • LLMに政府業種と企業のウェブサイトを見せて、「この企業に関連する業種が政府業種にない場合は新しい業種名を生成して」と指示し、業種体系を拡張する

個人的に面白いと思った発表

  • 沿革情報を用いた企業名変遷の構造化
    • 有価証券報告書の企業沿革情報から企業名の変更(会社設立, 社名変更, 分社化, 合併, 清算)の前後関係を推定
    • 社名部分を抽出するNERはLLMを使えば問題なくできるので、関係抽出ができればよい
    • 1社の情報がわかれば解けるラベルは比較的簡単で、他社との関係が必要なラベル(分社化・合併)の推定が難しいとのこと
  • 移動軌跡に関する質問応答データセット
    • 時刻と緯度経度の列に対し、移動手段や近くの建物などをアノテーションしたデータを作り、位置に対する質問応答を行う
    • 与えたデータから座標を抜き出すタイプの質問よりも、平均などの計算を行う必要がある質問が難しいらしい
  • 大規模言語モデルの事前学習用コーパスにおける要配慮個人情報の検出
    • LLMの学習に使うデータセットから個人情報が含まれるページを除くため、LLMでアノテーションしたデータでGBDTを学習
    • ページ推定ではなくスパン推定をして一部だけを除去することは未検証らしいので、これもLLMでアノテーションできるか試してみたい

全体の感想

大学発の研究は、LLMの内部状態を探る研究がものすごく増えていた印象です。 初日のチュートリアルでも、こうした研究の最新動向の解説がありました(スライド)。 チュートリアルの質疑で「内部状態を探ったとして、わかった気になれる以上の何かがあるのか。解釈性研究の先に何を見据えているのかが知りたい」という、いい意味で可燃性の高い問いが提供されていました。個人的にはわかった気になれれば十分嬉しいと思いますが、腰を据えて考えてみたい問いだと思います。

また、企業でもアカデミアでも、団体戦の研究が増えてきていると感じました。 LLM開発は当然として、多くの領域が団体戦に変わっている気がします。プロジェクトに対する賞があってもよさそうです。

企業におけるLLM開発以外の研究は、PDFなどからLLMで情報抽出を行う研究が多かったように思います。 企業の方と話していると、気がついたら「PDFのつらいところ相談会」みたいな状態になりがちでした。 こうした、企業や官公庁に眠っているデータをいかに綺麗にするかが問われていくと思います。こういうデータは当社にも間違いなく存在するので、掘り起こしていきたいところです。

さいごに

2025年4月11日(金)に、東京本社にてNLP2025の振り返りLT会を実施します。みなさまのご参加をお待ちしております。 moneyforward.connpass.com


Money Forward Labでは、一緒にお金のメカニズムを解き明かすための研究をしてくれる仲間を募集しています。

インターン希望の学生さんも大募集中です!
スポンサーブースでも学生さんからインターンに関する質問を受け、都度「インターンをしたい場合は個別に連絡してください」とお伝えしました。"インターン応募はこちら!"のようなフォームが開いていないと応募しにくいかもしれませんが、インターンは通年募集しておりますので、お気軽にご連絡をいただければ嬉しいです。

hrmos.co
recruit.moneyforward.com

中途採用も募集しております。こちらもまずはカジュアル面談から始められますので、お気軽にお声がけください。 hrmos.co