Money Forward Developers Blog

株式会社マネーフォワード公式開発者向けブログです。技術や開発手法、イベント登壇などを発信します。サービスに関するご質問は、各サービス窓口までご連絡ください。

20230215130734

NLP2026に参加してきました!

Money Forward Labでリサーチャーをしている山岸(@hargon24)です。この記事では、私が聴講参加した言語処理学会第32回年次大会(NLP2026)の参加報告をします。

NLP2026について

言語処理学会の年次大会は、自然言語処理(NLP)の研究者・技術者が集まって研究発表や議論、懇親などを行う国内最大規模のイベントです。 今回は栃木県宇都宮市のライトキューブ宇都宮にて、2026年3月9日から13日にかけて行われました。

参加者数は2,300人以上、発表794件と、どちらも歴代最多の規模だったそうです。

私は発表の聴講と懇親を目的に、9日から12日までの4日間参加しました。

NLP2026の看板

気になった発表

本当にさまざまな発表があり、絞りきれないのですが、特に気になったものをいくつか挙げてみます。 (著者名は敬称略とします)

会計不正検知におけるテキスト情報の役割

著者: 矢野 直 (名市大/矢野公認会計士事務所), 小川 泰弘 (名市大)

概要

有価証券報告書などの財務開示文書から企業の会計不正検知を行う研究において、テキスト情報と数値情報を併用することで精度が上がることは知られているが、テキスト情報が不正検知で果たしている役割は明確ではなかった。本研究では、それぞれを単独で用いる場合と組み合わせて用いる場合を検証し、回帰を用いる場合にはテキスト特徴量のみを用いる場合の方が性能が高いことを示した。

感想

数値情報よりもテキストの方が有効な場合があることは意外でした。主著者の方は長年監査業務をされてきた公認会計士さんです。ポスター発表で伺った限りでも、今回の発表に限らず業務経験に基づく分析観点がさまざまあるように感じました。当社でも会計情報を扱っていることから、こうした分野の研究が増えることを願っています。

大規模言語モデルの探索型デコーディングにおける予算制約に整合的な探索戦略

著者: 宮本 空, 大葉 大輔 (科学大), 岡崎 直観 (科学大/産総研/NII)

概要

LLMの生成時に、複数の生成案を比較しながら生成することで生成文の質を高められることが知られている。本研究では探索の条件として消費トークン数や計算時間などの"予算"を導入し、予算の範囲内で探索を行う手法を提案している。予算の残数に応じて幅優先探索から深さ優先探索へと移行できているなども確認し、予算内で精度を高められることがわかった。

感想

実応用では予算の概念は重要だと思っています。探索木を広げる過程で、探索空間の多様性を担保するためのパラメータが組み込まれているところも、個人的にお気に入りです。

飲食店名は何を語るか:価格と評価に関わる n-gram 特徴量の分析

著者: 北野 由香利, 林 克彦 (東大), 上垣外 英剛 (NAIST)

概要

アメリカの5州の飲食店の店名を対象に、店名に含まれる単語とその店舗の価格帯やユーザ評価との関係を調べた。高価格・高評価な店舗は地域の食文化を表した語が多く、低価格・低評価な店舗はどの州でも現れやすい語やチェーン店名などの固有名詞が多い。

感想

LLMを用いた研究が全盛の中、n-gramをベースとしたシンプルな手法が印象的でした。店名の平均単語数は3, 4単語らしいのですが、その短文でもシンプルな手法で特徴が見られたのはとても面白いと思います。当社でも飲食店や企業の名称を含んだデータを大量に持っていますので、当社のデータで実施したときの傾向を見てみたいです。

hallucination可視化における主観的評価と情報取得の正確性のギャップ

著者: 亀井 遼平, 坂田 将樹 (東北大), 邊土名 朝飛, 栗原 健太郎 (サイバーエージェント/AI Shift), 乾 健太郎 (MBZUAI/東北大/理研)

概要

RAG (Retrieval-Augmented Generation) の出力に含まれるhallucinationを可視化するUIで、UI上に可視化する情報の粒度の差によるユーザの主観的な評価とタスクの達成度の変化を調べた。hallucinationに該当する部分をその種類ごとに色分けして表示する方法は両方のスコアを高めるが、色分けに加えて参考資料を提示する方法は主観評価のみを改善させた。

感想

いろいろな情報が出される方が安心感(=主観評価)が増す一方で作業の質はさほど変わらない、という結果は直感的にも納得できます。LLMを応用したサービスを考える上で、とても示唆深い結果だと思います。

全体の感想

LLMを作る研究、中身を分析する研究はこれまでと同様にホットトピックでした。今年はそれに加えて、LLMは所与のものだとしてLLMを応用するタイプの研究が増えていたように感じます。従来のNLPタスクだけでなく幅広いタスクも提案されていました。 また、マルチモーダル研究では従来のVLM(Vision-Language Model)に加えて、音声系との融合が進んでいる印象を持ちました。これまで以上にいろんな領域に目を配らなければと感じます。

今回から基本的に全ての発表がポスター形式に移行しました。発表件数がとても多いので一人では見切れませんでしたが、タイトルは大体眺められたと思いますし、それだけでも最新の動向を追う上でありがたいです。また、私はポスター発表で著者と議論することが好きなので、この変更は大歓迎でした。次回は発表側として参加したいです。


Money Forward Labでは、一緒にお金のメカニズムを解き明かすための研究をしてくれる仲間を募集しています。 新卒採用、インターン希望、中途採用など、お気軽にカジュアル面談フォームよりご連絡いただければ嬉しいです。みなさまとお会いできることを楽しみにしております。

新卒採用・インターン: recruit.moneyforward.com

中途採用: recruit.moneyforward.com