Money Forward Developers Blog

株式会社マネーフォワード公式開発者向けブログです。技術や開発手法、イベント登壇などを発信します。サービスに関するご質問は、各サービス窓口までご連絡ください。

20230215130734

Money Forward LabはNLP2023にスポンサーします!発表者情報や、配布ノベルティについて

※コーヒーパッケージのQRコードからお越しの方はこの記事下部からコードを確認できます

こんにちは、Money Forward Labで研究マネージャーをしている うぇるだん(@sk-welldan) です。 マネーフォワードは、3/13から開催されるNLP2023(言語処理学会第29回年次大会)をスポンサーします。

本大会は4年ぶりにオフライン会場も再開し、ハイブリッドでの開催となります。 会場はなんと沖縄!南国沖縄、3月の平均気温は20℃前後と春真っ盛りです。会場や、オンラインでもNLP研究者の皆さんとあったかい交流ができることを楽しみにしております。

Money Forward Labはじめてのスポンサーです

わたしの所属するMoney Forward Lab は、今からちょうど4年前の2019年3月に設立された社内研究組織です。比較的若い組織であることもあって、学会をスポンサーさせていただくのは今回がはじめてです。参加メンバーもはじめての学会へのブース出展にワクワクしながら準備を進めています。

Money Forward LabやLabで働く研究者のことを知りたい知りたい方はこちらのnoteをご覧ください。

note.com

NLP2023発表者と発表内容

マネーフォワードからの発表者は、山岸(@hargon24)と満石(@futo_mitsuishi) です。 会場で配布する予定のパンフレット用の撮影に、すごく照れながらも頑張って協力してくれる心優しいお二人です。会場で見かけたらぜひ話しかけてみてください。

発表①「FAQ チャットボットの誤りタイプの類型化と自動分類の検討」(山岸)

■発表日時・形式 3/15(水) 14:20〜 ポスター発表(Q8-2)

■発表概要 チャットボットの導入組織では、回答用のFAQ集の継続的な改善が重要です。 FAQ集の改善では、既存のFAQ集の内容やサービス機能等を把握して各誤答事例に適した改善策を選定しますが、機能増加等につれて選定が難しくなります。 本研究では、誤答事例の誤りタイプを整理し、各タイプの改善策をまとめました。また、誤りタイプの自動分類に必要な特徴量もまとめ、改善策選定の自動化を検討します。

発表②「トリプレットのBetter Negative Sampling によるTextEmbedding の学習とテキスト分類」(満石)

■発表日時・形式 3/16(木) 11:00〜 ポスター発表(Q11-5)

■発表概要 分類問題を解くには分類器としてfinetuningするのが一般的ですが、クラス数が多いなど特徴的なデータセットの場合はクラスタリングのようにtext embedding+類似度を使う方法もあるのではないか、試してみようという発想から本研究を行いました。 データセットの性質を変えた場合の比較・分類器としてfinetuningした場合との比較は今後の課題ですが、本研究ではtext embedding+類似度を使う手法における精度改善を行いました。

スポンサーブースでお待ちしております

会場内のスポンサーブースでは、マネーフォワードやMoney Forward Labのことがわかる資料やノベルティのオリジナルドリップコーヒー、お菓子などをご用意しています。 また、発表者も空き時間にはブース待機していますので、みなさんの研究内容についても情報交換しに遊びに来てくださいね!

宣伝

ノベルティコーヒーの裏面にはMoney Forward社員の ken11 が作成したコードを載せています。休憩がてら、ぜひ試してみてください。

from transformers import BertJapaneseTokenizer

tokenizer = BertJapaneseTokenizer.from_pretrained("ken11/albert-base-japanese-v1-with-japanese-tokenizer")
ids =  [2, 1194, 12985, 13971, 9, 1847, 1873, 2683, 14, 3588, 18, 8689, 11, 6441, 15, 17, 21, 2716, 8, 74, 1317, 11, 517, 15, 10, 618, 533, 201, 28, 3433, 15, 17, 21, 2716, 8, 3]
print(tokenizer.decode(ids))

使用しているモデルもken11の自作です!

huggingface.co

ちなみに実行すると...(答えが気になる方はこちらをクリック)

マネーフォワードからのラブコールを受け取っていただけるようになっています! hrmos.co

それでは現地でお会いできること楽しみにしております!