清野 輝風/Terukaze Seino

Tohoku NLP Group

プロフィール

東北大学大学院情報科学研究科M1 坂口・乾研究室所属

研究テーマ

大規模言語モデルを用いた抽象推論能力の分析

2024年~

LLMが抽象的な概念をfew-shot学習する際に、得意とする概念および不得意とする概念の傾向について、粒度の高い分析を行いました。

抽象推論 文脈内学習

発表論文

大規模言語モデルを用いた抽象推論能力の分析

清野輝風, 青木洋一,斉藤いつみ,坂口慶祐 | 言語処理学会 | 2025年

人工知能が高度な汎化能力を持つためには,少数の例からパターンを抽出し,新しい入力に適用する抽象推論能力の向上が重要である.しかしながら,既存の大規模言語モデルは未だ十分な抽象推論能力を有しておらず,その能力について詳細な分析が必要である.本稿ではこれらの能力を評価する代表的なデータセットである ARC(Abstraction and Reasoning Corpus)について few-shot 学習を通して実際に解かせ,ARC の各タスクに必要な処理を能力ごとに分解し分類した上で,能力ごとの精度を分析することで大規模言語モデルの抽象推論能力を詳細に評価する.

NLP2025

連絡先

東北大学 大学院情報科学研究科

メール: seino.terukaze.p8@dc.tohoku.ac.jp