東北大学大学院情報科学研究科M1 坂口・乾研究室所属
清野 輝風/Terukaze Seino
Tohoku NLP Group
プロフィール
研究テーマ
大規模言語モデルを用いた抽象推論能力の分析
LLMが抽象的な概念をfew-shot学習する際に、得意とする概念および不得意とする概念の傾向について、粒度の高い分析を行いました。
発表論文
大規模言語モデルを用いた抽象推論能力の分析
人工知能が高度な汎化能力を持つためには,少数の例からパターンを抽出し,新しい入力に適用する抽象推論能力の向上が重要である.しかしながら,既存の大規模言語モデルは未だ十分な抽象推論能力を有しておらず,その能力について詳細な分析が必要である.本稿ではこれらの能力を評価する代表的なデータセットである ARC(Abstraction and Reasoning Corpus)について few-shot 学習を通して実際に解かせ,ARC の各タスクに必要な処理を能力ごとに分解し分類した上で,能力ごとの精度を分析することで大規模言語モデルの抽象推論能力を詳細に評価する.
連絡先
東北大学 大学院情報科学研究科
メール: seino.terukaze.p8@dc.tohoku.ac.jp