Key points are not available for this paper at this time.
大規模言語モデル(LLM)は人工知能の議論の中心的存在となっています。しかし、LLMが重要な人間の価値観にどのように適合しているかを評価する方法にはまだギャップがあります。本稿では、最先端のLLMであるGPT-4およびClaude 2.1(Gemini ProとLLAMA 2は有効な結果を生成しませんでした)が道徳的偽善者であるかどうかを調査します。私たちは道徳基盤理論に基づく2つの研究手法を用います:(i)倫理基盤質問票(MFQ)は抽象的な道徳判断においてどの価値が道徳的に重要と考えられているかを調査し;(ii)倫理基盤剪影(MFV)は各倫理基盤に関連する具体的なシナリオでの道徳的認知を評価します。これら異なる道徳評価の抽象化間での価値の対立を偽善として特徴づけます。両モデルは各手法内では人間と比較して合理的な整合性を示しましたが、MFQに見られる抽象的価値とMFVによる具体的な道徳違反評価を比較すると矛盾し偽善的な行動を示しました。
Building similarity graph...
Analyzing shared references across papers
Loading...
José Luiz Nunes
Guilherme Almeida
Marcelo de Araújo
Building similarity graph...
Analyzing shared references across papers
Loading...
Nunesら(Fri,)はこの問題を研究しました。
www.synapsesocial.com/papers/68e69aefb6db643587620735 — DOI: https://doi.org/10.48550/arxiv.2405.11100
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: