'AITransparency' 태그의 글 목록

앤트로픽 클로드 AI, '자아 성찰' 능력의 초기 징후와 그 한계: 최신 연구 분석

TL;DR앤트로픽의 최신 연구는 클로드 AI, 특히 Claude Opus 4 및 4.1 모델이 자신의 내부 상태를 부분적으로 인식하는 '기능적 자아 성찰 의식(Functional Introspective Awareness)'을 보인다고 발표했습니다. 연구진은 '개념 주입' 실험을 통해 모델이 인위적으로 삽입된 '생각'을 약 20%의 정확도로 식별해내는 것을 관찰했습니다. 이 발견은 AI의 투명성 및 디버깅에 긍정적인 영향을 미칠 수 있으나, 해당 기능은 매우 제한적이고 신뢰도가 낮으며 , 인간의 의식과는 거리가 멀다는 점을 명확히 하고 있습니다.1. 연구 배경: 블랙박스 AI의 투명성 문제대규모 언어 모델(LLM)은 뛰어난 성능에도 불구하고 내부의 추론 과정이 불투명한 '블랙박스'라는 근본적인 한계를 가..

AI 2025.11.05

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Royfactory

AITransparency 1

티스토리툴바