반응형

LLMsecurity 2

OpenAI Atlas “프롬프트 인젝션은 끝나지 않는다” 공식 인정과 보안 설계 체크리스트

TL;DROpenAI는 ChatGPT Atlas(브라우저 에이전트)에서 프롬프트 인젝션은 "완전히 해결(solved)"되기 어렵다고 공개적으로 밝혔다.Atlas의 Agent mode는 위협면(threat surface)을 확장하며, 웹/이메일/문서 등 "사실상 무한한" 비신뢰 입력을 다룬다는 점이 핵심 리스크다.OpenAI는 RL(강화학습) 기반 자동 공격자(automated attacker)로 공격을 선제 탐지하고, 적대적 학습 + 시스템 가드레일로 빠르게 패치하는 "상시 하드닝 루프"를 제시했다.업계도 이를 구조적/지속적 리스크로 본다(Brave: "systemic challenge", Google: "primary new threat").본문1) 무엇이 “Atlas 프롬프트 인젝션 리스크”를 특별히..

AI/Trend 2025.12.25

Sentient AGI의 OML 1.0: 오픈소스 AI의 경제적 지속 가능성을 위한 AI 지문 기술

TL;DRSentient AGI는 NeurIPS 2025에서 4편의 논문을 수락받으며, 오픈소스 AGI의 윤리적·경제적 문제 해결에 대한 혁신을 제시했다.그중 대표작인 OML 1.0(Open-Monetizable-Loyal)은 LLM에 24,576개의 비가역 지문(fingerprint)을 손실 없이 삽입하는 기술이다.이 기술은 모델 소유권 증명, 불법 복제 방지, 정당한 수익 배분을 가능케 하며 AI 경제 생태계의 기틀을 마련했다.OML 1.0은 암호학적 구조와 온체인 계약 시스템을 결합해, “열린(Open) 동시에 충성도 있는(Loyal)” AI 모델을 구현한다. Sentient AGI와 NeurIPS 2025의 성과2025년 NeurIPS에서 Sentient AGI는 총 4편의 연구 논문이 채택되었다..

AI 2025.10.24
반응형