반응형

2025/11/19 2

AgentEvolver: 인간처럼 효율적 학습하는 AI 에이전트 프레임워크

TL;DRAgentEvolver는 자체 백그라운드 학습사이클로 데이터 생성 없이 인간식 추론 기반 능력 진화를 달성합니다.7B 모델임에도 불구하고 14B 대형 LLM 대비 성능에서 우위(최대 +29%p)를 보입니다.Self-Questioning, Self-Navigating, Self-Attributing 3단계 메커니즘이 효율·자율·최적화 핵심.오픈소스화 및 다양한 환경·API 규격 지원으로 개발 유연성 증대.절대 날짜 기준 2025-11-12 기준 최신 논문·코드.AgentEvolver 구조 및 주요 특징AgentEvolver는 전통 RL(강화학습) 파이프라인을 벗어나 대규모 LLM의 추론력으로 자체 학습·진화백업 사이클을 구현합니다.1. Self-Questioning환경에서 다양한 상태-행동 탐색을..

AI/Technical 2025.11.19

Gemini 3 공개: 검색·코딩 혁신과 Poe 그룹챗 경쟁

TL;DRGoogle은 2025-11-18 Gemini 3를 출시했다.업계 최고 벤치마크 점수와 차세대 코딩 앱을 선보였다.이제 검색이 더 스마트해졌으며, Poe 등 그룹 챗 AI 앱과도 본격 경쟁한다.AI 성능의 대폭 향상은 산업 전체에 중요한 변화를 촉진한다.Gemini 3 주요 변화Gemini 3는 이전 버전보다 뛰어난 논리·추론 성능과 멀티모달 처리 능력을 보여준다. Google 검색, Gemini 앱, 개발자 플랫폼에 즉시 적용되어, 사용자 맞춤 검색과 SW 자동화가 강화됐다.업계 벤치마크: LMArena, GPQA Diamond, MathArena Apex 등 최고 기록.코딩 성능: WebDev Arena ELO 점수 1487, Terminal-Bench 2.0 54.2%, SWE-bench ..

AI/Trend 2025.11.19
반응형