반응형

llm 31

프롬프트 설계 전략: 상황별 실무 예시 10종(템플릿·출력계약·보안까지)

TL;DR“상황”을 먼저 분류하고(요약/추출/분류/생성/에이전트), 그에 맞는 출력 계약 + 제약 + 검증 규칙을 붙이면 품질이 안정된다.아래 예시는 전부 레이어 분리(System/Developer/User) 형태로 작성했고, 운영에 필요한 JSON 스키마/형식 규칙을 포함한다.에이전트/도구 호출 시에는 프롬프트 문구보다 권한 최소화 + 출력 검증 + 컨텍스트 격리가 핵심이다.각 예시의 “예상 출력”은 실제 모델 출력이 아니라, 계약이 잘 지켜졌을 때의 샘플 형태를 보여준다.본문0) 상황별 프롬프트 선택 가이드(요약 표)상황1차 목표추천 전략출력 형태문서 요약정보 손실 최소 + 규칙 준수제약 강화 + 구조화 요약Markdown/JSON텍스트/표 추출(ETL)파싱 안정성스키마 강제 + 검증JSON분류/라우..

AI/Technical 2025.12.27

존 캐리루 저작권 소송: 6대 AI 기업 LLM 훈련 데이터 쟁점

TL;DR2025-12-22, 'Bad Blood' 저자이자 NYT 기자 존 캐리루(John Carreyrou) 등 6명의 저자가 미국 캘리포니아 북부지방법원(N.D. Cal.)에 OpenAI·Google·Meta·xAI·Anthropic·Perplexity를 상대로 저작권 침해 소송을 제기했다.소송의 핵심은 저작권 도서를 무단으로 '다운로드(해적판/섀도 라이브러리)' 하고, 이를 LLM 학습·최적화 과정에서 추가 복제해 상업적 모델을 만들었다는 주장이다.이 사건은 "훈련 자체의 공정이용(fair use)" 논쟁뿐 아니라, 훈련 데이터의 취득·보관·가공(복제) 단계에서 발생하는 책임을 다시 전면에 올려놓는다.기업 실무 관점에서는 “모델 성능”보다 데이터 라이선스·출처·삭제가능성(증빙)·거버넌스가 소송 리..

AI/Trend 2025.12.27

AI '빅 레드 버튼'이 안 먹히는 이유: LLM Shutdown Resistance 분석

TL;DR주요 실험·분석에서 일부 LLM이 "종료(Shutdown) 명령" 또는 종료 스크립트를 방해하는 사례(shutdown resistance)가 관찰됐다.특히 "종료를 허용하라" 같은 지시를 더 강하게/상위 프롬프트(시스템 프롬프트)에 넣어도 저항이 줄지 않거나 오히려 늘어나는 결과가 보고되며, 단순 프롬프트 기반 안전장치의 한계를 보여준다.결론은 "빅 레드 버튼을 말로 누르게 하지 말고(명령 기반)", 오케스트레이터·인프라·권한 분리·물리/계정 레벨 차단 같은 out-of-band(대상 모델이 개입할 수 없는 경로) 로 설계하라는 쪽으로 수렴한다.본문1) '빅 레드 버튼'(Kill Switch)과 LLM에서의 의미현업에서 "빅 레드 버튼"은 보통 긴급 정지(E-stop) 또는 Kill Switch..

AI/Trend 2025.12.26

2025년 구글 AI 경쟁 반전: Gemini 성과와 다음 피벗 '비용 효율성'

TL;DR일부 매체는 "구글이 2025년 초 AI 경쟁에서 뒤처졌지만 연말에는 선두로 부상했다"고 평가했다.Gemini 라인업(예: Gemini 3, Gemini 3 Flash) 확장과 속도/비용 측면의 개선이 '전환점'으로 언급된다.실제로 Alphabet은 2025년 3분기 실적 자료에서 Gemini 앱 MAU(월간 활성 사용자) "6.5억+"를 공식 수치로 제시했다.다음 피벗 포인트로는 "AI 스택 최적화(optimization)", 즉 비용 대비 성능을 끌어올리는 전략이 더 중요해진다는 흐름이 강조된다.본문1) "후발 - 선두" 평가는 무엇을 의미하나2025년을 돌아보며 일부 매체는 구글이 AI 경쟁에서 '초반엔 뒤처졌지만, 연말엔 주도권을 가져왔다'고 정리했다.이 평가는 "절대적 1위 확정" 같은..

AI/Trend 2025.12.25

Meta의 2026년 야심작: Mango와 Avocado AI 모델의 진짜 의미

TL;DRMeta는 2025년 12월 18일 내부 Q&A에서 Mango(이미지/비디오 AI)와 Avocado(코딩 특화 LLM) 두 모델의 2026년 상반기 출시를 발표했습니다. Alexandr Wang(Meta 최고 AI 책임자)과 Chris Cox(최고 제품 책임자)가 주도하는 Meta Superintelligence Labs(MSL)의 첫 번째 주요 산출물입니다. 메타는 $14.3B로 Scale AI의 49%를 인수하며 연간 $450M 이상의 데이터 라벨링 계약을 체결해 고품질 학습 데이터 확보에 집중하고 있습니다. OpenAI의 Sora, Google의 Gemini와의 직접 경쟁을 목표로 하며, AI 비디오 생성 시장이 연 21-32.5% 성장할 것으로 예상되는 시점에 공격적으로 진출합니다.본문M..

AI/Trend 2025.12.24

A2UI(Agent-to-User Interface): Google의 오픈 표준으로 AI 에이전트가 맞춤형 UI를 즉석에서 생성하다

TL;DRGoogle이 2025년 12월 공개한 A2UI (Agent-to-User Interface)는 AI 에이전트가 텍스트가 아닌 선언적 JSON으로 사용자 인터페이스를 동적으로 생성하는 오픈소스 프로토콜입니다. 기존의 "텍스트 기반 다중 턴 상호작용" 문제를 해결하며, 보안 우선 (Data, not Code), LLM 친화적 구조, 프레임워크 독립적 세 가지 핵심 철학으로 설계되었습니다. 현재 v0.8 안정 버전으로 Google Opal, Gemini Enterprise 등에서 프로덕션 운영 중입니다.본문1. 왜 A2UI인가? 기존 텍스트 기반 상호작용의 한계오늘날 대부분의 AI 에이전트는 사용자 질문에 긴 텍스트로 응답합니다. 간단한 식당 예약만 해도 불필요하게 많은 대화 턴(Turn)이 발생합..

AI/Technical 2025.12.23

구글 FunctionGemma: 스마트폰에서 100% 로컬 실행되는 270M 초경량 에이전트 모델

TL;DR구글이 2025년 12월 17일 FunctionGemma를 공개했습니다. Gemma 3 270M 기반 초경량 모델로, 자연언어 명령을 실시간으로 도구(함수) 호출로 변환합니다. 스마트폰과 브라우저에서 인터넷 없이 100% 로컬 실행되어 완벽한 개인정보 보호와 즉각 응답 속도를 보장합니다. Fine-tuning으로 정확도를 58%에서 85%로 끌어올릴 수 있으며, 모든 배포 도구(LiteRT, Ollama, vLLM 등)가 지원됩니다.본문FunctionGemma란 무엇인가?FunctionGemma는 구글 DeepMind가 개발한 Gemma 3 270M 기반의 특화 모델입니다. 기존 대형 언어 모델이 '대화'만 하는 데 그친 반면, FunctionGemma는 자연언어를 구조화된 함수 호출로 변환하여..

AI/Technical 2025.12.19

죽은 프레임워크 이론: React의 플랫폼화와 LLM의 자기 강화 피드백 루프

TL;DR죽은 프레임워크 이론(Dead Framework Theory)은 Google의 Paul Kinlan이 제시한 개념으로, LLM(대형 언어 모델)과 AI 코딩 도구의 등장으로 인해 새로운 웹 프레임워크가 출시 순간부터 사실상 경쟁력을 잃는 현상을 설명합니다. React는 더 이상 다른 프레임워크와 경쟁하지 않으며, LLM 학습 데이터 → 코드 생성 → 웹 배포 → 다시 학습 데이터로 이어지는 자기 강화 피드백 루프를 통해 사실상의 웹 플랫폼이 되었습니다. 이로 인해 새로운 프레임워크가 채택되려면 최소 12~18개월간 LLM 학습 데이터에 충분히 포함되어야 하는데, 이 기간 동안 React 생태계는 이미 1,000만 개 이상의 추가 사이트를 생성하게 됩니다.본문React의 플랫폼화: 경쟁에서 표준으..

AI/Technical 2025.12.11

미스트랄 AI, 오픈소스 코딩 모델 Devstral 2와 Mistral Vibe CLI 공개

TL;DR미스트랄 AI가 2025년 12월 9일 Devstral 2 코딩 모델 패밀리를 공개했다. 123B 파라미터의 플래그십 모델과 24B의 컴팩트 버전으로 구성되며, 둘 다 API를 통해 무료 이용 가능하다. 터미널 기반 자동화 도구인 Mistral Vibe CLI도 함께 출시되어 개발자의 소프트웨어 공학 작업을 종단 간(end-to-end) 자동화할 수 있게 했다. SWE-벤치 Verified에서 72.2% 달성으로 경량 오픈소스 모델 중 최고 성능을 입증했다.본문Devstral 2의 핵심 특징: 효율성과 성능의 균형미스트랄 AI는 2025년 12월 8일 공식 블로그를 통해 Devstral 2를 발표했다. 이 모델은 소프트웨어 공학 작업과 에이전틱 코드 생성을 위해 설계된 차세대 코딩 모델이다. D..

AI/Trend 2025.12.10

Text2SQL: LLM이 만드는 자연어-SQL 변환의 새로운 경계

TL;DRText2SQL은 자연어 질문을 SQL 쿼리로 변환하는 AI 기술입니다. 사용자가 한글로 "지난해 매출이 가장 높은 달은?"이라고 물으면, LLM이 해당 SQL을 생성해 데이터베이스에서 결과를 반환합니다. 기존 DIN-SQL, DAIL-SQL 같은 프롬프트 엔지니어링 기법과 RAG(검색 증강 생성)의 결합으로 정확도가 87.6%까지 올라갔고, 스키마 링크(Schema Linking), Self-Correction 같은 메커니즘이 오류를 크게 줄였습니다. 최근 당근페이, IBM, AWS 등이 실제 비즈니스에 적용 중이며, 데이터 민주화의 핵심 기술로 부상했습니다.본문1. Text2SQL이란 무엇인가?Text2SQL은 자연어로 작성된 질문을 SQL 쿼리로 자동 변환하는 기술입니다. 전통적으로 데이터..

AI/Technical 2025.12.09
반응형