반응형

2025/12 89

Ollama로 로컬 LLM 실행하기: API·Modelfile·RAG 흐름(mermaid 도식화)

TL;DROllama는 로컬에서 LLM을 실행하고 REST API로 호출할 수 있게 해주는 런타임/서버다. (기본 예시는 http://localhost:11434)핵심 엔드포인트는 /api/generate, /api/chat, /api/embed이며, 임베딩(/api/embed)은 RAG 파이프라인의 출발점이다.Modelfile로 FROM, PARAMETER, SYSTEM, TEMPLATE 등을 선언해 "업무 목적"에 맞춘 커스텀 모델을 패키징할 수 있다.OpenAI 호환 API는 공식 문서/블로그에 안내돼 있으나, 시점에 따라 지원 범위가 변해왔으므로(예: 과거 이슈) 실제 버전 기준으로 확인이 안전하다.본문1. Ollama 개념: "로컬 실행 + API 서빙"Ollama는 로컬에서 모델을 실행하고, ..

AI/Technical 2025.12.31

Meta의 Manus 인수: AI 에이전트 M&A 핵심팩트와 실무 대응

TL;DR2025-12-29(현지 보도 기준) Meta는 중국계 창업진이 세운 싱가포르 기반 AI 에이전트 스타트업 Manus 인수를 발표했다.거래 금액은 공식 미공개지만, 복수 보도에서 기업가치 20~30억 달러(USD 2–3B) 수준으로 추정한다.Meta는 Manus의 에이전트 기술을 Meta AI를 포함한 자사 제품군에 통합하겠다고 밝혔다.이번 딜은 "대화형 챗봇"을 넘어 "작업 수행형 에이전트"로 무게중심이 이동하는 흐름을 상징한다(정의·트렌드 관점).본문1) 사건 개요: Meta가 Manus를 왜 샀나(공개된 사실만)1-1. 무엇이 발표됐나발표/보도 시점: 2025-12-29(Reuters, CNA 등).대상: 중국계 창업진이 설립한 뒤 싱가포르로 기반을 옮긴 AI 에이전트 기업 Manus.금액..

AI/Trend 2025.12.30

LangChain 실무 가이드: v1 아키텍처, LCEL, LangGraph·LangServe·LangSmith까지

TL;DRLangChain은 LLM 기반 애플리케이션과 에이전트를 빠르게 조립하기 위한 오픈소스 프레임워크(및 생태계/플랫폼)다.핵심 조립 방식은 LCEL(LangChain Expression Language)과 Runnable 중심이며, 스트리밍/배치/비동기 같은 실행 특성을 일관되게 다루는 방향으로 발전했다.LangGraph는 "상태를 갖는(stateful) 장기 실행 에이전트"를 그래프 형태로 오케스트레이션하는 저수준 프레임워크다.LangServe는 LangChain의 runnable/chain을 FastAPI 기반 REST API로 배포하는 도구다.보안/운영 측면에서 최근(2025-12) 직렬화(Serialization) 주입 취약점(CVE-2025-68664/68665)이 공개되어, 영향 버전은..

AI/Technical 2025.12.30

AGI(범용 인공지능)란 무엇인가: 한 번에 이해하기

TL;DRAGI는 "여러 분야를 두루" 잘하는 범용 지능을 뜻하지만, 업계·학계마다 정의가 조금씩 다릅니다."LLM이 똑똑해졌다 = AGI"는 단정하기 어렵고, 범용성(Generalization)·자율성(Autonomy)·신뢰성(Reliability) 같은 축으로 따로 봐야 합니다.AGI 논의에서 가장 자주 섞이는 이슈는 (1) 정의, (2) 측정/벤치마크, (3) 안전/거버넌스입니다.실무적으로는 "AGI냐 아니냐"보다, 우리 업무에서 '범용성 + 자율 실행 + 낮은 환각'이 필요한가를 먼저 따지는 게 유용합니다.본문1) AGI를 한 문장으로 정의하면?AGI(Artificial General Intelligence)는 흔히 사람처럼 폭넓은 과제를 학습하고, 새로운 상황에도 적응하며, 여러 분야에서 성과를..

AI/Trend 2025.12.30

Llama 4 오픈소스 릴리스 정리: Scout/Maverick 스펙·벤치마크·라이선스 체크리스트

TL;DRMeta는 2025-04-05에 Llama 4 Scout(17B 활성/109B 총, 10M 컨텍스트)와 Llama 4 Maverick(17B 활성/400B 총, 1M 컨텍스트)을 공개했다.두 모델은 MoE 기반의 "네이티브 멀티모달(텍스트+이미지 입력)" 구조를 전면에 내세우며, 멀티링구얼(12개 언어 지원)과 긴 컨텍스트를 강점으로 한다.성능은 Hugging Face가 공개한 평가표 기준으로 MMLU Pro, GPQA Diamond 등에서 Llama 3.1/3.3 계열 대비 큰 폭의 개선 수치를 제시했다.다만 "오픈소스"라는 표현은 라이선스가 OSI(Open Source Initiative) 정의의 '오픈 소스'와는 다를 수 있어, 상용 사용 전 Llama 4 Community License의..

AI/Trend 2025.12.29

Google 트렌드 급상승: Microsoft AI·MacBook Air M3·Reno15 Pro

TL;DRGoogle Trends 기반 보도에서 Microsoft AI, MacBook Air M3, OPPO Reno15 Pro가 최근 글로벌 검색에서 함께 주목받는 키워드로 언급됐다.Google Trends는 절대 검색량이 아니라, 기간·지역 내 검색 관심도를 0~100으로 정규화한 지표다. 그래서 "급상승"을 보더라도 해석 규칙을 먼저 확인해야 한다.Microsoft 쪽 관심 증가는 Copilot에 시각적 아바타 'Mico' 등 업데이트가 공개되며 "Microsoft AI" 관련 검색이 동반된 흐름으로 설명할 수 있다.실무에서는 (1) 키워드 정의(Topic vs Term) → (2) 비교 기준 고정 → (3) 알림/대시보드 자동화까지 연결해야 “트렌드”가 업무에 도움이 된다.본문1. “Micros..

AI/Trend 2025.12.29

NBA 경기 예측 ML 모델 구축 전략: Elo·피처 50개·캘리브레이션·인게임 확장 파이프라인

TL;DRNBA 경기 예측은 "승패를 맞히는 분류"보다 확률 품질(LogLoss/Brier)과 캘리브레이션이 제품 관점에서 더 중요합니다.구축 순서는 Elo 베이스라인(빠른 검증) → 피처 확장 + GBDT/ML → 캘리브레이션 → 운영 모니터링이 가장 안전합니다.NBA는 일정/휴식 영향이 큽니다. 백투백·휴식일·이동이 승률/퍼포먼스에 영향을 준다는 연구 결과가 있습니다.Elo는 "업데이트 규칙"과 "시즌 평균회귀(리셋)"를 명시해야 재현 가능한 파이프라인이 됩니다(538은 시즌 시작 시 평균으로 1/4 회귀 예시를 공개).인게임 확장은 PBP(Play-by-Play) 이벤트 스트림 → 상태 피처 → 온라인 추론 구조로 별도 파이프라인을 두는 게 일반적이며, 관련 베이지안 접근 연구도 있습니다.본문1) ..

AI/Trend 2025.12.28

바이브코딩(Vibe Coding) 하는 방법: 프롬프트·테스트·가드레일로 빠르게 만들기

TL;DR바이브코딩은 코드를 자세히 읽기보다 자연어 지시→실행 결과→수정 요청을 반복해 빠르게 결과물을 만드는 방식입니다.프로토타입/개인 도구/데모에는 강력하지만, 운영·보안·유지보수가 필요한 제품에는 그대로 적용하면 위험합니다.실무에서는 "완전한 바이브코딩"보다는 바이브(속도) + 엔지니어링(검증)을 섞는 하이브리드가 안정적입니다.Cursor/Replit Agent/Codex/Claude Code 같은 에이전트형 도구는 여러 파일 편집·명령 실행까지 자동화해 반복 비용을 줄여줍니다.본문1. 바이브코딩(바이브 코딩) 정의와 “어디까지가 바이브인가”바이브코딩(vibe coding)은 Andrej Karpathy가 2025년 2월에 "코드가 존재하는 걸 잊고 자연어로 밀어붙이는" 방식으로 언급하며 확산된 개..

AI/Technical 2025.12.28

Coforge-Encora 23.5억달러 인수, AI 엔지니어링 판이 커진다

TL;DRCoforge가 AI-네이티브 엔지니어링 기업 Encora를 23.5억달러(EV)에 인수하는 계약을 2025-12-26 발표했다.핵심은 "규모 확장"보다 AI 주도(Agentic) 엔지니어링 역량 + 미주/라틴아메리카 딜리버리(nearshore) 강화에 가깝다.거래는 주식(약 18.9억달러) 중심 + Encora 부채 상환을 위한 최대 5.5억달러 조달(브리지/기관발행 등)로 설계됐다.완료 시점은 4~6개월을 목표로 하며, 주주/규제 승인 절차를 거친다.참고로, 사용자가 적어준 "TechCrunch 기사"는 현재(2025-12-28 KST) TechCrunch 도메인에서 동일 이슈의 원문을 확인하지 못했다(동일 제목/내용 매칭 실패). 대신 공식 보도자료/공시/주요 매체 기반으로 교차검증했다.본..

AI/Trend 2025.12.28

중국 ‘인간처럼 상호작용하는 AI’ 규제 초안 핵심 정리(과몰입 경고·개입 의무)

TL;DR중국 국가인터넷정보판공실(CAC)이 '인공지능 의인화 상호작용 서비스 관리 잠행방법(의견수렴안)' 초안을 2025-12-27 공개하고 2026-01-25까지 의견을 받는다.적용 대상은 중국 내 대중에게 사람의 성격·사고·대화 스타일을 모사하며 텍스트/이미지/음성/영상으로 감정적 상호작용을 제공하는 AI 제품·서비스다.핵심 의무는 (1) 과몰입 경고(연속 2시간 사용 시 팝업), (2) 중독·극단 감정 징후 시 개입, (3) "AI와 대화 중"임을 상시 고지, (4) 미성년자 모드·보호자 통제, (5) 일정 규모 이상 안전평가 및 보고 등이다.규제 방향은 기존 중국의 생성형 AI·콘텐츠 라벨링·데이터/개인정보 체계 위에 '심리·정서 안전(의존/중독)'을 전면으로 끌어올린 점이 특징이다.본문1) '..

AI/Trend 2025.12.28
반응형