반응형

AI/Technical 53

n8n 사용법: Docker Compose 셀프호스팅 템플릿과 운영 체크리스트

TL;DRn8n을 "실서비스처럼" 셀프호스팅하려면 최소한 영속 데이터(Workflow/Execution/Credential), 웹훅 URL 정합성, 암호화 키 관리, 로그/메트릭/정리(Pruning) 까지는 세팅해야 합니다.소규모는 공식 Docker Compose(트래픽+TLS) 구성이 빠르고, 확장/내구성을 원하면 Postgres + (선택) Redis 큐 모드로 가는 게 정석입니다.ㅊ운영에서 자주 터지는 이슈는 "리버스 프록시 뒤에서 Webhook URL이 꼬임", "N8N_ENCRYPTION_KEY 분실", "Execution 데이터 폭증"입니다. 이 글은 그 3가지를 먼저 막는 템플릿과 체크리스트를 제공합니다.본문1) 운영 관점에서 n8n 셀프호스팅을 ‘설계’하는 법n8n은 기본적으로 SQLite..

AI/Technical 10:58:59

n8n 사용법 실무 가이드: Webhook·스케줄·에러처리 3종 워크플로우

TL;DRn8n은 “트리거(Trigger) → 처리(Transform) → 액션(Action)”을 노드로 조립해 자동화를 만드는 도구다.Webhook 기반 이벤트 자동화는 인증/서명 검증과 응답(Respond) 설계를 먼저 잡아야 운영이 편해진다.스케줄 기반 수집은 HTTP Request의 Pagination과 Loop Over Items(구 Split in Batches)로 레이트리밋/대량 처리를 안정화한다.운영에서는 에러 워크플로우(Error Trigger)와 Stop And Error로 실패를 "관측 가능한 이벤트"로 만드는 것이 핵심이다.본문1. n8n 기본 개념을 “실무 관점”으로 재정리1.1 워크플로우, 노드, 아이템(Item)워크플로우는 노드들의 연결 그래프이며, 노드는 입력 아이템 리스트를..

AI/Technical 08:55:28

n8n 사용법 2편: Webhook·에러처리·큐 모드로 실무 자동화 구축

TL;DRWebhook으로 외부 이벤트를 받고, HTTP Request/Set/Merge/Code로 데이터 흐름을 정리하면 대부분의 자동화를 구현할 수 있습니다.실패를 "숨기지" 말고 Error Trigger + Error Workflow로 알림/재시도/리커버리를 설계하는 것이 운영의 핵심입니다.대량 API 호출은 Loop Over Items(Split in Batches)와 HTTP Pagination으로 쪼개고 종료조건을 명확히 해야 합니다.트래픽/실행이 늘면 Queue mode(POSTGRES+REDIS)로 분리해 안정적으로 확장합니다.운영에서는 암호화 키(N8N_ENCRYPTION_KEY), WEBHOOK_URL/프록시 헤더, 실행 데이터 보존/프루닝, Prometheus 지표, 보안 감사(n8n..

AI/Technical 01:38:13

n8n 사용법: 워크플로 자동화 시작부터 운영·확장까지

TL;DRn8n은 트리거(스케줄/웹훅/이벤트)로 시작해 노드들을 연결해 자동화 워크플로를 만드는 플랫폼이다.처음에는 "1개 트리거 + 2~3개 액션 노드"로 작게 만들고, 데이터 구조(items)와 표현식($json 등)을 익히면 생산성이 급상승한다.자체 호스팅은 Docker가 가장 흔한 시작점이며, 운영에서는 암호화 키(N8N_ENCRYPTION_KEY), 웹훅 URL(WEBHOOK_URL), 실행 데이터 관리가 핵심이다.트래픽/실행량이 늘면 Redis 기반 queue mode로 워커를 분리해 확장한다.본문1) n8n이 뭔가요: “트리거 → 처리 → 결과”를 잇는 자동화 런타임n8n은 시각적 워크플로 에디터에서 노드(Node)를 연결해 자동화를 구성하고, 실행(Execution)을 기록·재실행·디버깅할..

AI/Technical 2026.01.05

Ollama로 로컬 LLM 실행하기: API·Modelfile·RAG 흐름(mermaid 도식화)

TL;DROllama는 로컬에서 LLM을 실행하고 REST API로 호출할 수 있게 해주는 런타임/서버다. (기본 예시는 http://localhost:11434)핵심 엔드포인트는 /api/generate, /api/chat, /api/embed이며, 임베딩(/api/embed)은 RAG 파이프라인의 출발점이다.Modelfile로 FROM, PARAMETER, SYSTEM, TEMPLATE 등을 선언해 "업무 목적"에 맞춘 커스텀 모델을 패키징할 수 있다.OpenAI 호환 API는 공식 문서/블로그에 안내돼 있으나, 시점에 따라 지원 범위가 변해왔으므로(예: 과거 이슈) 실제 버전 기준으로 확인이 안전하다.본문1. Ollama 개념: "로컬 실행 + API 서빙"Ollama는 로컬에서 모델을 실행하고, ..

AI/Technical 2025.12.31

LangChain 실무 가이드: v1 아키텍처, LCEL, LangGraph·LangServe·LangSmith까지

TL;DRLangChain은 LLM 기반 애플리케이션과 에이전트를 빠르게 조립하기 위한 오픈소스 프레임워크(및 생태계/플랫폼)다.핵심 조립 방식은 LCEL(LangChain Expression Language)과 Runnable 중심이며, 스트리밍/배치/비동기 같은 실행 특성을 일관되게 다루는 방향으로 발전했다.LangGraph는 "상태를 갖는(stateful) 장기 실행 에이전트"를 그래프 형태로 오케스트레이션하는 저수준 프레임워크다.LangServe는 LangChain의 runnable/chain을 FastAPI 기반 REST API로 배포하는 도구다.보안/운영 측면에서 최근(2025-12) 직렬화(Serialization) 주입 취약점(CVE-2025-68664/68665)이 공개되어, 영향 버전은..

AI/Technical 2025.12.30

바이브코딩(Vibe Coding) 하는 방법: 프롬프트·테스트·가드레일로 빠르게 만들기

TL;DR바이브코딩은 코드를 자세히 읽기보다 자연어 지시→실행 결과→수정 요청을 반복해 빠르게 결과물을 만드는 방식입니다.프로토타입/개인 도구/데모에는 강력하지만, 운영·보안·유지보수가 필요한 제품에는 그대로 적용하면 위험합니다.실무에서는 "완전한 바이브코딩"보다는 바이브(속도) + 엔지니어링(검증)을 섞는 하이브리드가 안정적입니다.Cursor/Replit Agent/Codex/Claude Code 같은 에이전트형 도구는 여러 파일 편집·명령 실행까지 자동화해 반복 비용을 줄여줍니다.본문1. 바이브코딩(바이브 코딩) 정의와 “어디까지가 바이브인가”바이브코딩(vibe coding)은 Andrej Karpathy가 2025년 2월에 "코드가 존재하는 걸 잊고 자연어로 밀어붙이는" 방식으로 언급하며 확산된 개..

AI/Technical 2025.12.28

프롬프트 설계 전략: 상황별 실무 예시 10종(템플릿·출력계약·보안까지)

TL;DR“상황”을 먼저 분류하고(요약/추출/분류/생성/에이전트), 그에 맞는 출력 계약 + 제약 + 검증 규칙을 붙이면 품질이 안정된다.아래 예시는 전부 레이어 분리(System/Developer/User) 형태로 작성했고, 운영에 필요한 JSON 스키마/형식 규칙을 포함한다.에이전트/도구 호출 시에는 프롬프트 문구보다 권한 최소화 + 출력 검증 + 컨텍스트 격리가 핵심이다.각 예시의 “예상 출력”은 실제 모델 출력이 아니라, 계약이 잘 지켜졌을 때의 샘플 형태를 보여준다.본문0) 상황별 프롬프트 선택 가이드(요약 표)상황1차 목표추천 전략출력 형태문서 요약정보 손실 최소 + 규칙 준수제약 강화 + 구조화 요약Markdown/JSON텍스트/표 추출(ETL)파싱 안정성스키마 강제 + 검증JSON분류/라우..

AI/Technical 2025.12.27

MoE(Mixture of Experts) 쉽게 이해하기: 라우팅, Top-1/Top-2, Mixtral 서빙과 K8s 체크

TL;DRMoE(Mixture of Experts)는 토큰마다 일부 Expert만 선택해 계산하는 "희소(조건부) 계산" 구조다.트랜스포머에서는 주로 Dense FFN(MLP)을 MoE FFN(Experts+Router)으로 교체하는 형태가 표준이다.라우팅은 운영 친화적인 Top-1(Switch)과, 표현력 여지가 있지만 비용이 커지는 Top-2(Mixtral)가 대표 선택지다.실제 병목은 라우팅 쏠림·capacity overflow(드롭)·all-to-all 통신·메모리 대역폭에서 자주 발생하므로 "서빙 엔진 + 관측(모니터링) + K8s 토폴로지 튜닝"을 함께 봐야 한다.본문1) MoE를 한 문장으로: "전문가들 + 배분자(라우터)"MoE는 이름 그대로 여러 전문가(Experts)가 있고, 입력(토큰..

AI/Technical 2025.12.27

Anthropic의 Bloom 프레임워크: AI 모델 행동 자동 평가의 새로운 표준

TL;DRAnthropic이 2025년 12월 18일 오픈소스 에이전틱 프레임워크 Bloom을 발표했습니다. Bloom은 researcher가 지정한 단일 행동을 입력하면, 자동으로 평가 시나리오를 생성하고 AI 모델이 해당 행동을 얼마나 자주(빈도), 얼마나 심하게(심각도) 나타내는지 정량적으로 측정합니다. 4단계 에이전틱 파이프라인(이해, 아이디어, 롤아웃, 판정)으로 작동하며, 16개 프론티어 모델을 대상으로 망상적 순응, 자기 보존, 지시된 사보타주, 자기 선호 편향 등 4가지 행동을 벤치마킹했습니다. 판정 모델(Claude Opus 4.1)은 인간 평가자와 0.86의 높은 스피어만 상관계수를 보여 신뢰성을 검증했습니다.서론: 행동 평가의 확장성 위기전통적 AI 평가 방식의 한계프론티어 AI 모델..

AI/Technical 2025.12.23
반응형