반응형

AI/Technical 56

임베딩(Embedding)이란 무엇인가: 머신러닝을 위한 기초 개념

TL;DR임베딩은 범주형·비정형 데이터를 연속적인 수치 벡터로 변환하는 표현 기법이다.이 벡터 표현은 데이터 간 유사도·관계·구조를 보존하며, 머신러닝 모델의 입력으로 사용된다.자연어 처리뿐 아니라 추천 시스템, 그래프 분석, 범주형 피처 처리 전반에 활용되는 ML의 기본 도구다.본문1. 임베딩이란 무엇인가임베딩(Embedding)은 문자, 단어, 카테고리, 노드와 같은 이산적(discrete) 데이터를머신러닝 모델이 다룰 수 있도록 연속적인 수치 공간의 벡터로 매핑하는 방법이다.핵심은 단순한 숫자 치환이 아니라,데이터 간 관계와 의미를 수치 공간에서 유지하는 데 있다.예:단어 → 의미가 비슷한 단어일수록 가까운 벡터상품 ID → 함께 구매되는 상품일수록 가까운 벡터노드 → 연결 구조가 유사할수록 가까운..

AI/Technical 2026.01.19

NVIDIA 그래픽 카드 모델(대표)별 Ollama 추천 모델 표

아래 표는 초보자 기준으로 "무난하게 시작"하는 추천입니다. (같은 VRAM이라도 GPU 세대/드라이버/설정에 따라 체감 성능은 달라질 수 있습니다)NVIDIA GPU (대표 모델)VRAM(공식 스펙)초보자 추천 Ollama 모델 예시(실제 모델명)이 조합이 잘 맞는 용도RTX 306012GB(또는 8GB 변형)llama3.1:8b, qwen2.5:7b, gemma2:9b문서 요약/번역/일상 Q&A "로컬 LLM 입문"RTX 3060 Ti8GBllama3.2:3b, phi3:mini, qwen2.5:3b가볍게 빠른 응답(짧은 문서/챗봇)RTX 40608GBllama3.2:3b, phi3:mini, mistral:7b"빠른 3B~7B" 중심(속도 우선)RTX 4060 Ti16GB 또는 8GB(16GB면) ..

AI/Technical 2026.01.09

Kubeflow 사용법: 설치부터 Pipelines·Trainer·KServe까지

TL;DRKubeflow는 Kubernetes 위에서 Notebook - 파이프라인 자동화 - 분산 학습 - 튜닝 - 모델 서빙을 한 플랫폼에서 연결하는 오픈소스 생태계다.2025-12-15에 Kubeflow 1.11이 릴리스되었고, 설치는 주로 kubeflow/manifests의 Kustomize 기반 매니페스트로 진행한다.빠르게 시작하려면 Kind 기반 단일 커맨드 설치 후, istio-ingressgateway를 포트포워딩해 대시보드에 접속한다.Pipelines는 SDK로 파이썬 DSL을 IR YAML(파이프라인 스펙)로 컴파일해 업로드/실행한다.멀티유저 격리는 Profile/Namespace로 구현되며, KFP의 멀티유저 격리는 Kubeflow Platform 배포에서 지원된다.본문1) Kubef..

AI/Technical 2026.01.08

n8n 사용법: Docker Compose 셀프호스팅 템플릿과 운영 체크리스트

TL;DRn8n을 "실서비스처럼" 셀프호스팅하려면 최소한 영속 데이터(Workflow/Execution/Credential), 웹훅 URL 정합성, 암호화 키 관리, 로그/메트릭/정리(Pruning) 까지는 세팅해야 합니다.소규모는 공식 Docker Compose(트래픽+TLS) 구성이 빠르고, 확장/내구성을 원하면 Postgres + (선택) Redis 큐 모드로 가는 게 정석입니다.ㅊ운영에서 자주 터지는 이슈는 "리버스 프록시 뒤에서 Webhook URL이 꼬임", "N8N_ENCRYPTION_KEY 분실", "Execution 데이터 폭증"입니다. 이 글은 그 3가지를 먼저 막는 템플릿과 체크리스트를 제공합니다.본문1) 운영 관점에서 n8n 셀프호스팅을 ‘설계’하는 법n8n은 기본적으로 SQLite..

AI/Technical 2026.01.06

n8n 사용법 실무 가이드: Webhook·스케줄·에러처리 3종 워크플로우

TL;DRn8n은 “트리거(Trigger) → 처리(Transform) → 액션(Action)”을 노드로 조립해 자동화를 만드는 도구다.Webhook 기반 이벤트 자동화는 인증/서명 검증과 응답(Respond) 설계를 먼저 잡아야 운영이 편해진다.스케줄 기반 수집은 HTTP Request의 Pagination과 Loop Over Items(구 Split in Batches)로 레이트리밋/대량 처리를 안정화한다.운영에서는 에러 워크플로우(Error Trigger)와 Stop And Error로 실패를 "관측 가능한 이벤트"로 만드는 것이 핵심이다.본문1. n8n 기본 개념을 “실무 관점”으로 재정리1.1 워크플로우, 노드, 아이템(Item)워크플로우는 노드들의 연결 그래프이며, 노드는 입력 아이템 리스트를..

AI/Technical 2026.01.06

n8n 사용법 2편: Webhook·에러처리·큐 모드로 실무 자동화 구축

TL;DRWebhook으로 외부 이벤트를 받고, HTTP Request/Set/Merge/Code로 데이터 흐름을 정리하면 대부분의 자동화를 구현할 수 있습니다.실패를 "숨기지" 말고 Error Trigger + Error Workflow로 알림/재시도/리커버리를 설계하는 것이 운영의 핵심입니다.대량 API 호출은 Loop Over Items(Split in Batches)와 HTTP Pagination으로 쪼개고 종료조건을 명확히 해야 합니다.트래픽/실행이 늘면 Queue mode(POSTGRES+REDIS)로 분리해 안정적으로 확장합니다.운영에서는 암호화 키(N8N_ENCRYPTION_KEY), WEBHOOK_URL/프록시 헤더, 실행 데이터 보존/프루닝, Prometheus 지표, 보안 감사(n8n..

AI/Technical 2026.01.06

n8n 사용법: 워크플로 자동화 시작부터 운영·확장까지

TL;DRn8n은 트리거(스케줄/웹훅/이벤트)로 시작해 노드들을 연결해 자동화 워크플로를 만드는 플랫폼이다.처음에는 "1개 트리거 + 2~3개 액션 노드"로 작게 만들고, 데이터 구조(items)와 표현식($json 등)을 익히면 생산성이 급상승한다.자체 호스팅은 Docker가 가장 흔한 시작점이며, 운영에서는 암호화 키(N8N_ENCRYPTION_KEY), 웹훅 URL(WEBHOOK_URL), 실행 데이터 관리가 핵심이다.트래픽/실행량이 늘면 Redis 기반 queue mode로 워커를 분리해 확장한다.본문1) n8n이 뭔가요: “트리거 → 처리 → 결과”를 잇는 자동화 런타임n8n은 시각적 워크플로 에디터에서 노드(Node)를 연결해 자동화를 구성하고, 실행(Execution)을 기록·재실행·디버깅할..

AI/Technical 2026.01.05

Ollama로 로컬 LLM 실행하기: API·Modelfile·RAG 흐름(mermaid 도식화)

TL;DROllama는 로컬에서 LLM을 실행하고 REST API로 호출할 수 있게 해주는 런타임/서버다. (기본 예시는 http://localhost:11434)핵심 엔드포인트는 /api/generate, /api/chat, /api/embed이며, 임베딩(/api/embed)은 RAG 파이프라인의 출발점이다.Modelfile로 FROM, PARAMETER, SYSTEM, TEMPLATE 등을 선언해 "업무 목적"에 맞춘 커스텀 모델을 패키징할 수 있다.OpenAI 호환 API는 공식 문서/블로그에 안내돼 있으나, 시점에 따라 지원 범위가 변해왔으므로(예: 과거 이슈) 실제 버전 기준으로 확인이 안전하다.본문1. Ollama 개념: "로컬 실행 + API 서빙"Ollama는 로컬에서 모델을 실행하고, ..

AI/Technical 2025.12.31

LangChain 실무 가이드: v1 아키텍처, LCEL, LangGraph·LangServe·LangSmith까지

TL;DRLangChain은 LLM 기반 애플리케이션과 에이전트를 빠르게 조립하기 위한 오픈소스 프레임워크(및 생태계/플랫폼)다.핵심 조립 방식은 LCEL(LangChain Expression Language)과 Runnable 중심이며, 스트리밍/배치/비동기 같은 실행 특성을 일관되게 다루는 방향으로 발전했다.LangGraph는 "상태를 갖는(stateful) 장기 실행 에이전트"를 그래프 형태로 오케스트레이션하는 저수준 프레임워크다.LangServe는 LangChain의 runnable/chain을 FastAPI 기반 REST API로 배포하는 도구다.보안/운영 측면에서 최근(2025-12) 직렬화(Serialization) 주입 취약점(CVE-2025-68664/68665)이 공개되어, 영향 버전은..

AI/Technical 2025.12.30

바이브코딩(Vibe Coding) 하는 방법: 프롬프트·테스트·가드레일로 빠르게 만들기

TL;DR바이브코딩은 코드를 자세히 읽기보다 자연어 지시→실행 결과→수정 요청을 반복해 빠르게 결과물을 만드는 방식입니다.프로토타입/개인 도구/데모에는 강력하지만, 운영·보안·유지보수가 필요한 제품에는 그대로 적용하면 위험합니다.실무에서는 "완전한 바이브코딩"보다는 바이브(속도) + 엔지니어링(검증)을 섞는 하이브리드가 안정적입니다.Cursor/Replit Agent/Codex/Claude Code 같은 에이전트형 도구는 여러 파일 편집·명령 실행까지 자동화해 반복 비용을 줄여줍니다.본문1. 바이브코딩(바이브 코딩) 정의와 “어디까지가 바이브인가”바이브코딩(vibe coding)은 Andrej Karpathy가 2025년 2월에 "코드가 존재하는 걸 잊고 자연어로 밀어붙이는" 방식으로 언급하며 확산된 개..

AI/Technical 2025.12.28
반응형