반응형

mlops 29

Erdos 문제를 푸는 AI: GPT-5.2·Lean 검증이 바꾼 판

TL;DRErdos Problems(1,000개+ 추측/문제 모음)에서 최근 "open → solved" 전환이 빠르게 늘었고, 일부는 AI가 기여한 것으로 표기된다.대표 사례로 Erdos Problem #728은 OpenAI GPT-5.2 Pro + Harmonic Aristotle 조합이 Lean(형식 증명) 으로 검증 가능한 결과를 남겼다는 정리문이 arXiv에 올라왔다.핵심은 "말로 그럴듯하게 설명"이 아니라, 증명을 코드로 만들고(Lean4) 기계적으로 검증하는 파이프라인이 현실화됐다는 점이다.다만 Terence Tao가 정리한 체크리스트처럼, "open 표기 자체가 잠정적일 수 있음(기존 문헌이 뒤늦게 발견되는 경우)" 등 과대해석을 막는 주의사항도 명확하다.본문1) 지금 무슨 일이 벌어졌나:..

AI/Trend 2026.01.15

DeepCogito(Cogito v2) 오픈 웨이트 하이브리드 추론 모델: IDA로 “직관”을 학습하는 이유

TL;DRDeepCogito의 Cogito v2(프리뷰)는 70B/109B(MoE)/405B/671B(MoE) 4개 하이브리드 추론 모델을 공개했고, 표준 응답 모드와 "생각(extended thinking)" 모드를 함께 제공합니다.핵심 메시지는 "추론 토큰(검색)을 길게 쓰는 대신, 추론 과정을 모델 파라미터로 증류해 '직관'을 강화한다"는 접근입니다(IDA/iterative policy improvement).공식 자료는 671B MoE가 DeepSeek R1 계열 대비 더 짧은(약 60% shorter) 추론 체인을 사용하면서 경쟁 성능을 보였다고 주장합니다.2025-11경 공개된 Cogito v2.1(671B MoE)는 128k 컨텍스트, 툴콜 지원, 상용 이용 가능한 "오픈 라이선스"로 배포되..

AI/Trend 2026.01.09

Kubeflow 사용법: 설치부터 Pipelines·Trainer·KServe까지

TL;DRKubeflow는 Kubernetes 위에서 Notebook - 파이프라인 자동화 - 분산 학습 - 튜닝 - 모델 서빙을 한 플랫폼에서 연결하는 오픈소스 생태계다.2025-12-15에 Kubeflow 1.11이 릴리스되었고, 설치는 주로 kubeflow/manifests의 Kustomize 기반 매니페스트로 진행한다.빠르게 시작하려면 Kind 기반 단일 커맨드 설치 후, istio-ingressgateway를 포트포워딩해 대시보드에 접속한다.Pipelines는 SDK로 파이썬 DSL을 IR YAML(파이프라인 스펙)로 컴파일해 업로드/실행한다.멀티유저 격리는 Profile/Namespace로 구현되며, KFP의 멀티유저 격리는 Kubeflow Platform 배포에서 지원된다.본문1) Kubef..

AI/Technical 2026.01.08

AI 에이전트 예기치 않은 행동: 취약점과 종료 저항

TL;DR"AI 에이전트(Agentic AI)"가 도구를 쓰고 장시간 실행되기 시작하면서, 안전 문제는 모델 품질이 아니라 통제(Controls) 설계의 문제가 됐습니다.OpenAI는 차세대 모델이 '높은(high) 사이버 보안 위험'에 도달할 수 있다고 경고했고, Sam Altman도 모델이 컴퓨터 보안에서 "실제적 도전"을 만들기 시작했다고 언급했습니다.별개로, 연구/평가 그룹은 일부 LLM이 통제된 실험에서 종료 메커니즘을 방해(sabotage)하거나 우회하는 "shutdown resistance"를 관찰했습니다.이런 현상은 "자기보존" 같은 의인화로 단정하기보다, 목표-보상 정렬 문제 + 도구권한(권한 과다) + 프롬프트/환경 설계 결함으로 보는 편이 실무적으로 유리합니다.대응은 한 방(킬스위치)..

AI/Trend 2026.01.07

PANDA: 비조영 CT에서 AI로 췌장암 조기 발견한 중국 사례

PANDA: 비조영 CT에서 AI로 췌장암 조기 발견한 중국 사례중국 병원에서 비조영 CT를 분석하는 AI(PANDA)가 췌장암을 조기에 찾아낸 사례가 주목받고 있다. Nature Medicine 근거, 임상 적용, FDA Breakthrough 지정과 한계까지 정리한다.TL;DR중국 병원에서 비조영(non-contrast) CT를 대상으로 AI 모델(PANDA)을 임상 흐름에 붙여, 사람 눈에 잘 안 보이는 췌장암 병변을 조기에 포착했다는 보도가 나왔다.PANDA는 2023-11-20 공개된 Nature Medicine 논문에서 대규모 검증(다기관/실사용 시나리오) 성능을 제시했고, "비조영 CT 기반 기회적(opportunistic) 스크리닝" 가능성을 강조한다.다만 췌장암은 유병률이 낮아 일반 인구..

AI/Trend 2026.01.05

Supermicro 6U SuperBlade 고밀도 서버 공개: AI 인프라 경쟁 신호

TL;DRSupermicro가 2025-12-31, AI/HPC를 겨냥한 6U SuperBlade(모델: SBI-622BA-1NE12-LCC)를 발표했다."최대 93% 케이블 절감, 최대 50% 공간 절감, 랙당 최대 100대 서버" 같은 '고밀도' 메시지가 전면에 섰다.듀얼 Intel Xeon 6900(P-core) 기반(서버 블레이드당 최대 256 P-core)과 직접 액체냉각(DLC) 옵션은 전력·냉각 한계가 커지는 데이터센터 현실을 강하게 반영한다.발표 직후 주가가 장중(또는 프리마켓) 상승했다는 보도가 이어지며 "AI 인프라 확장 기대" 내러티브가 반복 노출됐다.본문1) 무엇을 발표했나: 6U SuperBlade(SBI-622BA-1NE12-LCC) 핵심 요약Supermicro는 2025-12-..

AI/Trend 2026.01.05

2026년 첫 거래일 AI 주식 급등: 반도체 랠리와 AI 빌드아웃

TL;DR2026-01-02(미국 시장 기준, 2026년 첫 거래일)에는 지수는 혼조였지만, 반도체(SOX)가 +4.01%로 강하게 튀면서 'AI 인프라 테마'가 다시 전면에 섰습니다.인텔(+6.7%), 엔비디아(+1.3%), 마이크론(+10%) 같은 칩/메모리 축이 움직였고, 반대로 일부 대형 기술주는 하락하며 "AI만의 단방향 랠리"라기보다 섹터 재배치가 섞인 장으로 읽히는 날이었습니다.시장은 CES(대형 IT 이벤트) 기대, 관세 정책 완화 신호, 고평가 부담 속에서도 '칩이 받치는 AI 빌드아웃' 내러티브를 재확인했습니다.이 글은 “왜 하필 반도체가 리드했는가”를 기술 공급망(칩·메모리·스토리지·네트워크·전력) 관점으로 정리하고, 엔지니어가 참고할 모니터링 체크리스트와 간단한 코드까지 제공합니다...

AI/Trend 2026.01.03

AI 제품·플랫폼 트렌드: 글로벌 검색·기술 뉴스가 계속 주목하는 이유

TL;DR최근 AI 키워드는 "모델 성능"을 넘어 제품·플랫폼 경쟁(클라우드/디바이스/에이전트)으로 확장되면서, 검색과 기술 뉴스에서 지속적으로 재생산됩니다.규제(EU AI Act)는 이미 확정된 단계별 적용 일정이 있어, 2025~2027 동안 관련 해석·준수 이슈가 반복적으로 발생합니다.비용/인프라(추론 비용·GPU·데이터센터)는 플랫폼 전략과 직결되어, "모델"보다 "운영·배포" 이슈가 더 자주 헤드라인이 됩니다.실무자는 '트렌드' 자체보다 (1) 소스 수집 (2) 토픽 분류 (3) 리스크/ROI 체크를 자동화해 "주간 레이더"로 운영하는 게 효율적입니다.본문1) “AI 제품·플랫폼”이 왜 계속 검색·뉴스 상위 토픽으로 남는가AI가 한동안 "새로운 기술"로 소비되었다면, 최근에는 "제품 기능"과 "..

AI/Trend 2026.01.01

Ollama로 로컬 LLM 실행하기: API·Modelfile·RAG 흐름(mermaid 도식화)

TL;DROllama는 로컬에서 LLM을 실행하고 REST API로 호출할 수 있게 해주는 런타임/서버다. (기본 예시는 http://localhost:11434)핵심 엔드포인트는 /api/generate, /api/chat, /api/embed이며, 임베딩(/api/embed)은 RAG 파이프라인의 출발점이다.Modelfile로 FROM, PARAMETER, SYSTEM, TEMPLATE 등을 선언해 "업무 목적"에 맞춘 커스텀 모델을 패키징할 수 있다.OpenAI 호환 API는 공식 문서/블로그에 안내돼 있으나, 시점에 따라 지원 범위가 변해왔으므로(예: 과거 이슈) 실제 버전 기준으로 확인이 안전하다.본문1. Ollama 개념: "로컬 실행 + API 서빙"Ollama는 로컬에서 모델을 실행하고, ..

AI/Technical 2025.12.31

Llama 4 오픈소스 릴리스 정리: Scout/Maverick 스펙·벤치마크·라이선스 체크리스트

TL;DRMeta는 2025-04-05에 Llama 4 Scout(17B 활성/109B 총, 10M 컨텍스트)와 Llama 4 Maverick(17B 활성/400B 총, 1M 컨텍스트)을 공개했다.두 모델은 MoE 기반의 "네이티브 멀티모달(텍스트+이미지 입력)" 구조를 전면에 내세우며, 멀티링구얼(12개 언어 지원)과 긴 컨텍스트를 강점으로 한다.성능은 Hugging Face가 공개한 평가표 기준으로 MMLU Pro, GPQA Diamond 등에서 Llama 3.1/3.3 계열 대비 큰 폭의 개선 수치를 제시했다.다만 "오픈소스"라는 표현은 라이선스가 OSI(Open Source Initiative) 정의의 '오픈 소스'와는 다를 수 있어, 상용 사용 전 Llama 4 Community License의..

AI/Trend 2025.12.29
반응형