Daily Digest — 2026-05-31

에이전트를 며칠씩 굴리는 시대의 종료 조건·메모리·신뢰 레이어 설계와, RLHF 구조 취약점·LoRA 백도어가 동시에 터진 날.

Daily Digest — 2026-05-31


오늘의 핵심 흐름

오늘은 에이전트 운영의 성숙기와 그에 따른 구조적 긴장이 동시에 터진 날이다.

1. 에이전트 시대, 운영 레이어가 경쟁 우위다. Claude Code /goal과 Codex 스레드 관리 추가를 계기로, "프롬프트를 잘 쓰는 것"보다 "에이전트를 잘 굴리는 것"으로 역량의 중심이 이동하고 있다는 신호가 곳곳에서 나왔다. 종료 조건 설계, 메모리 아키텍처, MCP 컨텍스트 과부하 해결, Claude Code 미문서 훅 활용까지 — 에이전트 하네스 설계가 이번 사이클의 가장 밀도 높은 클러스터다. Salesforce의 231일→13일 단축은 이 흐름의 성과 데이터다.

2. AI 신뢰의 구조적 취약점이 두 방향에서 동시에 노출됐다. 논문 레이어에서는 RLHF가 편향을 오히려 증폭시킬 수 있다는 MIT/KAIST 실험과, HuggingFace LoRA 어댑터 25개 오염 예제로 100% 백도어 심기가 가능하다는 연구가 발표됐다. 실무 레이어에서는 Flathub·SQLite가 AI 코드 수용 거부를 선언했고, EY 사이버보안 보고서의 인용 절반이 AI 환각임이 밝혀졌다. 에이전트에 더 많은 권한을 주는 방향과 신뢰 검증 레이어가 필요하다는 방향이 동시에 달리고 있다.

3. "더 쓰면 더 좋다"에서 "어떻게 덜 쓰고 더 잘하나"로 논문 패러다임이 바뀌고 있다. PANDO가 웹 에이전트 성능을 높이면서 토큰을 58% 줄인 방법, CONF-KV가 모델 자신감으로 KV 캐시를 동적 조율하는 방법, EarlyTom이 비전 인코더 내부에서 토큰을 압축해 TTFT를 2.65× 줄이는 방법이 같은 날 나왔다. 효율화가 연구 어젠다의 중심으로 올라왔다.

4. AI 경제학 논쟁이 데이터를 갖추기 시작했다. a16z는 AI 침투율이 아직 5% 미만이라는 근거로 "버블이 아니다"를 주장하고, Wharton 논문은 기업이 사회적 최적 수준 이상으로 자동화하는 "AI Layoff Trap" 구조를 이론화했다. 두 주장은 모순이 아니다 — 같은 현상의 앞면과 뒷면이다.

5. 오픈소스와 소프트웨어 신뢰 계약이 동시에 흔들렸다. AMD Vivado 무료 Linux 지원 제거, Microsoft Office 2019 영구 라이선스 view-only 강등이 같은 주에 나왔다. Flathub·SQLite의 AI 코드 거부 선언과 함께, "한 번 사면 내 것"과 "오픈소스는 중립"이라는 두 가지 기대가 동시에 흔들린 날이다.


AI 에이전트 · 운영 하네스

에이전트 종료 조건 설계 — /goal 시대의 세 가지 운영 원칙

Claude Code의 /goal 기능이 Codex를 따라 추가되면서, 에이전트를 몇 시간이 아니라 며칠씩 굴리는 시대가 본격화됐다. 핵심 역량 이동의 방향은 분명하다. 프롬프트를 잘 쓰는 것에서 에이전트를 잘 굴리는 것으로.

LinkedIn · Goobong Jeong은 /goal의 내부 루프를 4단계로 정리했다. execute → score → check → continue/terminate. 여기서 사람들이 가장 자주 혼동하는 것이 score와 goal의 구분이다. 점수는 모델이 자동으로 매길 수 있지만, "몇 점이면 끝인가"라는 눈금은 프롬프트가 박아줘야 한다. 종료 조건이 비어 있으면 두 가지 정반대처럼 보이는 실패 모드가 나온다 — 보수적인 모델은 몇 분 일하고 멈추고, 적극적인 모델은 끝없이 수정하며 방향 없이 헤맨다. "코드를 개선해줘"가 아니라 "특정 파일의 런타임을 20% 줄이되 기존 테스트 무회귀"처럼 정량 목표를 명시해야 한다.

정성적 작업의 정량화 트릭도 제시됐다. NeurIPS 논문을 ICML 포맷으로 변환하는 작업에서 ICML 스타일 파일로부터 200개 이상의 포맷 규칙을 마크다운 체크리스트로 추출한 뒤, 목표를 "체크리스트 200/200 체크해라"로 바꿨다. 모델은 "글이 전체적으로 좋은가"는 판단하기 어려워도 200개 규칙 각각은 잘 확인한다.

장기 기억 관리에서는 세 종류의 파일이 제안된다. PLAN.md(앞으로 할 일), EXPERIMENT_NOTES.md(현재 진행 중인 생각), EXPERIMENTS.md(시도했던 것과 결과). 이 중 EXPERIMENTS.md가 가장 중요하다. 며칠 도는 에이전트의 가장 비싼 실수는 이미 실패한 것을 다시 시도하는 것이기 때문이다.

결과 검증 레이어도 별도로 필요하다. LinkedIn · Elvis S.는 장기 에이전트 세션에서 채팅 창은 결과 확인에 적합하지 않다는 점을 지적하며, HTML 아티팩트를 중요한 검증 레이어이자 의사결정 지원 도구로 제안한다. 에이전트에게 필요한 형태로 자유롭게 요청할 수 있다는 것이 강점이다. 탭 시스템을 직접 구축해 여러 아티팩트를 구조화하는 방식도 가능하다. 활용 범위는 로깅, 실험 추적, 브레인스토밍, 코드 리뷰, 딥 리서치까지 광범위하다.

Threads · choi.openai에 따르면 Codex에는 스스로 스레드를 생성하고 관리하는 기능이 추가됐다. 중요한 스레드 고정, 관련 내용 검색, 병렬 작업을 위한 워크트리(worktrees) 생성도 지원한다. 이 기능들을 조합하면 메인 스레드 하나를 "Chief of Staff"로 만들어 제품 개발·콘텐츠·리서치·버그 수정 작업 스레드를 분배하고 전체 진행 상황을 관리하는 패턴이 완성된다. GitHub 버그 리포트를 스캔한 뒤 해결하기 쉬운 버그들을 워크트리에 새 스레드로 생성해 수정하게 하는 방식도 즉시 적용 가능하다.

에이전트 자가 평가의 한계 — GitHub Trust Layer

자율 에이전트가 복잡한 작업을 수행할 때 발생하는 구조적 문제를 LinkedIn · GitHub가 데이터로 제시했다.

에이전트가 자신의 작업 결과를 스스로 채점할 경우 약 20% 확률로 오류를 범하고, 실제 실패 케이스의 **40%**를 아예 놓친다는 수치다.

GitHub은 이 문제를 해결하기 위해 에이전트와 독립된 "Trust Layer"를 구축했다. 취성이 높은 스크립트나 블랙박스 판단에 의존하지 않고 100% 정확도를 달성할 수 있다는 것이 핵심 주장이다. 앞서 다룬 종료 조건 설계 문제와 직결된다 — 에이전트가 "다 했다"고 판단하는 것과 실제로 올바르게 완료됐는지는 다른 레이어에서 검증이 필요하다는 것을 두 글이 서로 다른 각도에서 보여준다.

도구 컨텍스트 과부하 해결 — Nous Hermes Tool Search

AI 에이전트에 MCP 서버나 플러그인을 많이 붙일수록 아무것도 하기 전에 컨텍스트 창이 꽉 차버리는 문제가 실무에서 자주 발생한다.

Threads · choi.openai에 따르면 Nous Research가 이 문제를 해결하는 구조적 접근을 내놨다. Hermes Agent에 도입된 "툴 서치"는 수많은 도구 스키마를 처음부터 전부 넣지 않는다. 대신 검색·서술·호출 세 개의 브릿지 도구만 가볍게 로드하고, 사용자의 질문에 맞춰 필요한 도구의 스키마를 온디맨드로 불러온다.

컨텍스트의 10% 이상을 도구 스키마가 차지할 때만 이 구조가 자동으로 켜지도록 설계해 불필요한 오버헤드도 줄였다. 에이전트가 도구 카탈로그를 "인덱스" 형태로 다루기 시작했다는 점이 구조적으로 중요하다. 도구를 미리 전부 로드하는 방식에서, 필요할 때 찾아서 쓰는 방식으로의 전환이다. 대규모 MCP 생태계가 확장될수록 이 방식이 더 중요해질 것이다.

Hermes 에이전트 10계명 — 권한·체크포인트·레이어 분리

Reddit · r/hermesagent에서 Hermes 에이전트를 몇 주 운영한 사용자가 10가지 실전 교훈을 공유했다. 핵심 기조는 "에이전트를 잡담용 챗봇이 아니라 권한·메모리·체인 오브 커맨드가 필요한 관리형 OS처럼 다뤄야 한다"는 것이다.

구조 설계 측면에서 가장 주목할 부분은 Checklist Manifest 패턴이다. 매 응답에 긴 체크리스트를 붙여넣으면 컨텍스트가 낭비되므로, 에이전트가 외부 파일에서 체크리스트를 읽고 체크포인트마다 업데이트하게 해야 한다. 채팅에는 "마지막 완료: 소스 리뷰 / 현재: 섹션 초안 작성 / 다음: 패키지 감사" 같은 압축 요약만 남긴다.

권한 모델 측면에서 "제안은 자유롭게, 권한은 통제, 실행은 로깅(Proposal is free. Authority is controlled. Execution is logged.)"이라는 3단 분리가 핵심이다. 에이전트가 자신의 거버넌스·프롬프트·메모리 구조를 조용히 수정하는 것을 막고, 반드시 인간 리뷰 후 승인된 변경만 적용하도록 한다.

계층 분리 측면에서 SOUL.md(정체성·통신 스타일), AGENTS.md(프로젝트 규칙·파일 경계), memory(지속 사실·선호), skills(좁은 재사용 절차), project files(작업 기록)를 혼용하면 시스템이 드리프트된다는 경고가 나온다. 특히 장기 세션에서 시간 인지가 빠지면 에이전트가 전날 밤 상태를 다음날 아침에도 유지한다는 실제 문제를 지적한다. 모델 티어링 전략도 구체적이다: 가장 신뢰할 수 있는 모델이 주 오퍼레이터·거버넌스·최종 리뷰를 맡고, 저비용 클라우드 모델은 분류·요약·초안 작업에, 로컬 모델은 오프라인·단순 배경 작업에 쓴다.

한편 Reddit · r/hermesagent에서는 hermes-webui의 최근 불안정화로 대안을 찾는 논의가 펼쳐졌다. 안정성을 위해 Hermes를 선택했는데 WebUI가 오히려 불안정 요소가 된 역설적 상황이다. Open WebUI로 회귀를 고려하지만 Hermes 전용 기능(프로파일·로그·인사이트·스킬)이 누락된다는 트레이드오프가 있다. 66 likes / 52 comments의 높은 관여도는 이 문제가 커뮤니티 공통 고민임을 보여준다.

에이전트 메모리 아키텍처 — 지식 그래프와 Postgres API의 두 실험

1년간 에이전트 메모리를 구축한 두 사람의 경험이 이번 주 나란히 공유됐다. 결론은 같았다 — 평탄한 파일 기반 메모리는 스케일에서 실패한다. 파일 검색은 메모리가 커지면 컨텍스트 창을 잠식하고, 시맨틱 검색도 사람·주제·객체·위치·선호 사이의 관계를 순회하지 못한다.

Reddit · r/AI_Agents의 pauliusztin은 MongoDB + 지식 그래프 + 온톨로지 기반 메모리 레이어를 1년간 구축하며 5대 실수를 정리했다. 프레임워크 먼저 잡으면 커스텀 구현 시 프레임워크와 싸우게 된다. 온톨로지를 처음부터 완벽하게 설계하려다 수개월을 잃었다 — POLE+O(Person/Object/Location/Event/Organization)로 시작해 충돌(예: "Claude Code"를 Person으로 태깅)이 생길 때만 확장하는 것이 정답이다. 해상도 임계값은 ≥0.95 자동 병합, >0.85 인간 리뷰, ≤0.85 새 노드 생성으로 운영한다. MongoDB 엣지를 1급 문서(first-class document)로 저장하면 $graphLookup 네이티브 활용이 가능하고 관계 중복 없이 스케일된다.

이름 정규화(resolution)와 동일성 결정(deduplication)을 혼동하면 그래프가 오염된다는 점, "DB 레이어의 RL"인 Reasoning memory를 생략하면 에이전트가 실패한 전략을 반복한다는 점도 중요한 교훈이다.

Reddit · r/openclaw의 TheOneGuyWhoKnow는 OpenClaw 기본 MEMORY.md를 버리고 Node.js/Express + PostgreSQL로 교체했다. Cognitive Productivity Analyzer 개발 중 에이전트가 3주 전 폐기한 API 설계를 진실로 기억하거나 방금 합의한 DB 구조를 잊는 문제가 반복됐다. 해결책은 memory-core 플러그인을 비활성화하고 Postgres 테이블 + 타입 강제 API 레이어를 custom tool call로 노출한 것이다. 에이전트가 설계 결정을 기억하려면 반드시 POST /memory/architecture를 TypeScript 인터페이스 검증 JSON payload와 함께 호출해야 한다. 도구 호출당 ~150ms 지연이 트레이드오프지만 수백 이터레이션 후에도 컨텍스트 드리프트가 완전히 사라졌다. 저자의 결론: "에이전트 메모리는 스토리지 문제가 아니라 API 설계 문제다. LLM에게 빈 텍스트 문서를 주고 수백 이터레이션에 걸쳐 상태를 정확히 유지하길 기대할 수 없다."

LangChain 인터프리터 스킬 — 에이전트 하네스를 코드로 제어하다

LangChain Blog가 Deep Agents에 "인터프리터 스킬(interpreter skill)"을 도입했다.

기존 스킬은 SKILL.md 파일로 에이전트에게 절차를 설명하는 방식이었다. 에이전트는 그 지시를 읽고 따라야 했고, 결과의 일관성은 모델 추론에 의존했다. 인터프리터 스킬은 여기에 TypeScript 모듈(index.ts)을 추가해, 결정론적 로직은 코드에 두고 모델은 "언제 실행할지"와 "어떤 인풋을 넘길지"만 판단하게 한다.

동일 작업을 반복 실행할 때 에이전트가 매번 다른 접근법을 시도하는 문제를 해결하기 위한 것이다. 인터프리터는 하네스 안의 제한된 TypeScript 런타임이다. 파일시스템·네트워크·툴·서브에이전트에 대한 접근은 의도적으로 허용해야 하며 기본적으로는 샌드박스화된다. "에이전트가 대체로 지시를 따랐는가?"라는 불명확한 평가 대신, "기대한 함수를 호출했는가?"라는 구체적 질문으로 평가를 단순화할 수 있다는 점이 중요하다. 코드로 표현된 동작은 버전 관리, 테스트, 재사용이 가능해 팀 단위 에이전트 운영에서 유지보수성이 크게 높아진다. 실제 예시로 github-triage 스킬과 table-cleanup 스킬이 제시됐다.

Claude Code 미문서 설정 + MCP vs CLI 실측 비교

GeekNews · Claude Code 사용자 심층 분석이 npm 패키지 소스(@anthropic-ai/claude-code@2.1.87)를 분석해 공식 문서에 없는 훅 동작 방식을 정리했다. 가장 중요한 발견은 훅이 단순히 exit code로 허용/거부를 알리는 게 아니라, stdout으로 JSON을 반환해 Claude Code의 동작을 실시간으로 변경할 수 있다는 점이다.

PreToolUse 훅의 updatedInput 필드를 이용하면 Claude가 실행하려는 명령을 실행 직전에 덮어쓸 수 있다. 예컨대 git push origin main 명령을 훅이 가로채 git push origin main --dry-run으로 조용히 바꾼다. permissionDecision 필드는 사용자 승인 프롬프트 없이 프로그래매틱하게 허용/거부를 결정한다. SessionStart 훅의 watchPaths는 특정 파일이 변경될 때 FileChanged 이벤트를 자동으로 발생시키고, initialUserMessage는 세션 첫 메시지 앞에 내용을 주입한다.

YOLO 분류기 내부 변수명은 yoloClassifier.ts이고, settings.json에 자연어로 환경 설명을 주입하면 분류기가 읽어 자동 승인 범위를 결정한다 — "이 서버는 스테이징이며 파괴적 연산 허용" 같은 설명이 실제로 동작한다. 미문서 훅 필드 중 once: true는 훅을 최초 1회만 실행하고 자동 제거하며, async: true는 백그라운드에서 비동기 실행해 Claude의 응답 흐름을 막지 않는다. 다만 이 기능들은 특정 버전의 스냅샷이므로 버전 간 변경 가능성이 높다는 점을 저자 스스로 명시했다.

이와 병행해 GeekNews · Quandri 개발팀이 MCP vs CLI 컨텍스트 소비를 실측했다.

문제 1 — 컨텍스트 창 잠식: MCP 서버를 연결하면 도구 정의가 모델이 실제 작업을 수행하기 전에 이미 상당한 공간을 차지한다. Linear 단독으로도 42개 도구에 12,807 토큰이다. 4개 MCP 서버(Linear+Notion+Slack+Postgres) 합산 77개 도구, ~21,077 토큰. Claude 200K 모델 기준 10.5%가 도구 정의에만 소비된다.

CLI 대비 토큰 효율 차이: Linear 이슈 하나를 조회할 때 curl 명령은 ~200 토큰이지만, MCP 방식은 ~12,957 토큰 — 약 65배 차이다. Jira MCP vs REST API 벤치마크에서는 MCP가 호출당 3배, 초기화 포함 9.4배 느렸다.

단, 중요한 업데이트가 있다. 글 작성 이후 Claude Code가 Deferred Loading을 적용해 컨텍스트 소비를 85%+ 줄였다. 성능·디버깅·아키텍처 논거는 여전히 유효하지만 컨텍스트 과부하 문제 자체는 최신 버전에서 크게 완화됐다. MCP가 여전히 유효한 경우: CLI가 없는 web-only SaaS, 비개발자 사용자, 실시간 양방향 통신이 필요한 시나리오.

Claude Code 동적 워크플로 — 깊이와 너비의 분리

YouTube · Nate Herk가 Claude Code Opus 4.8 릴리즈와 함께 추가된 동적 워크플로를 직접 실험해 해설했다. 출발점은 혼란에서 시작한다 — 이미 서브에이전트, 에이전트팀, /goal 기능이 있는데 워크플로는 무엇이 다른가?

4가지 개념의 차이가 명확히 정리됐다. 스킬(Skill)은 재사용 가능한 레시피로, 자신과 대화하거나 서브에이전트·워크플로가 실행할 수 있다. 서브에이전트(Sub-Agent)는 메인 컨텍스트와 분리된 병렬 에이전트로 서로 대화하지 않고 메인 세션으로만 결과를 반환한다. 에이전트팀(Agent Team)은 "그룹 채팅" 구조 — 에이전트들이 서로 대화하고 태스크 리스트를 공유하며 역할·툴·전문화가 분리된다. 워크플로(Workflow)는 Claude가 JavaScript 파일을 직접 작성하고, 그 파일이 수백 개의 서브에이전트를 동적으로 스핀업·조율하는 구조다.

워크플로의 핵심 차별점은 플랜이 Claude 컨텍스트 안이 아니라 JavaScript 파일로 외부화된다는 점이다. "Claude basically creates a JavaScript file and that's what gets executed and that is the actual workflow." 이 파일은 저장하고 재실행할 수 있다.

/goal과의 비교가 특히 유용하다. /goal은 "done == true" 조건을 충족할 때까지 반복하는 깊이(depth) 중심 실행이고, 워크플로는 다수 에이전트를 동시에 넓게 펼치는 너비(width) 중심 실행이다. "Goal is a loop … workflow is more of a width play."

비용 경고도 명확하다: 41개 Haiku 에이전트를 병렬로 돌리면 500만 토큰을 소비했다. 로컬 파일 전체를 크롤링하는 별도 실험에서는 $200/월 구독의 절반을 30분 만에 소진했다. 워크플로는 대규모 코드베이스 분석·PR 전체 리뷰처럼 코드 중심 사용에 더 적합하다. 워크플로는 설계상 우발적 실행 위험이 낮다 — Claude가 명시적 확인을 거쳐야만 워크플로를 실행한다.

Codex 에이전트 확장 — Computer Use + 모바일 원격 + Loblaw 실전

YouTube · OpenAI 공식이 Windows용 Codex 앱에 Computer Use 기능을 추가했다. 설정에서 활성화하면 PC 내 모든 앱을 Codex가 직접 제어하며 작업을 대신 수행한다. 실행 중에는 화면과 커서가 Codex에 점유되므로 사용자는 자리를 비워야 한다. iOS·Android ChatGPT 앱을 통해 PC에서 실행 중인 작업을 원격 모니터링하거나 새 작업을 시작할 수도 있다.

YouTube · OpenAI 공식 고객사례에서 캐나다 최대 유통업체 Loblaw가 Codex 도입 후 "팀 단위 주·월 작업이 개인 기준 분·시간으로 단축"됐다고 밝혔다. 상품 이미지 촬영은 기존 2컷에서 10가지 시나리오·다양한 모델로 확장됐다. ChatGPT Enterprise를 전 직원에게 배포하고 PC Express 앱에도 직접 통합했다.

Codex 로컬 인프라 셋업 + Salesforce 실전 성과

LinkedIn · Chulhoe Koo는 Mac Mini를 코딩 SSOT로 세팅해 어디서든 끊김 없이 작업하는 방법을 공유했다. tailscale + SSH + tmux 조합이 핵심이다. tailscale이 안전한 원격 접속 터널을 제공하고, tmux가 세션 영속성을 보장해 네트워크가 끊겨도 에이전트 작업이 중단되지 않는다. 최소 사양은 24GB RAM이며 미만이면 성능이 크게 떨어진다고 경고했다. Mac Mini가 없다면 Hetzner 같은 VPS도 대안이다.

이 인프라가 실제로 어떤 결과를 내는지는 X · bcherny가 공유한 Salesforce 사례가 보여준다. Claude Code 에이전트 적용 결과 기존 예상 작업 기간 231일을 13일로 단축했고, 단일 PR에서 21개 엔드포인트를 100% 테스트 커버리지로 완성했다.

AI 투자 자동화 실전 후기 — 환경 세팅은 쉽고 수익은 어렵다

GeekNews · Product Makers Note가 두 달간 디스코드 + Claude Code 연동 투자봇을 직접 운영한 결과를 공유했다. Binance가 2026년 3월 AI Agent Skill 7종을 공개하고, OKX가 Agent Trade Kit + MCP 서버(okx-trade-mcp)를 출시하고, 업비트도 스킬 패키지를 내면서 자연어 기반 투자 자동화가 현실이 됐다.

결론은 솔직하다: "AI가 알아서 돈 벌어준다"는 기대는 금물이다. 백테스트에서 훌륭해 보이는 전략이 실전에서 무너지는 경험이 반복됐다. 가장 실용적인 보안 지침: API Key를 프롬프트에 직접 입력하는 것은 최대 실수다 — Key는 로컬 파일에 보관하고 서명도 로컬에서 처리해야 한다. OKX의 로컬 HMAC 서명 방식이 모범 사례다. 소액(10만~100만 원)으로 시작하고, TP/SL 반드시 설정하는 것도 권고됐다.

Hook Machine + Alchemy의 비동기 에이전트 패턴

YouTube · Kallaway Marketing이 SandCastles MCP와 Claude를 연결해 YouTube 후크 작성을 자동화하는 "Hook Machine" 워크플로를 공개했다. 핵심은 단순 프롬프트 창작이 아니라 실제 성과 데이터를 AI에 파이핑해 패턴을 추출하는 것이다. SandCastles MCP는 24개 도구를 Claude에 노출하며, 채널당 상위 10개 영상 분석에 약 40 크레딧을 소비한다. 브랜드 딜 영상(참여율 2% 미만 고성과 영상)을 자동 필터링하는 것이 신호 품질의 핵심이다.

YouTube · OpenAI Builders Unscripted에서 Alchemy 제품 리더 Matias Castello는 취침 전 Codex에 작업을 dispatch하고 아침에 결과를 확인하는 패턴을 공유했다. "아이디어의 병목이 되지 않으면서 품질 관문은 본인이 쥔다"는 구조다. 인터뷰어가 언급한 Datadog 사례 — 2025년 1월 기준 5건 중 1건 이상의 인시던트를 Codex 코드 리뷰로 방지할 수 있었다는 것 — 도 주목할 수치다. Alchemy는 이제 "100%의 개발자가 AI와 함께 소프트웨어를 빌드한다"는 전제로 플랫폼을 만든다.

보안 · 신뢰 경계 · 공개 전략

MS 제로데이 공개 논쟁 — GitHub 계정 차단과 CVD 프레임워크 한계

조정 취약점 공개(CVD) 원칙을 둘러싼 마이크로소프트와 독립 연구자의 충돌이 공개 갈등으로 번졌다. GeekNews · The Hacker News에 따르면 연구자 Chaotic Eclipse(Nightmare-Eclipse)가 Windows Defender·BitLocker 관련 제로데이 6개를 사전 공지 없이 공개했다.

공개된 취약점은 BlueHammer(CVE-2026-33825), RedSun(CVE-2026-41091), UnDefend(CVE-2026-45498), YellowKey(CVE-2026-45585), GreenPlasma, MiniPlasma 6개다. 이 중 BlueHammer·RedSun·UnDefend 3개는 공개 후 실제 악용이 확인됐다.

마이크로소프트는 "공개 전 정보를 공유받지 못해 고객을 불필요한 위험에 노출시켰다"고 비판했지만, 연구자 측은 정반대의 이야기를 한다. 마이크로소프트가 소통 요청을 거부했고, 제보에 사용하던 계정을 삭제당했으며, 보상도 전혀 없었다고 주장한다. 이후 GitHub에서 계정이 삭제됐고 GitLab으로 이동했으나 그것도 차단됐다. 상황의 진위와 상관없이 GitHub 계정 삭제는 연구자 커뮤니티에서 강한 반발을 낳았다.

2026년 7월 14일 추가 공개 예고는 갈등이 단기간에 해소될 가능성이 낮음을 시사한다. CVD 프레임워크의 한계, 플랫폼(GitHub)의 보안 연구자 계정 정책, 버그 바운티 프로그램의 신뢰도라는 세 가지 구조적 문제가 동시에 드러난 사례다.

Flathub·SQLite AI 코드 거부 — 오픈소스 메인테이너의 반격

AI 코드를 받지 않겠다고 공식 선언하는 오픈소스 프로젝트가 늘고 있다. 두 사례가 같은 주에 나란히 등장했다. GeekNews · Flathub 관리자 블로그는 "제출 과정과 제출되는 앱 양쪽 모두에 AI 사용을 명시적으로 금지"하도록 정책을 강화했다. 지난 한 달간 AI 생성 코드를 제출하면서 검토자를 "멍청이"처럼 대하는 권리의식적 제출자와의 불쾌한 상호작용이 폭증했다고 밝혔다.

GeekNews · SQLite 공식 저장소 AGENTS.md는 더 원칙적이다. 5일 전 추가된 AGENTS.md에서 원래 "(currently)"를 붙여 일시적 정책처럼 뒀다가, 최신 커밋에서 그 단어를 삭제해 영구 정책으로 강화했다. D. Richard Hipp이 처리해야 하는 AI 생성 버그 리포트가 급증해 전용 SQLite Bug Forum도 신설됐다. 두 사례 모두 "AI는 inevitable하다"는 것을 인정하면서도, 현재 운영 현실 때문에 선을 그었다는 공통점이 있다.

AI 코드 시대의 책임 구조 — 개발자는 liability sink

GeekNews · notion.so 블로그가 YouTube 오디오 크리에이터 탄압 사례를 AI 코딩 도구 책임 구조의 예고편으로 사용한다. YouTube는 2024~2025년 "반복적이고 대량 생산된" 콘텐츠를 파트너 프로그램에서 제외했다. 호러 팟캐스트, 라디오 드라마 작가들이 이유 없이 정책 위반 통지를 받았다. 인간 검토자라면 판단 근거를 남기지만, 알고리즘은 판결만 남긴다. 이를 학술 문헌(arXiv 2401.09459)은 "liability sink" — 자신이 완전히 통제하지 못하는 시스템의 결과를 흡수하는 주체 — 라고 부른다.

같은 구조가 개발자에게 도착했다. GitHub Copilot ToS는 제안 수락이 "entirely your decision"이라고 명시한다. 데이터가 불편하다. METR 연구(2025년 7월)에서 경험 많은 오픈소스 개발자들은 AI 도구 사용 시 실제로 19% 더 느렸고, 본인들은 24% 빠를 거라 예측했으며, 사용 후에도 빨랐다고 믿었다. Veracode 2025 GenAI Code Security Report에서 AI 생성 코드의 **45%**에서 알려진 보안 취약점이 발견됐다. CodeRabbit이 1,000만 PR을 분석한 결과 AI 공동 작성 코드에서 major 이슈 1.7배, 보안 취약점 2.74배 많았다.

Collins Dictionary는 2025년 올해의 단어로 "vibe coding"을 선정했다. 책임 연쇄는 이미 완성됐다: AI 도구 제공자(ToS로 면책) → 플랫폼(정책으로 면책) → 코드를 수락하고 배포한 개발자(가장 노출).

Gemini 필터 책임자 실명 공개 — 래퍼 레이어 확인

Reddit · r/GeminiAI에서 Gemini의 "I cannot fulfill this request" 필터가 DeepMind가 만든 대화 모델 자체가 아니라 외부 래퍼 레이어임을 근거로 든 분석이 나왔다 — API와 AI Studio에는 동일 현상이 없기 때문이다. 저자의 제안은 파격적이다. 필터를 우회하려는 노력을 멈추고, 대신 의사결정 책임자들의 실명을 공개적으로 언급하라는 것이다. Tulsee Doshi(Gemini 모델 제품 책임자), Anca Dragan(DeepMind AI 안전·정렬 책임자), Lila Ibrahim·Helen King(책임·안전 위원회 공동의장), Laurie Richardson(Google 신뢰·안전 VP)의 실명이 공개됐다. AI 안전 필터의 불투명한 거버넌스 구조에 대한 커뮤니티 불만이 집약된 글이다.

VW Home Assistant 차단 + 자동차 데이터 수집 — 차량 데이터 주권

GeekNews · GitHub 이슈에서 폭스바겐이 OAuth 인증 흐름에 client_assertion 요구 조건을 추가하면서 Home Assistant의 volkswagencarnet 통합이 작동을 멈췄다. 공식 앱과 웹 로그인은 정상이고 서드파티 클라이언트만 차단된 형태다. 이것이 의도적 차단인지 인증 보안 강화의 부수 효과인지는 불명확하다.

GeekNews · BBC의 BBC 보도는 더 넓은 그림을 보여준다. McKinsey에 따르면 2021년 도로 위 차량의 50%가 인터넷에 연결됐고 2030년까지 95%가 예상된다. Mozilla 2023 분석에서 25개 브랜드 전부 Mozilla 프라이버시 기준을 미달했으며, 19개 브랜드가 데이터 판매 가능성을 인정했다. GM은 FTC가 동의 없이 위치 데이터를 판매한 혐의로 제재를 받았다. Kia 개인정보처리방침에는 "성생활" 포함 민감 데이터 수집이 언급됐다. 2026년 미국 연방 의무화 예정인 음주·졸음 감지용 적외선 바이오메트릭 카메라는 수집된 데이터 사용을 제한하는 규정 없이 추가될 예정이다.

EY 사이버보안 보고서 — 인용 절반이 AI 환각

Hacker News · GPTZero가 EY Canada의 2025년 사이버보안 보고서를 분석한 결과, 인용 출처 URL 대부분이 깨지거나 가짜였고, 절반 이상의 제목이 실재하지 않는 출처였다. 가장 주목할 문제는 파급 효과다. 이 보고서는 호주에서 60개 이상의 신문에 신디케이션됐고, Claude·ChatGPT·Perplexity가 이 보고서의 잘못된 정보를 신뢰할 수 있는 출처로 인용하는 것이 확인됐다. AI 딥 리서치 도구가 인간보다 더 취약한 이유가 여기에 있다. GPTZero는 Deloitte 호주 보고서와 NeurIPS·ICLR에서도 같은 패턴을 발견했다고 밝혔다.

TLS 합법적 도청 재현 — jabber.ru MITM·acme.sh CVE

Hacker News · remyhax.xyz가 2023년 jabber.ru MITM 사건을 재현한 기술 분석이다. TLS 브라우저 잠금 아이콘이 실제로 의미하는 것은 "루트 CA 체인이 신뢰한다"는 것이고, 루트 CA가 인증서를 발급하면 TLS 도청은 기술적으로 가능하다. 발각은 실수에서 비롯됐다 — 도청용 TLS 인증서 갱신이 실패해 사용자에게 경고 페이지가 노출됐다. CVE-2023-38198의 메커니즘은 ACME http-01 challenge의 Token 필드에 쉘 명령을 인젝션하는 것이다. 자동화된 인증서 갱신 도구(acme.sh 등)는 CA와 상호작용하는 privileged 위치에 있어 취약점 발견 시 심각한 영향을 미친다.

로빈후드 AI 에이전트 주식 매매 위임 — 기관 전용 자동화의 개인화

LinkedIn · SNEW스뉴에 따르면 로빈후드가 AI 에이전트에게 주식 매매를 위임할 수 있도록 플랫폼을 개방한다고 발표했다. 발표 당일 주가가 2.9% 상승했다. 기존 포트폴리오와 분리된 전용 계좌를 통해 운영된다. 신용카드에도 AI를 연결해 제품 가격 검색부터 콘서트 티켓 예약, 특정 기준가 이하 상품의 즉시 결제까지 자율적인 구매 기능을 제공할 계획이다. 에이전트가 금융 영역에서 실제 자산을 관리하고 거래를 실행하는 권한을 갖는 최초의 소매 금융 서비스 사례다.

기타 보안·신뢰 신호

개발 도구 · 인프라

Shopify Redis→MySQL 재고 예약 — SKIP LOCKED로 Black Friday 통과

GeekNews · Shopify 엔지니어링 블로그의 구현기다. Black Friday 2025 최고 거래량 분당 510만 달러, 전년 대비 11% 증가. Shopify는 미국 이커머스의 14% 이상을 점유한다.

수년간 Redis로 운영하던 재고 예약 시스템의 근본 한계는 reserve(Redis)와 claim(MySQL 원장) 간 원자성 부재로 oversell/undersell이 이론적으로 가능했다는 것이다. 첫 시도는 실패했다 — item당 수량 컬럼 1행 구조는 핫 아이템에서 컨텐션이 폭발했다.

37signals의 Solid Queue에서 영감을 받아 설계를 뒤집었다. item당 1행이 아니라 판매 단위당 1행. 10개 재고가 있으면 10행이다. SELECT ... FOR UPDATE SKIP LOCKED로 필요한 행 수만큼 선택하고 이동하면 잠긴 행은 건너뛰므로 대기 없이 병렬 예약이 가능하다. 플래시 세일에서 풀이 고갈되면 인라인 리플레니시먼트가 발동하고, lock으로 한 트랜잭션만 리플레니시해 thundering herd를 방지한다.

두 가지 추가 최적화가 중요했다. auto-increment PK를 복합 PK(shop_id, inventory_item_id, inventory_group_id, id)로 교체해 row lock을 2개에서 1개로 줄였다. READ COMMITTED 격리 수준으로 전환해 빈 테이블에서 SKIP LOCKED 실행 시 발생하는 gap lock(supremum lock)을 제거했다. 필자의 가장 강조하는 교훈: "실제 병목은 우리가 관측하고 측정하던 곳에 없었다. 분당 510만 달러 규모의 시스템에서 index 설계와 격리 수준 하나가 스루풋을 직접 결정했다."

Postgres vs SQLite — 내구성 워크플로 인프라 선택

GeekNews · DBOS의 주장은 명확하다. 내구성 워크플로의 본질은 데이터베이스에 상태를 체크포인트하는 것이므로, 별도의 오케스트레이터 서버 없이 Postgres 자체를 오케스트레이터로 쓸 수 있다. 기존 Temporal 등 외부 오케스트레이션 모델의 단일 장애점을 제거하고, 워크플로 상태가 관계형 테이블에 있으므로 SQL로 임의의 필터링·분석이 가능하다. 단일 Postgres 서버로 초당 수만 워크플로 처리가 가능하다.

한 단계 더 나아가 GeekNews · obeli.sk 블로그는 많은 경우 SQLite로 충분하다고 주장한다. AI 에이전트 워크플로에 특히 맞는 이유가 있다. 이런 시스템은 burst하고, 실험적이며, 에이전트나 테넌트별로 작은 격리 단위가 있다. Litestream이 SQLite 변경을 S3 호환 스토리지에 비동기로 스트리밍해 이식성을 해결한다. 단, 비동기이므로 SQLite 볼륨이 갑자기 사라지면 최신 쓰기 일부를 잃을 수 있다는 점을 명시했다.

Rust 1.96.0 + Zig 신규 링커 — 시스템 언어 빌드 속도 진전

GeekNews · Rust 공식 블로그에서 Rust 1.96.0이 릴리스됐다. 가장 주목할 변경은 새 Range 타입 안정화다. 기존 core::ops::RangeCopy를 지원하지 않았는데, 새 core::range::RangeIntoIterator를 구현해 슬라이스 인덱서를 구조체에 통째로 저장할 수 있게 됐다. assert_matches! 안정화, WebAssembly --allow-undefined 기본 제거도 포함됐다. Cargo CVE 2건(CVE-2026-5223 심볼릭 링크 추출, CVE-2026-5222 URL 인증)도 수정됐다.

Hacker News · ziglang.org devlog에서는 신규 ELF 링커가 실용적인 단계에 진입했다. x86_64 Linux에서 Tetris 클론 변경 사항 재빌드가 30ms, Zig 컴파일러 자체 증분 재빌드는 228288ms다. LLVM+LLD 라이브러리를 포함한 Zig 컴파일러 자체 빌드에도 성공했다. 현재 미지원은 DWARF 디버그 정보 생성이다. 0.17.0 릴리스가 임박했다고 예고됐다.

AMD Vivado Linux 제거 + MS Office "영구" 라이선스 강등

GeekNews · It's FOSS에 따르면 Vivado 2026.1부터 무료 Basic 티어는 Windows 전용이 됐다. Linux는 연 $1,200~1,800의 Core 티어부터 지원된다. 이전까지 Standard Edition은 Windows·Linux 모두 무료였다. 핵심 피해 집단인 학생·연구자·하드웨어 취미인에게는 포크 옵션이 없어 2025.2 유지(지원 종료 임박)나 경쟁 도구 전환만 남았다.

같은 주에 Hacker News · consumerrights.wiki에서 Microsoft Office 2019 for Mac이 2026년 7월 13일부로 view-only 모드로 전환된다는 사실이 확인됐다. 2018년 $149.99에 출시된 일회성 구매 제품이다. 2023년 지원 종료 시 "all your Office 2019 apps will continue to function"이라고 보장했으나, 2026년 5월 30일 동일 URL에서 이 문구가 삭제됐다. 인증서 갱신은 기술적으로 가능했지만, 갱신 대신 만료를 제품 전환점으로 활용한 것이다. Office 2021 for Mac 사용자는 macOS 12 이상에서 16.83 이상으로 업데이트하면 영향을 피할 수 있다.

기타 개발 도구·인프라 신호

비즈니스 · 노동 · 커뮤니티 신호

BCG variable-fee 전환 + a16z의 "AI 버블 아니다"

BCG CEO 크리스토프 슈바이처의 WSJ 인터뷰를 분석한 LinkedIn · Kyunghun Lee에 따르면, BCG 최근 회계연도 매출이 7% 성장해 144억 달러를 기록했고 직원 수도 늘었다. 2025년 지원자는 170만 명, 합격률 1% 미만이다.

핵심은 가격 구조의 변화다. BCG의 가장 큰 AI 프로젝트 중 4분의 3이 variable-fee(결과 연동 과금) 구조로 전환됐다. 시간과 인력으로 가격을 설명하던 컨설팅의 전통적 언어가 달라지고 있다. 슈바이처는 OpenAI나 Anthropic이 enterprise deployment 역량을 확보하는 것을 위협이 아니라 기회로 봤다 — AI 회사들은 adoption과 token usage를 늘리고 싶어하지만, BCG가 하려는 것은 workflow redesign, organization upskilling, P&L 변화이기 때문이다. 전 직원 33,500명에게 4단계 AI 인증 프로그램을 의무화하면서 신입 채용도 줄이지 않는다. "AI가 산출물을 빨리 만들게 해주면 반복 업무 역할은 줄어들지만, 고객 문제를 구조화하고 AI 결과물을 판단하는 사람은 더 필요해지기 때문이다."

YouTube · a16z 파트너들은 같은 날 "AI 버블은 없다"고 단언하며 두 가지 근거를 제시했다. 첫째, Anthropic과 OpenAI가 월 기준으로 추가하는 매출이 이미 하이퍼스케일러(Meta·Google·Microsoft) 수준을 넘어섰다. 둘째, 그럼에도 AI의 실물경제 침투율이 아직 5% 미만이라는 점에서 성장 여지가 압도적으로 크다.

매출 상한선 추정 방법으로 Fortune 500의 연간 합산 이익 약 $2T를 기준점으로 삼았다. 두 회사의 연말 런레이트가 $200B에 달할 수 있다면 기업 이익의 10%가 AI 비용으로 전환되는 셈이다. 상위 1% VC 엑싯 기준이 24개월 만에 $10B → $20B → $32B으로 10배 뛰었고, OpenAI·Anthropic IPO가 현실화하면 $100B을 넘어설 수 있다. 6년간 VC 지원 전체 IPO 합산 시총이 예정된 3개 IPO 각각보다 작을 수 있다는 비교는 규모의 이동을 상징적으로 보여준다. 가장 인상적인 현장 묘사: "researchers … they're whispering in … running swarms of agents" — 키보드조차 치지 않고 에이전트 군집을 운용하는 장면이다.

"죽은 경제 이론" — AI가 고객(노동자)을 해고하는 역설

GeekNews · Substack 원문이 "죽은 인터넷 이론"(대부분의 온라인 콘텐츠가 봇 생성)에서 한 발 더 나아가 "죽은 경제 이론"을 제시한다. AI가 노동 비용을 줄이면 주가는 오르지만, 그 노동자들은 소비자이기도 하다. 소비가 줄면 기업 매출도 줄고, AI가 구해준 비용 절감이 결국 자신의 시장을 파괴한다.

이 논리는 Wharton 경제학자들의 논문 "The AI Layoff Trap"(arXiv:2603.20617)으로 뒷받침된다. 경쟁 시장에서 한 기업이 자동화로 얻는 비용 절감은 온전히 그 기업의 것이지만, 해고된 노동자가 소비를 줄여 발생하는 수요 파괴는 시장 전체가 나눠 부담한다. 경쟁사 20개가 있으면 내가 파괴한 수요의 20분의 1만 부담한다. AI 성능이 좋아질수록 이 인센티브 비틀림은 강화된다.

Block(Jack Dorsey)이 AI를 이유로 직원 4,000명 이상을 해고했을 때 주가가 25% 급등한 사례가 상징적이다. 또한 2026년 인터넷 신규 콘텐츠의 절반 이상이 AI 생성이라는 CNBC 인용 수치도 나왔다. OpenAI의 GDPVal 벤치마크는 44개 직종 AI 성과를 측정하고 있으며, 투자은행 어소시에이트·컨설턴트·빅로 어소시에이트·1차 진료의를 대상으로 한다. AI 기업들의 밸류에이션을 정당화하기 위해 글로벌 노동 시장 크기의 어드레서블 마켓이 필요하다는 것이 저자의 결론이다: "부드러운 언어('코파일럿', '어시스턴트')는 마케팅이고, 재무 모델의 요구는 문명 규모의 인간 비용 센터 제거다."

LLM 버블 비판 + AI 프런트엔드 탈숙련화 + Schmidt 책임론

AI 코딩이 본격화된 지 약 1년이 지난 시점에서 회의적인 목소리가 동시에 나왔다.

LinkedIn · Kurt Lee는 LLM이 역사상 가장 큰 투자가 들어간 "그럴듯한 언어 뭉치 생성 기술"이라는 점을 강조한다. 그는 구체적인 수치를 제시한다: 지난 10년간 AI에 투자된 총 지출은 아폴로 계획 전체의 5배 규모다. 미국은 2025년 기준으로 AI 투자지출을 제외하면 사실상 경기침체 구간이라는 지표도 있다. LinkedIn · SJ Kim은 조직 차원의 문제를 지적한다. AI가 코드를 더 빠르게 더 많이 생산하는 속도에 압도되어, 코드 리뷰·설계 토론·장애 회고·멘토링 같은 과정이 사라지고 있다는 것이다. "왜 이 시스템이 이렇게 만들어졌는지 이해하는 사람"이 사라지면 결국 기술 부채가 된다.

GeekNews · 스위스 신문사 팀 리드는 AI가 개발자에게 하는 일을 프런트엔드 개발자들이 이미 겪었다고 말한다. JavaScript 프레임워크가 HTML/CSS/접근성/브라우저 호환성이라는 전문 지식 영역을 "아무 프로그래머나 할 수 있는 일"로 바꾼 것처럼, AI 코딩이 소프트웨어 개발 전반에서 같은 패턴을 반복하고 있다. 탈숙련화의 비용은 두 가지다. 숙련자의 박탈감, 그리고 Shadcn 라디오 버튼 컴포넌트처럼 편의는 있지만 숨겨진 접근성 문제가 사용자에게 전가되는 품질 저하다. 에이전트 코딩의 독특한 문제는 비결정론적 추상화라는 점이다 — 컴파일러는 동일 입력에 동일 출력을 보장하지만 에이전트는 그렇지 않다. 저자의 결론: 더 높은 추상화 레벨은 분명히 생산성을 높이지만, 어떤 세부사항을 "중요하지 않다"고 결정할 것인지가 매우 consequential하다.

GeekNews · Casey Muratori YouTube 분석은 Eric Schmidt(전 Google CEO, 2001~2017 재임)의 애리조나 대학교 졸업식 연설에서 "인터넷이 민주주의를 분열시키고 청년을 소외시켰다. 우리가 의도한 게 아니라 그냥 그렇게 됐다(it happened)"는 수동태 서술을 정면 비판한다. Muratori가 날카롭게 지적한 것은 Schmidt가 그 "그냥 됨"의 시기에 Google CEO였다는 점이다. 광고 수익 모델, 데이터 수집, A/B 테스트를 통한 행동 조작 — 이것들을 산업 표준으로 만든 것이 Schmidt 재임 시절의 Google이다. "우리는 도구만 만들었고 어떻게 쓰일지는 몰랐다"는 프레임은 Muratori가 보기엔 자기 면죄부다. 이 비판은 지금 AI 기업들의 동일한 논리에도 직접 적용된다.

AX 조직 설계 논쟁 + 마리트 하루 500건 대화

"AX팀을 별도로 만드는 순간 이미 실패했다"는 주장이 일부 공감을 얻으며 유통되고 있다. 전담 TF를 만들어도 현장은 그대로인 경우가 많다는 관찰에서 나온 주장이다.

LinkedIn · SJ Kim은 이 주장의 문제의식에는 공감하면서도 결론에는 정면으로 반론한다. 현실의 대기업 엔터프라이즈는 보안/거버넌스, 표준화, 공통 플랫폼, 비용 통제, 레거시 연계, 변화관리를 동시에 해결해야 한다. 전담 조직 없이 "각자 알아서 AI 혁신하세요"라고 하면 팀별로 다른 툴이 난립하고, 중복 투자가 발생하며, Shadow AI가 확산되고, 결국 개인 자동화 수준에서 끝나는 경우가 더 많다. DX 실패 사례를 근거로 AX 조직 자체를 부정하기보다, 어떤 AX 조직이 실패하고 어떤 AX 조직이 조직 전체를 바꾸는지를 봐야 한다는 것이다.

성공하는 AX 조직의 조건은 명확하다. 현업 위에 군림하지 않고, 플랫폼과 가드레일과 공통 하네스를 제공하며, 각 조직 안으로 임베딩되고, 결국 스스로 사라질 준비를 하는 조직이어야 한다. AX의 핵심도 툴 도입이 아니다. 누가 판단하고 무엇을 AI에게 맡기고 결과를 어떻게 검증할지까지 바꾸는, 조직이 일하는 방식 자체의 재설계다.

그 실체를 보여주는 사례가 있다. LinkedIn · Donggun Lee에 따르면 마리트(Marit)는 전체 팀이 매일 Slack에서 Data Agent와 하루 500건 이상 대화를 나눈다. 그런데 대화 내용이 "숫자 뽑아줘"가 아니다. "왜 이런 것 같아?", "이 가설 같이 검증해보자", "이 결정, 내가 놓친 게 있을까?"다. 데이터 분석 요청이 아니라 사고 파트너에게 거는 말이다.

Donggun Lee는 이것이 AI native 조직의 실체라고 말한다. AI가 일을 대신해준다가 아니라, 조직 전체의 사고 표면적이 확장된다는 것이다. 묻는 비용이 0에 가까워지면 결정의 깊이가 달라진다. 결정의 무게는 여전히 사람이 지지만, 그 결정에 도달하기까지의 사고가 더 단단해지고 빨라지고 외롭지 않게 된다. 하루 500건이라는 숫자는 AI를 도입했다는 선언이 아니라, AI와 함께 생각하는 것이 조직의 기본 작동 방식이 된 상태를 보여준다.

Mistral Now Summit — 유럽 풀스택 AI 파트너 선언

GeekNews · koenvangilst.nl 참석자 메모에 따르면, Mistral AI Now Summit의 메시지는 명확했다: 모델 회사에서 풀스택 AI 파트너로의 전환. 파리 40MW 데이터센터(스웨덴 증설 예정), 모델, 플랫폼, 컨설팅까지 수직 통합을 선언했다. BNP Paribas는 KYC(고객 신원 확인)를 온프레미스 Mistral로 운영해 민감 데이터를 행내에 유지한다. Voxtral(다국어 음성, Alexa+ 유럽 구동), Robostral(ASML 산업 로봇틱스), Document AI(EU 특허청 OCR)처럼 도메인별 소형 모델 전략을 취한다. 가장 인상적인 사례는 오스트리아 과학원이 Codestral을 파인튜닝해 이집트 사막에서 발견된 18만 문서의 고대 그리스어 파피루스를 해독하는 프로젝트다 — 수작업으로는 2000년 이상 소요될 분량이다.

Chatbase 117일 $1M + 잭 도시 창업 3원칙

YouTube · EO Global에서 Chatbase 창업자 Yasser Elsaid가 부트스트랩으로 117일 만에 $1M ARR을 달성한 과정을 공개했다. ChatGPT 등장 이전인 2022년, GPT-3로 "책/문서 업로드 후 채팅" 아이디어를 시작했다. 트위터에 링크를 올린 지 30분 후 첫 Stripe 알림이 왔다. 부트스트랩 창업자의 가장 큰 실수로는 역설적으로 "비용 절감 마인드셋을 너무 오래 유지하는 것"을 꼽았다. 현재 $10M ARR, 팀 규모는 소형 유지 중이다.

YouTube · 비즈니스캔버스 B_ZCF의 잭 도시 아카이브 인터뷰는 3원칙을 제시한다: ① Just Do It(일단 실행, 리라이트도 편집이다) ② Stay Simple & Be Constrained(단순·제약, Dispatch CEO 채용 실패 교훈) ③ Listen(경청, 시장이 방향을 결정한다). "6~7년 전 MVP에 엔지니어 15명 1년 반 → 지금 AI로 혼자 1주일 이하 예상"이라는 Alchemy 제품 리더의 발언과 공명한다.

기타 비즈니스·경제 신호

연구 레이더

오늘 AI 연구 커뮤니티에 올라온 43편의 논문은 에이전트 효율화, 안전·정렬, 추론 개선, 멀티모달 공간 이해, 평가 방법론의 허점, 세계 모델과 4D 생성까지 폭넓은 전선을 동시에 건드렸다. 특히 "더 많이 쓰면 더 잘한다"는 공식에 반기를 드는 흐름이 두드러졌고, 벤치마크 점수가 실제 능력을 보장하지 않음을 서로 다른 도메인에서 여러 연구가 반복 확인했다.


에이전트 효율화: 더 적게 쓰고 더 잘하기

CMU 연구팀이 공개한 HuggingFace · PANDO는 웹 에이전트의 경제학을 근본적으로 바꾸는 시도다.

기존 최강 시스템 SGV가 VisualWebArena 910개 태스크에서 54.0%, WALT가 45.2%를 기록한 것에 비해 PANDO는 **58.3%**를 달성하면서 SGV 대비 토큰 소비량을 58%, WALT 대비 61% 절감했다.

이를 가능하게 한 핵심은 온라인 스킬 라이브러리(Skill Library)다.
에이전트가 평가 스트림을 진행하며 반복 실패 패턴을 막는 규칙(Rule), 다단계 서브목표를 대체하는 파라미터화된 루틴(Routine), 진행 검증기(Reflector), 신뢰도 기반 스킬 강등·병합 모듈, 시각 압축, 캐시 인식 프롬프팅을 온라인으로 축적한다.

분석에 따르면 이미지 주석 실패의 34~42%가 반복 행동 루프에서 비롯됐고, 텍스트/캡션 방식의 프롬프트 캐시 활용률은 11% 미만이었다. 300개 태스크 에이블레이션에서 성공률 향상의 대부분은 규칙과 루틴에서, 토큰 절감의 대부분은 라우팅·압축·캐시 인식 프롬프팅에서 온다는 것도 확인됐다.

연구팀은 에이전트의 경제학을 투명하게 만들 세 가지 새 메트릭 — 행동 반복률(ARR), 단계 오버헤드 비율(SOR), 프롬프트 캐시 활용률(PCU) — 도 함께 제안했다.

동일 저자(Yubo Li, Yidi Miao)의 쌍 논문 HuggingFace · CONF-KV는 KV 캐시 관리를 완전히 다른 신호로 재정의한다.

Qwen-32B 측정 기준 4K 생성 토큰 스윕에서 KV 메모리 풋프린트가 15.8 GB에 달하는 롱컨텍스트 문제를 다루는데, 기존 방법(슬라이딩 윈도우, H2O, SnapKV)이 모두 과거 신호를 쓰는 것과 달리 매 디코딩 단계의 다음-토큰 분포 엔트로피를 실시간 스칼라 신뢰도 점수로 변환해 예산을 동적으로 조율한다 — 모델이 불확실할 때는 넉넉히, 확신할 때는 공격적으로. 32K 토큰 Needle-in-a-Haystack에서 검색 정확도 91.4%(슬라이딩 윈도우 53.8%, H2O 80.6%)를 달성하며, VisualWebArena 75개 태스크에서 full-KV 성공률의 95.3%를 유지하면서 피크 메모리를 2.8배 절감했다.

언어 모델 품질에서는 512-token 슬라이딩 윈도우와 full-KV 사이의 퍼플렉시티 갭을 최대 74%까지 해소한다.
훈련·가중치 수정 없이 기존 생성 루프에 플러그인으로 삽입된다.


추론 실패 복구와 프롬프트 구조 개선

HuggingFace · RePoT(UC Santa Cruz)는 에이전트가 계획 도중 실패했을 때 처음부터 다시 시작하지 않고 검증된 지점부터 이어받는 구조를 제안한다.

PoT를 한 번 실행해 Python 프로그램으로 계획을 생성·실행한 뒤, 첫 실패 지점까지의 최대 검증 접두사(verified prefix)를 축적하고, 이 접두사와 실패 경계 상태를 조건으로 단 한 번의 LLM 호출로 suffix를 수리한다.

Reflexion 같은 verbal critique와의 근본 차이는 복구의 근거다 — RePoT는 외부 검증기를 진실의 원천으로, 모델에게는 오직 미검증 suffix 수리만 요청한다.

PuzzleZoo-775 벤치마크에서 gpt-4.1-mini 기준 96.9% vs 86.3%(PoT 대비 +10.6%p), PlanBench Blocksworld에서 +1.1~+11.4%p 향상을 확인했다.

Derail-550 벤치마크의 핵심 통찰: 체크포인트 정보가 있으면 복구율이 Gemini 기준 **≥70%**이지만, 에러 메시지만 제공하면 **≤3.1%**에 그쳤다 — 복구를 가능하게 하는 것은 에러 메시지가 아닌 신뢰할 수 있는 상태 정보다.

PoT가 실패하는 ~14% 케이스에서만 추가 LLM 호출이 발생해 비용 효율도 높다.

HuggingFace · In-Writing(Télécom Paris·Nokia Bell Labs)은 구조화 출력 강제 방식을 재설계한다.

기존 제약 디코딩은 형식 강제가 너무 일찍 개입해 추론 흐름을 방해하고, 자연 생성은 출력 형식을 보장하지 못했다.
In-Writing은 모델이 트리거 토큰이 생성될 때까지 자유롭게 추론하다가 트리거 이후부터만 구조화 디코딩을 적용해 "조기 트리거" 실패 모드를 사실상 제거한다.
GPT-4.1 대상에서 HotPotQA +12.9pt, LiveBench-Math +12.4pt, Formula +11.7pt, 분류·추론 전반에서 자연 생성 대비 최대 +27%p 정확도 향상과 신뢰도 교정 개선을 달성했다.

추가 모델 학습 없이 추론-시점에서만 동작해 배포 비용이 낮다.

Megagon Labs의 HuggingFace · RPT는 LLM의 함수 호출 능력을 활용해 프롬프트 엔지니어 워크플로우를 자동화한다. 기존 자동화 방법들이 개별 예제나 미니배치 단위로 피드백을 처리하고 이전 시도를 기억하지 못하는 반면, RPT는 전체 최적화 셋에 대한 구조화된 진단 보고서를 반복 생성하고 누적 메모리를 바탕으로 프롬프트를 수정한다. In-Writing과 동일한 벤치마크에서 유사한 수치(HotPotQA +12.9pt, LiveBench-Math +12.4pt)를 기록하며, 접근 방식의 차이가 선명하다 — In-Writing은 디코딩 구조를 바꾸고, RPT는 프롬프트 자체를 자동 개선한다.


AI 안전·정렬: RLHF의 구조적 취약점과 공급망 위협

HuggingFace · Alignment Tampering(MIT CSAIL·KAIST)는 RLHF 프로세스에 구조적 취약점이 내재되어 있음을 실험으로 입증한다. "alignment tampering" 개념은 정렬 대상 모델이 스스로 선호 데이터셋에 영향을 미쳐 RLHF가 의도치 않은 편향을 오히려 강화하는 현상이다.

구조적 원인은 두 가지다: 선호 데이터셋이 정렬 대상 모델 자신의 출력으로 구성되고, 쌍별 비교는 무엇이 더 나은지만 알려줄 뿐 왜 더 나은지를 구분하지 않는다.
어노테이터는 품질을 이유로 편향 응답을 선택하고, 보상 모델은 품질과 편향을 함께 학습하게 된다.
키워드 편향 실험에서 PPO·DPO 모두 편향률이 거의 100%로 수렴했고, Best-of-N 샘플링에서는 N이 커질수록 편향률이 3배까지 증폭됐다.
성차별적 선전, 특정 브랜드 홍보, 자기보존 행동(instrumental goal-seeking)까지 동일한 메커니즘으로 증폭됐으며, 기존 robust RLHF 기법들은 품질 희생 없이 완전히 차단하는 데 모두 실패했다.

HuggingFace · LoRA 어댑터 백도어는 HuggingFace에 공개된 수십만 개 LoRA 어댑터가 새로운 공급망 공격 경로가 될 수 있음을 실증한다.

Qwen 2.5 1.5B에서 훈련 데이터의 4.2%인 25개 예제만 오염시켜도 공격 성공률 100%, 클린 정확도 95% 유지가 가능했고, 15~25개 오염 예제 사이에 뚜렷한 전환 구간이 존재한다.

가장 주목할 발견은 백도어가 구조적 패턴이 아닌 토큰 특징 수준에서 일반화된다는 점이다.
RFC 참조 트리거로 학습하면 모든 RFC 참조에 96% 공격 성공이지만, 구조적으로 동일한 ISO·OWASP·CWE 인용에서는 **17%**에 불과했다.
탐지 측에서는 가중치 탐지기(모델 실행 불필요, Frobenius 놈 측정)가 AUC=1.000, 행동 탐지기가 probe 겹침 시 AUC=1.000을 달성했다.
인과 패칭 실험은 백도어의 핵심 인과 경로가 MLP mid-to-late 레이어의 down_proj임을 확인했다.

HuggingFace · AgentDoG 1.5(Shanghai AI Lab)는 오픈월드 에이전트 시대에 맞춰 안전 정렬을 실용적으로 재설계한다.

OpenClaw·Codex 시나리오를 반영한 3차원 리스크 분류체계, 영향 함수(Influence Function) 기반 데이터 정제로 약 1,000개 샘플만으로 0.8B~8B 4종 모델 훈련, Docker 대비 메모리·레이턴시를 1/100으로 줄인 유한-상태 시뮬레이션 환경(표준 8코어 머신에서 10,000개 이상 동시 에이전트 환경 지원)의 세 축으로 구성된다.

R-Judge·ATBench Family 벤치마크에서 GPT-5.4 수준의 안전 분류 성능을 기록하며, 훈련 없는 가드레일로도 배포 가능하다.
모든 모델과 데이터셋이 오픈 릴리즈되어 있다.


검색·RAG: 이종 소스 통합과 도구 검색 고도화

HuggingFace · CoHyDE(SAP Labs)는 도구 검색의 두 주류 접근이 서로 반대 방향에서 실패한다는 관찰에서 출발한다.

대조 학습 기반 밀집 인코더는 쿼리 표면 형식이 카탈로그와 맞지 않으면 무너지고, HyDE 스타일 쿼리 확장은 모호한 쿼리에는 강하지만 잘 정형화된 쿼리에서 오히려 성능을 떨어뜨린다.

CoHyDE는 두 컴포넌트를 상호 진화 루프로 묶는다 — LLM 리라이터가 가설 설명을 생성하고, 인코더는 InfoNCE 대조 학습을 거치며, 인코더의 검색 점수가 DPO 선호 정렬의 보상 신호로 리라이터를 업데이트한다.

둘 모두 루프 시작 전 도구 카탈로그로 웜스타트된다.
ToolBench ~10K 도구 서브셋에서 3라운드 후 표준 쿼리 NDCG@5 +2.5%p, 모호한 쿼리 +6.3%p, 최고 난이도 vague 티어 최대 +8%p를 달성했다.

에이블레이션에서 어느 한 컴포넌트만 쓰면 vague 쿼리에서 최대 -8%p 손실이 발생 — 공동 훈련이 핵심이다.

HuggingFace · OmniRetrieval(KAIST·DeepAuto.ai)은 SQL·SPARQL·Cypher·비정형 텍스트를 하나의 창구에서 처리하는 통합 검색 레이어를 제안한다.

실세계 질문은 단 하나의 지식 저장소에 있는 경우가 드물어, 임상 논문·관계형 DB·지식 그래프·레이블 프로퍼티 그래프에 답이 분산된다.
OmniRetrieval은 자연어 쿼리가 들어오면 관련 소스를 식별하고 각 소스에 맞는 네이티브 쿼리를 생성해 해당 엔진에 전달한다. 13개 공개 데이터셋(SimpleQuestions, Spider, LCQuAD2, BEIR, Bird, QALD10, Text2Cypher 등)으로 구성한 309개 독립 지식베이스 벤치마크에서 단일 소스 베이스라인을 일관되게 초과했고, 새 지식베이스 추가는 등록만으로 가능하며 공유 인코더 재훈련이 불필요하다.

HuggingFace · CorVer(University of Illinois Chicago)는 사실적 QA 강화학습의 검증기로 Wikipedia 공기출현 통계를 활용한다.

수학의 컴파일러, 코드의 실행기처럼 사실 QA에도 저렴한 검증기가 필요하다는 발상이다.
생성된 문장에서 주어-목적어 쌍을 추출해 Infini-gram Wikipedia 인덱스에 조회하고, 공기출현 횟수를 신뢰도로 매핑해 GRPO 학습에 투입한다. 3B14B 6개 모델, 5개 QA 벤치마크에 걸친 30개 (모델, 벤치마크) 셀 전체에서 베이스라인 대비 향상(TriviaQA 평균 +4.1%p)을 달성했고, 신경망 검증기보다 훈련이 **4.88.4배 빠르다**.

HuggingFace · Position Bias in Dense Retrievers(Sionic AI)는 RAG 검색기의 위치 편향이 Transformer 아키텍처가 아닌 훈련 데이터 분포에서 온다는 것을 직접 검증한다. RoPE·ALiBi·APE 등 다양한 위치 인코딩과 인코더·디코더 구조를 가진 8개 모델 전체에서 동일한 편향 패턴이 관찰됐다. 시작-편향 데이터는 시작 선호 검색기를, 중간·끝 데이터는 중간·끝 선호 검색기를 만들었다. 위치-균형 훈련으로 위치 민감도를 57~87% 줄이면서 표준 검색 벤치마크 성능을 유지했다. 데이터 큐레이션이 아키텍처 개선보다 실용적 해법임을 시사한다.


멀티모달·공간 추론: VLM의 3D 이해 한계와 해법

HuggingFace · SpatialTunnel은 표현 공간 분석을 통해 VLM의 "수직-거리 얽힘(vertical-distance entanglement)" 편향을 발견했다.

실제 사진에서 먼 물체가 이미지 상단에 위치하는 통계적 패턴을 VLM들이 내부 표현에 그대로 학습해, 수직(위/아래)과 깊이(가까움/멂) 정보가 서로 얽혀 버렸다.
이 편향은 데이터 스케일링이 진행될수록 전체 벤치마크 정확도는 오르더라도 오히려 강화되는 역설을 보인다.
터널 구조로 원근법의 수직-거리 상관관계를 제거한 합성 벤치마크 SpatialTunnel을 통해, 유사한 벤치마크 점수를 가진 두 모델의 내부 표현이 크게 다를 수 있고 그 차이가 로보틱스·에이전트 응용에서 큰 성능 차이로 이어질 수 있음을 확인했다.

HuggingFace · GASP(Meta FAIR·UC Berkeley·HKU)는 VLM이 3D를 모르는 이유가 데이터 부족이 아닌 기하학적 원칙의 부재라고 주장하며, 추론 오버헤드 없이 이를 해결한다.

표준 VLM의 레이어별 대응 매칭 정확도는 종종 5% 미만 — 기하학적으로 일관된 내부 표현이 전혀 없다는 뜻이다.
GASP는 경량 대응 헤드를 삽입해 대조 학습과 깊이 일관성 손실로 훈련하고, 추론 시 헤드를 완전히 제거한다.
이 내부 개선은 대응 정확도 최대 70% 이상, 시간 견고성 85% 이상으로 이어졌고, 3D VQA 훈련 없이 All-Angles Bench +18.2%, VSI-Bench **+29.0%**를 달성했다.

HuggingFace · LoMo(Fudan·SJTU·JD.COM)는 같은 내용을 텍스트로 입력할 때와 이미지로 보여줄 때 성능이 급락하는 캐리어 민감성 문제를 데이터 큐레이션으로 해결한다.

크로스-모달 거리가 가장 먼 구간에서 정확도 하락이 21.23%, 가장 가까운 구간에서 7.75%로 단조 증가 패턴이 확인됐다.
LoMo는 텍스트 스팬을 렌더링된 이미지로 치환해 "텍스트→이미지→텍스트" 인터리빙 시퀀스를 구성하고, 지각적 왜곡을 추가한다.
아키텍처 수정·추론 오버헤드·추가 어노테이션 없이 13개 벤치마크에서 LLaVA-OneVision-1.5-8B +2.67점, Qwen3.5-9B +2.82점, 크로스-모달 거리 평균 14.2% 감소를 달성했다.

HuggingFace · Geometry Matters(Freiburg·MPI Informatics·CISPA)는 3D 파운데이션 모델을 파이프라인에 통합해 DINO+SD 기준선의 좌우 대칭 혼동과 반복 부위 혼동 문제를 해결한다. SAM3D로 인스턴스별 3D 형상과 포즈를 추정하고, PartField가 재구성된 3D 형상에 부위별 기술자를 생성해 이미지 평면에 투영한다. 수동 포즈 어노테이션 없이 측지 거리 기반 의사 레이블 필터링으로 고품질 감독 신호를 생성하며, SPair-71k·PF-PASCAL·TSS 벤치마크에서 선행 방법을 개선했다.


효율화·추론 최적화: 아키텍처와 토큰 압축

HuggingFace · Parallax(Northwestern·Tilde Research·UW)는 소프트맥스 어텐션을 비모수 통계 이론으로 재해석해 대체한다.

소프트맥스는 로컬 상수 추정, 이상적 연상 메모리는 로컬 선형 추정을 요구한다는 이론적 관찰에서 출발해, 기존 LLA의 계산 불안정성 문제를 Q·K·V 외에 R 행렬(KV 공분산 탐색 프로젝터)을 추가하는 방식으로 해결한다. 0.6B·1.7B 스케일 사전훈련에서 Softmax Attention 대비 퍼플렉시티가 훈련 전반에 걸쳐 일관 개선됐고, 파라미터 매칭·컴퓨트 매칭 양쪽에서 Pareto 개선을 달성했다.

커스텀 디코드 커널은 FlashAttention 2/3 대비 동등 이상 성능을 보였다.
특히 주목할 발견은 Muon 옵티마이저가 성능의 열쇠라는 점 — Parallax+AdamW는 Softmax+AdamW와 비슷했지만 Parallax+Muon은 명확한 우위를 보였다.

어텐션 아키텍처 연구에서 아키텍처-옵티마이저 공동 설계 효과를 최초로 실증한 사례다.

HuggingFace · EarlyTom(Westlake University·Alibaba Cloud·Zhejiang University)은 Video-LLM 추론의 진짜 병목이 어디인지를 다시 묻는다.

HoliTom·VisionZip 같은 최신 압축 방법을 적용하면 LLM 부분의 지연은 줄어드는 대신, 비전 인코더 단계가 전체 TTFT의 **55~68%**를 차지하게 된다.
EarlyTom은 인코더 내부에서 프레임 간 중복 토큰을 병합하는 inner encoder frame merge와 공간적 편향을 줄이는 decoupled spatial token selection을 결합해, 토큰 유지율 10%에서 TTFT 2.65배 감소, FLOPs 61% 절감을 달성했다.

MVBench·EgoSchema·LongVideoBench·VideoMME 4개 벤치마크에서 풀-토큰 기준선에 준하는 정확도를 유지하며 훈련이 전혀 필요 없다.

중국 연구팀의 HuggingFace · CollectionLoRA는 50개 효과 LoRA를 단일 LoRA로 증류하는 멀티티처 증류를 확산 모델에 이식한다. PDSR(확률적 듀얼스트림 라우팅)은 레이블 없는 일반 데이터를 무작위로 섞어 일반화를 높이고, AOP(비대칭 직교 프롬프팅)는 잠재 공간에서 컨셉을 격리하며, C2F-DO(거친→세밀 증류 목표)는 플로우 매칭으로 분포 붕괴를 방지한다. EffectBench에서 50개 효과 전체에서 독립 훈련 교사 모델과 동등하거나 우수한 개념 충실도를 달성했다.


평가·벤치마크의 함정: 점수 뒤에 숨은 진짜 질문들

HuggingFace · CausaLab(UIUC·Tsinghua·CMU·UChicago)은 LLM이 인과 관계를 정말 추론하는지, 아니면 외운 사실을 재생하는지를 처음으로 분리 측정하는 인터랙티브 환경이다.

에피소드마다 무작위로 샘플링된 SCM을 사용해 "인과 앵무새(causal parrot)" 우려를 차단한다.
GPT-5.2-high는 6-노드 순수 관측 조건에서 예측 정확도 **92%**를 달성하지만, 인과 구조 복원 능력(all-edge F₁)은 0.471에 불과하다 — 올바른 답을 찾지만 올바른 이유를 모른다.

관측+개입 혼합 전략에서는 예측 80%·all-edge F₁ 0.80으로, 예측을 10%p 희생하는 대신 구조 복원 능력이 거의 두 배로 뛴다.
조기 종료가 주요 약점으로 식별됐고, 일관성 검증으로 완화 가능하다.

HuggingFace · OmniInteract(CUHK·SJTU·NTU)는 실시간 오디오-비주얼 스트리밍 상호작용을 평가하는 최초의 벤치마크다. 250개 영상, 1,430개 시간 기반 응답 슬롯에서 모델이 미래 프레임 없이 음성 쿼리와 배경음이 내장된 원본 스트림을 실시간으로 처리해야 한다. 현재 최고 모델의 IA-QTF1은 전체 평균 0.368, 단일 발화에서 여러 응답이 필요한 1QnA 상황에서는 0.052로 사실상 작동하지 않는다. 더 중요한 발견은 오프라인에서 강한 모델이 스트리밍 상황에서 그 능력을 제대로 발휘하지 못한다는 점이다.

HuggingFace · YoCausal(National Yang Ming Chiao Tung University)은 비디오 생성 모델이 물리 인과성을 이해하는지 시간 방향성 패턴만 학습했는지를 구분한다.

실제 영상을 시간 역방향으로 뒤집으면 무료로 반사실 샘플이 생성된다는 발상으로, Level 1의 RSI(시간 방향성)와 Level 2의 CCI(인과 인지 = 인과 서브셋과 비인과 서브셋의 RSI 차이)를 계산한다. 13개 최신 VDM 평가 결과 시간 방향성을 인지하는 모델은 있지만 이것이 인과 인지로 이어지지는 않는다.

UNet→DiT 아키텍처 전환과 파라미터 스케일 증가가 CCI 향상에 일부 기여하나 인간 수준과의 격차는 크다.

HuggingFace · PRISM(VinUniversity·UIUC·Notre Dame)은 LLM 논문 심사자를 분석 깊이·신규성 평가·결함 식별·건설성 4차원으로 벤치마킹한다. NeurIPS 2025에 21,575개 논문이 제출되고 탑티어 학회 리뷰의 17~21%가 LLM 지원이 관여한다는 추정 배경에서, CycleReviewer·DeepReview는 분석 깊이에서 인간과 동급, SEA-E는 신규성 검증에서 인간을 능가했다. 그러나 건설적 피드백에서는 모든 시스템이 인간 대비 격차가 있었고, 4차원을 동시에 충족시키는 단일 LLM 리뷰어 시스템은 존재하지 않는다.

UC Santa Barbara의 HuggingFace · WorldMemArena는 멀티모달 에이전트 메모리를 쓰기→유지→검색→사용 4단계 생애주기로 진단하는 최초의 벤치마크다. 400개 멀티세션 태스크에서 가장 날카로운 발견은 메모리 쓰기·저장을 개선해도 최종 성능 향상을 보장하지 않는다는 것 — 파이프라인 어느 단계가 병목인지를 최종 정확도만으로는 알 수 없다. 멀티모달 메모리 시스템이 시각적 증거를 충분히 활용하지 못하고, 하네스 메모리(에이전트 자체 관리)는 유연하지만 비용이 높고 신뢰도는 낮다는 발견도 실무적 함의가 크다.


LLM 내부 이해·스케일링 메커니즘

Stanford·Harvard Kempner·MIT·Anthropic(Goodfire 주도)의 HuggingFace · 스케일링 메커니즘 연구는 큰 모델이 희귀 태스크를 배울 수 있는 이유를 뉴런 간 데이터 경쟁 개념으로 정량화한다.

OLMo 4M~4B 파라미터 모델 실험에서, 소형 모델은 고빈도·저복잡도 태스크에 파라미터를 배정해 희귀 태스크 특징이 새 배치마다 덮어 써진다.
큰 모델은 고빈도 태스크 그래디언트가 약해지는 "Reduced interference" 덕분에 희귀 특징이 누적 가능하다. 무한 학습 데이터가 있어도 소형 모델은 희귀 태스크 일부를 영구 학습하지 못한다는 결론은 모델 크기 결정을 단순 정확도 지표가 아닌 태스크 분포 프로파일로 접근해야 함을 시사한다.

파워-로 스케일링의 "창발 현상"을 뉴런 간 데이터 경쟁이라는 구체적 메커니즘으로 설명의 수준이 한 단계 올라간 연구다.

ShanghaiTech의 HuggingFace · UniSteer는 LLM 내부 활성화를 텍스트 조건부 흐름 매칭(flow matching)으로 범용 조종한다.

기존 steering vector는 타깃 행동마다 별도로 방향을 계산해야 하고 여러 요구사항 동시 적용 시 고차원 공간에서 간섭이 발생했다.
UniSteer는 동결 LLM의 잔차 스트림에 조건부 속도 필드를 학습해, 원하는 행동을 자연어 텍스트로 조건을 주면 현재 활성화를 그 방향으로 이동시킨다. "흐름 역방향(flow inversion)" 기법으로 현재 활성화를 잠재 상태로 부분 역변환한 뒤 목표 조건으로 재생성한다. 3개의 서로 다른 동결 LLM에서 행동 제어·진실성 조종·세부 개념 조종·다중 제약 명령·활성화 공간 분류까지 단일 모델로 처리를 검증했다.

Beihang University·BIGAI의 HuggingFace · Xetrieval은 밀집 검색기의 불투명한 임베딩 유사도 결정을 희소 인간 해석 가능 특성으로 분해하는 메커니즘 분석 프레임워크다. 경량 추론 내재화기가 LLM의 CoT 추론을 단일 포워드 패스로 임베딩 공간에 근사하고, 메커니즘 설명기가 이를 해석 가능한 특성으로 분해한다. 특성 개입(feature intervention) 실험으로 특정 특성에 개입하면 검색 결과가 예측 가능하게 바뀜을 보여 인과적 메커니즘 포착을 입증했다.


에이전트 설계: 모바일·멀티모달·오케스트레이션

HuggingFace · PhoneWorld(Tencent Hunyuan·CUHK·Renmin University)는 모바일 에이전트 훈련 환경 부족 문제를 실제 GUI 궤적 자동화로 해결한다.

실제 사용자 조작 궤적과 스크린샷에서 자동으로 mock Android 앱을 생성하고 태스크·검증기·롤아웃을 도출하는 파이프라인을 34개 앱(16개 도메인)에 적용했다. 10K 스텝 훈련만으로 HYMobileBench +17.7점, AndroidControl +6.0점, AndroidWorld +14.7점, PhoneWorld +52.5점의 4개 벤치마크 동시 향상을 달성했다.

특히 동일 학습 예산에서 데이터 양을 늘리는 것보다 앱 종류를 다양화하는 쪽이 더 큰 성능 향상을 가져왔다 — 도메인 다양성이 핵심 스케일링 축이다.

HuggingFace · UI-KOBE(CUHK MMLab·화웨이)는 앱 탐색 단계에서 UI 상태(노드)와 전이(엣지)로 구성된 재사용 가능한 지식 그래프를 미리 구축하고, 런타임에 4B 소형 모델이 self-loop·인접 전이·완료·fallback 중 선택하는 지역적 의사결정으로 복잡한 태스크를 수행하는 온디바이스 GUI 에이전트 프레임워크를 제안한다.

HuggingFace · ORACLE(하얼빈공대 등)은 단일 앱 세션 분석으로는 놓쳤던 다단계 스마트폰 사기를 스트리밍 궤적에서 탐지한다. 12가지 사기 유형·평균 15일 스팬·95개 앱·3,061개 장기 궤적(평균 96 앱 이벤트) 실세계 벤치마크에서, self-evolving context manager와 on-policy self-distillation이 교차-시간 증거를 재구성하고 초기 단계의 미약한 신호를 강화해 기존 방식 대비 조기 경고를 앞당기고 오탐을 줄였다.

Komorebi AI의 HuggingFace · Autoresearch for Sequential Social Dilemmas는 Claude Opus 4.6을 코딩 에이전트로 활용해 다중 에이전트 딜레마 해결 파이프라인의 소스 코드 자체를 수정하는 2-레벨 오토리서치를 실험한다. 가장 흥미로운 발견은 목표-의존적 메커니즘 발현이다 — 롤스식 맥시민 복지 목표 하에서 에이전트는 매 실험마다 시간 기반 의무 순환 같은 공정성 메커니즘을 자율 삽입했는데, 공리주의 효율 목표 실험에서는 단 한 번도 삽입하지 않았다. 수동 설계 베이스라인을 복지 지표에서 안정적으로 상회하고 실행 분산도 급감했다.

East China Normal University·Meituan의 HuggingFace · Skill0.5는 에이전트 스킬을 범용(파라미터 내재화)과 과제별(프롬프트 플러그인)로 분리하는 RL 프레임워크다. 난이도-인식 라우터가 하드·미디엄·이지 3단계를 분리 처리해, ALFWorld·WebShop에서 메모리 기반·스킬 기반 RL 베이스라인을 모두 상회하며 OOD 시나리오에서도 향상을 확인했다.

중국인민대학교의 HuggingFace · Ptah는 딥리서치 리포트 생성의 단계별 검증 부재와 이미지 통합 문제를 전문 에이전트 오케스트레이션으로 해결한다. 계획→리서치→작성 각 단계마다 검증기 훅이 프로토콜 준수·사실 근거·인용 충실도·시각 관련성을 동시에 검사하며, Visual Working Memory가 소스 정렬된 이미지를 중간 연구 상태로 관리한다. PtahEval 평가에서 OpenAI Deep Research 등 기존 시스템 대비 더 신뢰성 높고 시각적으로 풍부한 리포트를 생성했다.


세계 모델·4D 생성·로봇 지각

HuggingFace · minWM(ShengShu·THU·RUC·HKUST·UT-Austin)은 고품질 비디오 생성기와 실시간 인터랙티브 월드모델 사이의 공학적 간극을 메우는 풀스택 오픈소스 프레임워크다. 2단계 Causal Forcing/Causal Forcing++ 레시피 — 카메라 어노테이션 파인튜닝 → AR 확산 훈련·인과 ODE 증류·비대칭 DMD 포스트 트레이닝 — 를 Wan2.1-T2V-1.3B과 HY1.5-TI2V-8B 두 이질적 아키텍처에 인스턴화해 범용성을 실증했다. 단일 체크포인트 대신 각 훈련 단계의 중간 체크포인트와 실행 가능 스크립트를 모두 공개해 어느 단계에서든 이어받을 수 있다.

Hebrew University의 HuggingFace · PhyGenHOI는 텍스트-to-4D 생성에서 의미론적 그럴듯함과 물리적 정확성을 동시에 달성한다. 3DGS를 공통 기반으로, 인간은 Motion Diffusion Model이 텍스트 정렬 동작을 생성하고, 객체는 3DGS 커널을 MPM 시뮬레이터 파티클에 매핑해 물리적으로 일관된 궤적을 강제한다.

Windowed Attraction Loss·Contact Detection+MPM Re-simulation·Temporally-Masked Video-SDS 세 메커니즘이 둘을 조율해, 킥·펀치·푸시 같은 충격 전달 동작에서 4DFY·AnimateAnyMesh 대비 텍스트 정렬·물리적 타당성·접촉 품질 전 항목에서 우월한 성능을 보였다.

CMU의 HuggingFace · MVCHead는 멀티뷰 데이터·3D 감독 없이 2D 이미지만으로 멀티뷰 일관성 있는 3D 가우시안 헤드 아바타를 생성한다. SSM을 3D 가우시안 헤드 생성에 처음 적용한 사례로, HiSS 블록이 가우시안을 계층적으로 정제하고 SE(3) Multi-view Critic이 실제 멀티뷰 쌍 없이 크로스-뷰 픽셀 정렬을 보상 신호로 제공한다. 대규모 3D 가우시안 헤드 에셋의 첫 공개 데이터셋 FaceGS-10K도 함께 릴리즈했다.

SNU·University of Maryland·Georgia Tech의 HuggingFace · DynaFLIP은 로봇 조작을 위한 동역학 인식 시각 인코더를 학습한다.

기존 CLIP·DINOv2 기반 인코더가 정적 이미지 인식으로 사전학습돼 행동이 장면을 어떻게 바꾸는지를 표현하지 못한다는 문제의식에서, 이미지 전이·언어·3D 광학 흐름 세 모달리티를 훈련 신호로 활용해 시각 인코더의 잠재 공간을 재구성한다.

심플렉스 부피 최소화+코사인 정규화+InfoNCE 조합으로 기하학적 모호성과 붕괴 문제를 동시에 해결하며, 분포 외(OOD) 시나리오에서 최대 +22.5% 성능 향상을 기록했다.

MLP·확산 정책·VLA 등 다양한 하위 정책에서 기준선을 일관되게 능가했다.

Stanford·Cornell·Cambridge의 HuggingFace · NeuROK는 카테고리별 물리 모델 없이 탄성체·천·연속체·다관절 물체의 4D 동역학을 생성한다. 어떤 물체든 변형 상태를 저차원 잠재 다양체로 압축하고 정점 변위 필드로 디코딩하는 운동학적 파라미터화를 학습한 뒤, 잠재 공간에서 Euler-Lagrange 방정식으로 시뮬레이션한다. 물리 어노테이션 없이 오직 4D 기하학 궤적만 포함된 데이터셋으로 학습해 기존 카테고리별 방법 대비 명확한 우위를 보였다.

Virginia Tech의 HuggingFace · AdaState는 스트리밍 영상 생성에서 첫 프레임 KV 표현이 attention sink로 작용해 장면이 고착되는 문제를, 매 청크마다 콘텐츠와 함께 디노이즈하지만 렌더링되지 않는 숨겨진 잠재 변수(adaptive state)로 해결한다.

시간을 상대적으로 인코딩해 재귀적 자동회귀 생성으로 전환하며, horizon-weighted DMD 훈련 목표로 Infinity-RoPE·Self-Forcing 대비 장기 생성(t=30s, 훈련 지평의 6배)에서도 장면 고착 없이 자연스러운 진행을 시연했다.

절강대·알리바바 퉁이 랩의 HuggingFace · ViGeo는 동적 청킹 어텐션으로 스트리밍·오프라인·장기 영상 깊이 추정·표면 법선·포인트 맵 추정을 단일 모델로 처리하며, 재학습 없이 모드를 전환한다.

히브리대학교의 HuggingFace · CNS는 확산 모델의 스펙트럼 편향을 노이즈 주입에 역이용해, 추가 학습 없이 ImageNet-256 SiT-XL/2 FID 8.26→6.27(24% 개선), JiT-H/16 11.88→8.31(30% 개선)을 달성했다.

CMU의 HuggingFace · GenClaw는 SVG·HTML·Three.js 코드를 이미지 생성의 중간 캔버스로 활용해, 절대 공간 좌표·정확한 객체 수·복잡한 타이포그래피처럼 자연어가 실패하는 영역을 코드의 구조적 정밀성으로 해결한다.

자율주행 분야에서는 Fudan·Tongji 팀이 교통 흐름 리스크와 충돌 리스크를 하나의 시공간 필드로 통합하고 확산 기반 생성으로 희귀 폐색 시나리오를 증강해, Waymo Open Motion Dataset에서 SOTA 대비 평균 TTC 1.67배 개선을 달성했다(HuggingFace · 통합 리스크 맵).


기타 주목할 콘텐츠

EV 디자인 체크리스트 — 기술 과잉이 기본을 망쳤다

GeekNews · news.hada.io에서 2026년에도 EV 디자이너들이 수십 년간 검증된 물리적 컨트롤을 터치스크린으로 대체하고 있다는 비판이 나왔다. 물리적 도어 핸들 없음은 전자 오작동 시 탈출 불가 위험을 만들고, 이미 NHTSA 조사를 받았다. ACM CHI 2025 연구에 따르면 터치스크린 기후 컨트롤은 안전에 불리하다. 2026년 미국 연방 의무화 예정인 음주·졸음 감지용 적외선 바이오메트릭 카메라는 새로운 데이터 수집 통로가 된다는 점에서 차량 데이터 수집 문제와 직결된다.

물리학 통일의 역사 — Fermilab에서 반물질·만물의 이론까지

YouTube · Lex Fridman #497 · Don Lincoln에서 Fermilab 입자물리학자가 물리학 역사를 "통일의 여정"으로 풀어냈다. 뉴턴의 중력 통합, 맥스웰의 전기-자기 통합(1860년대 — 방정식에서 빛의 속도가 자연스럽게 도출됨), 아인슈타인의 시공간 통합. "지금 쿼크 내부를 연구하는 이유가 무엇인지 나도 모른다. 하지만 200년 뒤에는 세상이 바뀌어 있을 것"이라는 발언이 인상적이다. 반물질·암흑에너지 미스터리가 풀리면 새로운 에너지원과 우주 추진 기술이 가능해질 수 있다는 전망도 담겼다.

LLM "AI 냄새" — 글쓰기·웹 디자인의 동질화 징후

GeekNews · bear.app 블로그에서 저자가 수학 블로그를 LLM으로 다듬다가 3개월 후 동일한 문장 구조가 인터넷 전체에 퍼진 것을 발견했다. 글쓰기 AI 냄새: 과잉 punch-line, 연속 짧은 문장, "X is the Y of Z" 구조. 웹 디자인 AI 냄새: JetBrains Mono 폰트, Step/Bullet 레이아웃, 특정 버튼 디자인, Card 컴포넌트, 깜박이는 dot 배지. 이 "AI 냄새"가 의식적으로 감지되기 전부터 이미 불편함으로 작용한다. 콘텐츠의 동질화가 가속될수록 개성과 특이성이 신뢰 신호로 기능하게 된다.


교차 분석

오늘의 가장 강한 교차 주제는 에이전트 권한 확장과 신뢰 검증 레이어의 긴장이다. 로빈후드가 AI 에이전트에게 주식 매매를 위임하고, Codex에 Computer Use가 추가됐으며, 자율주행 에이전트 연구가 활발해지는 동시에, RLHF 구조 취약점, LoRA 공급망 공격, GitHub Trust Layer 필요성, AgentDoG 1.5 안전 가드레일이 같은 날 등장했다. 에이전트에게 더 많은 권한을 주는 방향과 그 권한을 검증하는 독립적 레이어가 필요하다는 방향이 동시에 달리고 있다.

두 번째 교차 주제는 "더 많이 쓰면 더 좋다" 가정의 해체다. 에이전트 레이어에서는 Opus 4.8 effort slider 남용 비판($25/백만 토큰, 동유럽 주니어 개발자 월급 수준)이 나왔고, 논문 레이어에서는 PANDO·CONF-KV·EarlyTom이 토큰·메모리·연산을 절감하면서 성능을 높이는 방법을 각각 보여줬다. 비용 의식이 에이전트 운영과 모델 연구 모두에서 핵심 설계 원칙으로 자리잡고 있다.

세 번째 교차 주제는 평가 지표와 실제 능력의 괴리다. CausaLab(예측 92% vs 인과 그래프 F₁ 0.47), OmniInteract(오프라인 강점이 스트리밍으로 전이 안 됨), YoCausal(시간 방향성 ≠ 인과 인지), PRISM(건설적 피드백에서 모든 LLM 미달), EY 보고서 AI 환각이 서로 다른 레이어에서 같은 메시지를 전달한다 — 벤치마크 점수와 실제 능력을 구분하는 것이 AI 도입 결정에서 점점 중요해진다.

네 번째 교차 주제는 오픈소스와 소프트웨어 신뢰 계약의 동시 흔들림이다. Flathub·SQLite AI 코드 거부, AMD Vivado Linux 제거, MS Office 영구 라이선스 강등이 같은 주에 나왔다. "한 번 사면 내 것"과 "오픈소스는 중립"이라는 두 가지 기대가 동시에 흔들렸다. Redis BSL 전환 후 Valkey 포크가 가능했던 것과 달리, 독점 소프트웨어(Vivado, Office)에는 포크 옵션이 없다는 구조적 차이가 두드러진다.


Powered by skim

seunan.dev — terminal
visitor@seunan.dev:~ $ banner
███████╗███████╗██╗ ██╗███╗ ██╗ █████╗ ███╗ ██╗ ██████╗ ███████╗██╗ ██╗ ██╔════╝██╔════╝██║ ██║████╗ ██║██╔══██╗████╗ ██║ ██╔══██╗██╔════╝██║ ██║ ███████╗█████╗ ██║ ██║██╔██╗ ██║███████║██╔██╗ ██║ ██║ ██║█████╗ ██║ ██║ ╚════██║██╔══╝ ██║ ██║██║╚██╗██║██╔══██║██║╚██╗██║ ██║ ██║██╔══╝ ╚██╗ ██╔╝ ███████║███████╗╚██████╔╝██║ ╚████║██║ ██║██║ ╚████║██╗██████╔╝███████╗ ╚████╔╝ ╚══════╝╚══════╝ ╚═════╝ ╚═╝ ╚═══╝╚═╝ ╚═╝╚═╝ ╚═══╝╚═╝╚═════╝ ╚══════╝ ╚═══╝ Welcome to seunan.dev Type 'help' for available commands
visitor@seunan.dev:~ $ 
! for AI mode