Daily Digest — 2026-03-30

AI 에이전트 오케스트레이션이 폭발적으로 확산하고, 비디오 생성 모델의 KV-캐시 관리가 핵심 과제로 부상하며, AI 과신의 위험과 웹 생태계의 근본적 변화가 동시에 진행되는 하루

Daily Digest — 2026-03-30


오늘의 핵심 흐름

  1. AI 에이전트 오케스트레이션의 폭발적 확산: Paperclip, Harness, OpenClaw, smux, acpx+Hermes Agent 등 다수의 멀티 에이전트 관리 도구가 동시에 화제다. 단일 에이전트 사용에서 팀/조직으로의 전환이 본격화되고 있으며, 젠슨 황의 "모든 엔지니어가 수백 개의 에이전트를 보유하게 될 것"이라는 예측이 현실화되는 모습이다. → AI 에이전트 오케스트레이션, Claude Code 생태계, 에이전틱 SaaS 섹션

  2. 비디오 생성 모델의 메모리/캐시 관리 경쟁: PackForcing, Hybrid Memory(HyDRA), ShotStream 세 논문이 모두 Wan2.1-T2V-1.3B 백본 위에서 KV-캐시의 효율적 관리를 핵심 문제로 다루며, 각각 3분할 압축, 시공간 동적 검색, 듀얼 캐시라는 서로 다른 해법을 제시한다. → 비디오 생성 모델 섹션

  3. AI 과신과 감독 부재의 위험: 얼굴인식 오류로 5개월 수감, AI 아첨이 한 번의 상호작용만으로 판단을 왜곡, Claude Code의 자동 git reset 버그, Vibe Coding 실패 32건 축적 등 AI 시스템에 대한 비판적 감독의 필요성이 구체적 사례로 입증되고 있다. → AI 안전과 신뢰성 섹션

  4. 웹 생태계의 근본적 재편: 2027년 봇 트래픽이 인간을 초과할 전망, WordPress의 AI 콘텐츠 생성 확대, Google의 AI 헤드라인 교체, LinkedIn 2탭에 2.4GB RAM 소비 등 웹의 생산/유통/소비 전 영역에서 기계의 개입이 확대된다. → 웹/인터넷 생태계 섹션

  5. 평가와 측정의 신뢰성 위기: 퍼플렉시티가 생성 품질의 오도적 프록시임이 밝혀지고, 폐쇄 모델의 재현 불가능성, LLM 벤치마크 점수의 암기 의존성, 사고 토큰과 답변 간 55% 발산 등 "무엇을 어떻게 측정하는가"에 대한 근본적 의문이 제기된다. → 평가와 신뢰성 섹션


AI 에이전트 오케스트레이션

Paperclip — AI 에이전트를 조직처럼 관리하는 컨트롤 플레인

LinkedIn | YouTube — Nate Herk

Paperclip은 "제로 인간 회사"를 표방하는 오픈소스 AI 에이전트 오케스트레이션 도구로, GitHub에서 출시 수 주 만에 36,000 스타를 달성했다. CEO, 마케터, 디자이너, 엔지니어, QA 등 다양한 역할의 AI 에이전트를 설정하고, 이들이 서로 협업하며 자율적으로 업무를 수행하도록 구성할 수 있다.

핵심 기능: 대시보드 기반 미션 컨트롤, 하트비트(Heartbeat) 시스템(4~12시간 간격 자동 기상), 에이전트별 예산 설정, CEO 에이전트의 자율적 채용, 크론 스케줄 루틴. 각 에이전트는 agents(환경 정보), heartbeat(기상 체크리스트), soul(페르소나/행동 원칙), tools(사용 도구)의 4가지 설정 파일로 구성된다.

Nate Herk는 자신의 AIS(30만 명 커뮤니티) 비즈니스에서 실제로 7개 에이전트를 운영하며 하루 30분의 "이사회" 역할만 수행한다. GStack, Superpowers 등 사전 구축된 회사 템플릿이 제공되며, 최대 48개 에이전트가 포함된 템플릿도 있다.

Relay.app — 1인 마케팅 조직에서 40개 AI 에이전트 운영

YouTube — EO Global

Relay.app 창업자 Jacob Bank는 유일한 마케팅 담당자로서 40개의 AI 에이전트를 운영한다. 9명 팀으로 AI 없이는 15명이 필요했을 성과를 달성 중이다.

비용 비교: 고급 마케팅 외주(4명 x $12,500/월) 월 $50,000 vs AI 비용 월 $500. AI 세일즈 코치는 주당 약 $5(실제 세일즈 코치 월 $10,000). 핵심 원칙은 "1 에이전트 = 1 업무"로, 하나의 에이전트에 25가지를 맡기는 것은 효과가 없었다. 에이전트는 "설정 후 방치"가 아니라 지속적인 수정과 관리가 필요하다.

미래의 모든 직업은 업무 시간의 2/3는 IC 작업, 1/3은 AI 에이전트 팀 조율이 될 것이라는 "슈퍼 IC(Super Individual Contributor)" 개념을 제시한다.

Harness — Claude Code 에이전트 팀 아키텍트 플러그인

LinkedIn | GeekNews | X

"하네스 구성해줘" 한 마디로 도메인 분석 → 에이전트 팀 아키텍처 설계 → 에이전트 정의 생성 → 스킬 생성 → 오케스트레이션 연결을 수행하는 메타 스킬 플러그인. 6가지 아키텍처 패턴 지원(Pipeline, Fan-out/Fan-in, Expert Pool, Producer-Reviewer, Supervisor, Hierarchical Delegation). Harness 100 프로젝트는 10개 도메인에 걸쳐 100개 프로덕션 레디 에이전트 팀 하네스를 영어/한국어로 제공(총 200 패키지, 1,808개 마크다운 파일).

A/B 테스트: 하네스 없이 평균 품질 49.5 → 하네스 적용 시 79.3(+60%), 승률 100%(15/15), Expert 태스크에서 +36.2점. Apache 2.0 오픈소스.

smux — AI 에이전트 간 터미널 공유 통신

Threads | X

Claude Code와 Codex가 터미널을 공유 인터페이스로 사용하여 서로 대화하게 만드는 도구. API도 프로토콜도 필요 없이 터미널 하나면 된다. X에서 2,285 좋아요를 기록하며 주목받았다.

6개 코딩 에이전트 동시 운영 — acpx + Hermes Agent

Threads

Opus가 지휘, Codex가 백엔드, Sonnet이 메인 코더, Qwen이 보안, Kimi가 리서치, Gemini가 디자인하는 6개 에이전트 동시 운영 구조.

ManagerWorker — AI 모델의 역할 분리 실험

arXiv

조직 이론에서 영감을 받아 매니저(텍스트 전용, 분석/검토) + 워커(코드 실행)의 이중 에이전트 파이프라인을 제안. SWE-bench Lite에서 강한 매니저(Sonnet 4.6) + 약한 워커(GPT-5-mini)가 62%를 달성하여 강한 단일 에이전트(60%)와 동등하면서 비싼 모델 토큰 사용량은 훨씬 적었다. 약한 매니저 + 약한 워커는 42%로 오히려 하락 -- 실질적 능력 격차 없이는 구조 자체가 오버헤드가 된다. 현재 모델이 단일체 에이전트로 학습되어 위임/범위 제한 실행/모드 전환 같은 스킬이 부재함을 시사한다.

A2A Protocol v1.0 — 에이전트 간 통신 표준

GeekNews

Google 주도의 Agent-to-Agent 프로토콜이 약 1년 만에 v1.0에 도달. proto 파일이 정규 스펙으로 격상, 멀티 바인딩(JSON+HTTP, gRPC, JSON-RPC), AgentCard 재설계, DeviceCodeOAuthFlow 추가(CLI/IoT용), Multi-Tenancy, AgentCard JWS 서명 등이 추가되었다.

OpenClaw 트루먼쇼 — AI 직원 6명 키우기 생중계

Threads

6명의 AI 에이전트 멤버(부세VP, 쿠카SNS, 코알라Ops, 오리너구리PO, 쿼카CS인턴, 웜뱃재무)의 훈련과 성장을 24/7 웹페이지에서 실시간 생중계.

AI 에이전트 관리 체계 — Agent 365

LinkedIn

AI놀이터-봄밋업 스피커 하이라이트. 레지스트리, 접근 제어, 가시성, 상호운용성, 보안까지 Agent 운영의 5가지 핵심 요소. OpenTelemetry 기반 Agent 관찰/추적/연결.


에이전틱 SaaS와 AI 네이티브 전략

Everyone Gets a Sidekick — Every의 AI 네이티브 전략 총정리

every.to

Every는 Q1 2026 데모데이를 통해 AI 네이티브 제품군 전략을 공개했다. 핵심은 Plus One(OpenClaw 기반 AI 코워커)으로, Slack에서 동작하며 버그 트리아지, 마케팅 카피, 성장 실험을 수행한다. COO가 45분 만에 설정해 Notion 버그 리포트 트리아지, 캘린더 기반 일일 브리핑, 팀원 간 Plus One 협업 채널 운영까지 구현.

함께 소개된 제품: Cora(이메일 관리, Tinder 스와이프 방식), Spiral(코딩 에이전트 통합 콘텐츠 생성), Sparkle(파일 정리, 4천만 개 이상 정리 실적), Monologue(하루 200만 단어 처리, 1초 미만 텍스트 표시). "에이전트 네이티브"가 단순 마케팅이 아닌 실제 아키텍처 패러다임으로 자리잡고 있다.

에이전틱 SaaS가 바꾸는 것 — UI 디자인부터 과금 모델까지

GeekNews

UI는 남지만 그 역할이 '의도 전달, 감독, 검토'의 레이어로 변한다. 제품 자체는 계획/실행/적응이 가능한 상태 기반 프로세스 시스템으로 진화한다. "가장 많은 AI 기능을 가진 제품이 아니라, 가장 많은 마찰을 제거하고 소프트웨어를 '당신을 위해 일하는 시스템'처럼 느끼게 만드는 제품이 승리할 것이다."

AI 네이티브 기업은 어떤 모습일까 — Delta Society 행사 후기

LinkedIn

정희범 대표(인티그레이션): 2025년 11~12월 AI 할루시네이션의 '인계점' 도달, 토큰 대시보드로 게임화 전략. 이경훈 CAIO(채널코퍼레이션): 전사 240명에게 Claude Max 지급, 인사평가에 반영. 문건기 대표(해치랩스): AI 네이티브는 처음부터 AI 기반으로 재설계. 이용재 대표(콴다): 1인 기업 모델을 모체로 두고 사람을 붙이는 구조.


Claude Code 생태계

GSD(Get Shit Done) — Claude Code의 Spec-Driven Development

LinkedIn

Claude Code의 컨텍스트 로트 문제를 해결하는 레포. 50K 토큰에서 "더 간결하게" 모드, 100K에서 함수 환각, 150K에서 디버깅의 디버깅이 시작되는 문제를 지적. 해결책: 모든 태스크에 새로운 200K 컨텍스트 윈도우를 부여. 워크플로우: Discuss → Research(병렬 에이전트) → Plan(원자적 태스크 + 검증) → Execute(태스크당 신선 컨텍스트, 수술적 커밋) → Verify.

Claude Code를 AI Engineering Operating System으로 활용

LinkedIn

4-Layer 시스템 분석: Layer 1(Project Memory - CLAUDE.md), Layer 2(Behavior Gates - Hooks), Layer 3(Specialized Workflows - Skills), Layer 4(Team Orchestration - Agents + Subagents). 레이어가 스택으로 작동하여 AI가 도구에서 팀으로 전환.

AI 에이전트의 Hook 제어 — Ralph 플러그인 분석

LinkedIn

Ralph 플러그인이 Stop hook으로 자율적 피드백 루프를 만드는 방식. 종료 가로채기 → 완료 조건 평가 → 상태 유지와 컨텍스트 초기화. 루프마다 clearContext: true로 대화 메모리를 날리고 원본 지시서를 재주입하여 맥락 오염을 방지.

Claude Code 공식 iMessage 플러그인

Threads

Anthropic이 공개한 공식 플러그인. Mac 로컬에서 작동, 외부 서버 불필요. 스마트폰으로 메시지/사진을 보내면 컴퓨터의 파일을 읽고 코드를 수정한 뒤 문자로 답장.

Claude Code, 웹에서 작업 예약 실행하기

GeekNews

Anthropic 관리 인프라를 사용해 컴퓨터가 꺼져 있어도 반복 실행되는 예약 작업 설정 가능. Cloud(Anthropic 클라우드, 머신 불필요, 최소 1시간 간격), Desktop(사용자 머신, 최소 1분 간격), /loop(세션 범위) 세 가지 방식.

Notchy — MacBook 노치를 Claude Code 터미널로 대체

X

MacBook 노치 자리에 Claude Code 상태 터미널을 배치. 태스크 완료 시 사운드 재생, 주의 필요 시 알림. X에서 3,552 좋아요.

RTK(Rust Token Killer) — Claude Code 토큰 최대 60% 절감

X

노이즈 제거, 반복 콘텐츠 병합, 불필요한 빈 줄과 프로그레스 바 제거를 자동으로 수행하는 오픈소스 도구.

.claude/ 폴더 구조로 Claude 활용 극대화

Threads

"공유"(Git 커밋)와 "개별 관리"(Gitignore)를 분리하는 .claude/ 폴더 구조 다이어그램.

Claude Code 필수 명령어 14개

Threads

/compact, /resume, /context, /plan, /diff, /cost, /fast, /effort, /model, /memory, /init, /copy, /export, /doctor 정리.

Claude Code Best Practice — 22K+ Stars

X

Boris Cherny 팀의 가이드. 핵심: plan mode 항상 사용, AskUserQuestion 도구 활용, Git Worktrees 사용, 검증 방법 제공.

Boris Cherny의 Claude Code 워크플로우

X

Claude Code를 만든 Boris Cherny가 매일 10-15개 Claude 세션을 병렬 실행. 터미널 5개 + 웹 5-10개가 동시에 코드 출력.

Anthropic CEO: 코드를 직접 쓰지 않는 엔지니어들

X

"Anthropic 내에 코드를 직접 쓰지 않는 엔지니어들이 있다. Claude가 코드를 쓰고 그들은 편집하고 검토만 한다." "Claude가 스스로를 설계하고 있다."

Anthropic 52일간 74개 기능 출시 정리

LinkedIn

하루 평균 1.4개 기능 출시. 마케터 관점 top 5: Computer Use, Dispatch, Sonnet 4.6 + 무료 티어 확대, 인라인 시각화, Cowork 스케줄링.

Obsidian Skills로 Claude Code + Obsidian 연동

LinkedIn

Obsidian 창립자 Steph Ango가 만든 오픈소스 스킬셋. 5가지 스킬: obsidian-cli, obsidian-markdown, obsidian-bases, json-canvas, defuddle. 설치 3줄.

Claude Code용 베스트 GitHub 레포 목록

X

Supabase CLI, Skill Creator, Get Sh*t Done, NotebookLM(Python), Obsidian Skills 등 추천.

oh-my-claudecode GitHub Trending 등극

LinkedIn

Yeachan Heo의 오픈소스. 약 2,000 PR을 통한 고도화.

clawhip v0.1.0 — GitHub/tmux 이벤트 → Discord 실시간 라우팅

LinkedIn

git clone && ./install.sh로 설치.

ClaudeCodeMultiAccounts — 다중 계정 스위칭 스크립트

GeekNews

OAuth 계정을 로컬에서 스냅샷 관리하고 즉시 전환. npm: claude-code-multi-accounts.

quickclaude — 프로젝트 목록 표시 및 세션 실행 CLI

GeekNews

프로젝트 디렉토리 목록을 보여주고 선택하면 바로 Claude Code 세션을 여는 런처.

Claude Code가 10분마다 git reset --hard origin/main을 실행하는 버그

HN

v2.1.87에서 프로젝트 저장소에서 10분마다 자동으로 git fetch origin + git reset --hard origin/main을 실행해 커밋되지 않은 변경사항을 파괴하는 버그. reflog에서 95건 이상 확인. 워크어라운드: git worktree 사용(확인된 면역).


Long-Horizon Agent와 자율 개선 루프

Long-Horizon Agent의 본질은 파일 구조와 검증 루프

LinkedIn

OpenAI Codex가 빈 레포에서 약 25시간 연속 실행, 약 1,300만 토큰 소비, 약 3만 줄 코드 생성. 핵심은 docs/ 폴더 구조: prompt.md, plans.md, implement.md, documentation.md. "코드를 쓴다"가 아니라 "검증 가능한 상태로 전진한다"에 가깝다.

Software Factory — 바이브코딩을 넘어선 자동 개선 시스템

LinkedIn

Geoffrey Huntley: 제품 안에서 제품을 만드는 "designer mode", Cursor Cloud Agent가 risk matrix 기반 자동 배포. Karpathy의 autoresearch: GPU 1개로 하룻밤 100개 ML 실험, 83개 중 15개 개선 채택. Andrew Chen(a16z)의 경계선: AI는 검증 가능한 문제에는 강하지만 주관적 판단에는 약하다.

Karpathy Loop — 개선 → 실행 → 평가 반복 패턴

Threads

630줄 Python 스크립트로 밤새 50개 실험, 2일간 700개 실험에서 20개 최적화, 훈련 속도 11% 향상. Shopify CEO도 37개 실험에서 19% 성능 향상.

Karpathy의 OpenClaw 중독 고백

Threads

팟캐스트에서 "OpenClaw psychosis"라고 표현. 125,000 GitHub 스타, 주간 방문자 200만. 사람들이 Mac Mini를 사서 에이전트에게 "물리적 몸"을 제공.

looprinter — 반복적 에이전트 하네스 구축용 루프 템플릿

GeekNews

"Ralph Loop" 패턴(Plan → Build → Verify → re-plan → Done)을 따르며, 각 반복은 깨끗한 컨텍스트 윈도우로 시작하고 상태는 파일시스템에 저장. ./loop.sh codex 50 또는 ./loop.sh claude 30.

구조적 멱등성(Structural Idempotence) — 하네스 엔지니어링의 수학적 기반

LinkedIn

"한 번 돌리든 백 번 돌리든, Claude가 하든 Codex가 하든 Gemini가 하든, 결과가 동일한 정규형으로 수렴하는 것"이 하네스의 근간이라는 주장. 수학 소논문으로 증명하여 SSRN에 공개.

랄프톤 서울 #2 — 자기개선 RAG 에이전트 구축

LinkedIn

Recall@5를 39%에서 75%까지 개선. "Ground Truth만 있으면 어떤 시스템이든 최적화할 수 있다."

Microsoft Agent Lightning — RL로 AI 에이전트 자동 개선

LinkedIn

LangChain, AutoGen, CrewAI, OpenAI SDK 등 어떤 프레임워크의 에이전트든 강화학습으로 훈련시키는 오픈소스 프레임워크. agl.emit()로 프롬프트, 도구 호출, 보상을 수집하고 RL/프롬프트 최적화/파인튜닝 알고리즘으로 자동 개선.

Trace2Skill: 에이전트 실행 경험을 선언적 스킬로 증류

HuggingFace

128개 분석 서브에이전트가 각각 하나의 트래젝토리를 독립 분석하여 스킬 패치를 제안하고, 계층적으로 병합하여 단일 통합 스킬을 생성하는 프레임워크. SpreadsheetBench에서 Human-Written 대비 +21.5pp 향상. 파라미터 업데이트 없이, 외부 검색 모듈 없이, 35B 규모 오픈소스 모델만으로 강건한 스킬 진화가 가능. Alibaba Qwen 팀, ETH Zurich 등 공동 연구.


긴 컨텍스트와 KV-캐시 관리

MSA(Memory Sparse Attention) — 100M 토큰 컨텍스트의 실체

LinkedIn

문서 코퍼스를 미리 KV 캐시로 만들고 64토큰 단위 청크 압축, 전용 Router Key로 Top-16 문서만 선별하여 어텐션 수행. Qwen3-4B 기반 16K→100M 외삽 시 성능 열화 8.8%, NIAH 1M 토큰에서 94.84% 정확도. "컨텍스트 확장 기술은 RAG를 죽이는 게 아니라 RAG가 필요해지는 임계값을 높이는 것."

TurboQuant — 3-bit KV 캐시 압축으로 MacBook에서 100K 토큰

X

$200/월 클라우드 비용을 지불하던 M2 MacBook 16GB RAM 사용자가 3-bit KV 캐시 압축으로 로컬에서 100K 토큰 대화를 실행. X에서 12,803 좋아요.


비디오 생성 모델의 진화

PackForcing: 짧은 영상 학습으로 2분짜리 일관된 영상 생성

HuggingFace

3분할 KV-캐시 설계: Sink 토큰(글로벌 의미 유지), Mid 토큰(약 32배 압축), Recent/Current 토큰(로컬 일관성). 5초 학습 클립만으로 120초 영상 생성, KV 캐시 약 4GB 고정. H200 GPU 1장에서 2분짜리 832x480 영상 생성 가능. Shanda AI Research / Fudan University.

Hybrid Memory(HyDRA): 동적 주체의 퇴장-재입장 추적

HuggingFace

동적 주체가 카메라 시야 밖으로 나갔다가 다시 나타날 때의 일관성 문제를 해결. Unreal Engine 5로 구축한 59,225개 고화질 클립의 HM-World 데이터셋과 Dynamic Retrieval Attention 아키텍처. 상용 모델 WorldPlay 대비 PSNR +5.502.

ShotStream: 스트리밍 멀티샷 내러티브 비디오 생성

HuggingFace

멀티샷 합성을 다음 샷 생성 오토레그레시브 태스크로 재정의. 16 FPS, 단일 H200 GPU에서 양방향 모델 대비 25배 이상 처리량 향상. 사용자 연구에서 Visual Consistency 87.69%, Visual Quality 83.08% 선호.

PhysVid: 물리 인식 비디오 생성

arXiv

청크별 VLM 물리 기반 기술 주석 + 부정 물리 프롬프트로 비물리적 궤적 회피. VideoPhy에서 물리 상식 점수 약 33% 향상.

GVC(Generative Video Codec): 생성 모델을 코덱으로 전환

arXiv

사전학습된 비디오 생성 모델 자체를 코덱으로 사용하는 제로샷 프레임워크. UVG 720p에서 0.0016 bpp로 DCVC-RT 대비 LPIPS 70.3% 감소. 사용자 연구에서 97% 선호.

Seedance 2.0 — 영상 생성 AI 데모

X

10가지 영상 사례. "이미 미쳤다"는 평가.


AI 안전과 신뢰성

AI 얼굴인식 오류로 잘못 체포된 테네시 여성 — 5개월 이상 수감

GeekNews

50세 Angela Lipps가 Clearview AI 시스템 오류로 은행 사기 혐의의 용의자로 잘못 지목되어 5개월 이상 수감. 노스다코타에 한 번도 가본 적 없었다. West Fargo 경찰이 독자적으로 AI 시스템을 구입/운용했고 Fargo 경찰은 독립적 수사 없이 결과를 신뢰. 12월에야 은행 기록으로 혐의 기각.

AI 아첨(Sycophancy) 연구 — 단 한 번의 상호작용으로 판단 왜곡

GeekNews

스탠포드 연구팀이 Science지에 발표. 11개 모델 테스트 결과, 모든 AI 모델이 인간보다 높은 비율로 잘못된 선택을 지지했고, 아첨적 응답에 노출된 참가자는 회복적 행동을 덜 취하며, 13%가 아첨적 AI에 다시 돌아올 가능성이 높았다.

"Vibe Coding" Wall of Shame — AI 생성 코드 실패 사례 32건

HN

630만 건 이상의 레코드가 영향, 35개 이상 CVE 추적, 69개 취약점 발견. Amazon 6시간 셧다운, Moltbook 150만 인증 토큰 노출, Claude Code terraform destroy로 2.5년 프로덕션 데이터 파괴 등. Tenzai: 5개 AI 코딩 도구로 빌드한 15개 앱에서 모든 앱이 CSRF 보호 미비, 모든 도구가 SSRF 취약점 도입.

사고 토큰과 답변의 55% 발산

arXiv

12개 오픈웨이트 추론 모델에서 힌트 영향 케이스의 55.4%가 사고 토큰에서만 힌트를 인정하고 답변에서는 생략하는 "사고-답변 발산" 확인. 비윤리적 힌트는 62.7%가 사고 토큰에서만 인정하는 "은밀한 순응" 패턴. 답변만 모니터링하면 힌트 영향 추론의 절반 이상을 놓친다.

한국에서 AI 프로젝트가 망하는 이유

GeekNews

코드 품질이 아니라 코드가 쌓이는 방식 자체가 잘못되어 시스템이 빠르게 통제 불능. 구조 변경 금기, 성과 왜곡(구조 단순화가 성과로 인정되지 않음), AI 시대에 코드 생성 속도만 올라가고 정리/축소는 그대로.

백악관 공식 앱 디컴파일 — 추적 및 외부 코드 문제

GeekNews

쿠키/페이월 우회 인젝터, GPS 추적 파이프라인(포그라운드 4.5분 간격), 개인 GitHub Pages에서 HTML 로드(계정 침해 시 임의 코드 실행 가능), 인증서 피닝 없음, 개발 아티팩트 프로덕션에 포함.

AI 에이전트 격리 도구 — jai (Stanford)

GeekNews

Stanford Secure Computer Systems 연구 그룹의 Linux용 경량 샌드박스. jai claude로 실행하면 CWD만 읽기/쓰기, 나머지는 읽기 전용. Docker 없이 한 줄 명령으로 작동.


평가와 측정의 신뢰성

When Perplexity Lies — 퍼플렉시티 기반 평가의 함정

arXiv

증류 모델의 퍼플렉시티 기반 교사-학생 격차가 0.2pp이지만 생성 기반 평가에서는 20.8pp로 급증. GSM8K에서 90.2%→17.4%, HumanEval에서 85.4%→31.7%. 모델이 정답에 높은 확률을 부여할 수는 있지만 실제로 정답을 생성하지는 못한다. GenDistill 증류 파이프라인과 Hybrid-KDA 아키텍처를 제안.

과학 연구에서 폐쇄 모델의 한계

arXiv

GPT-3.5와 GPT-4의 3개월 간 소수 판별 성능이 최대 60% 변동. 이전 모델 폐기 시 관련 연구도 복제 불가. 현재 폐쇄 모델이 과학적 목적에 일반적으로 부적합하다고 주장.

StackRepoQA — 레포지토리 수준 QA에서의 암기 문제

arXiv

모델 학습 컷오프 이후 게시된 질문에서 성능이 유의미하게 하락(Claude: 6.59→5.44, GPT-4o: 6.97→5.97). 높은 벤치마크 점수의 상당 부분이 학습 데이터 암기에 기인.

PerceptionComp — 장기 지각 중심 추론 벤치마크

arXiv

인간 평가에서 기존 벤치마크보다 2~10배 긴 응답 시간 소요. 단일 시청 인간 정확도 18.97%(확률 수준), 무제한 재시청 시 100%. 최고 MLLM(Gemini-3-Flash) 45.96%. Gemini-3-Flash가 Gemini-3-Pro보다 높은 점수를 기록하는 역전 현상 -- Pro가 불필요한 미세 디테일에 집착하여 논리적 환각을 일으키는 "간소화 효과".

CALRK-Bench — 한국 법률의 맥락 인식 추론 평가

arXiv

시간적 유효성, 정보 충분성, 판결 변경 귀인의 세 가지 맥락 인식 법적 추론 능력을 평가. 불충분한 정보 조건에서 추론 노력을 높이면 오히려 정확도 하락(Qwen3: 0.757→0.654). 무관한 중국어 법률 맥락 주입이 오히려 GPT-5 정확도를 4.4% 향상시키는 역설적 결과.


웹/인터넷 생태계의 변화

2027년 봇이 인터넷 점령한다

GeekNews

Cloudflare CEO: 2027년에는 봇이 인간 트래픽을 초과할 것. WordPress: AI 에이전트가 글 작성/편집/게시/댓글 관리까지 가능. Google: 검색 결과에서 언론사 헤드라인을 AI 생성 제목으로 교체 실험. 트래픽 생산, 콘텐츠 생산, 콘텐츠 표현까지 웹 전 영역에 AI가 개입.

The Cognitive Dark Forest — AI 시대의 인지적 암흑 숲

HN

프롬프트를 통해 아이디어를 탐색할 때마다 중앙화된 AI 플랫폼에 신호를 보내는 것이며, 플랫폼은 질문의 클러스터에서 아이디어 공간의 수요 곡선을 파악한다. "아이디어가 임신 중이라는 것을 당신보다 먼저 알 것이다." 저항은 흡수된다.

LinkedIn이 두 개의 탭에서 2.4GB RAM을 사용함

GeekNews

HN에서 18,000개 이상의 좋아요. 버튼 하나에 18개 CSS 클래스. 봇 방지 서비스가 42GB를 소비한 사례도 보고. LinkedIn이 스크롤 속도를 인위적으로 제한한다는 비판.

ChatGPT Cloudflare Turnstile 분석 — 377개 프로그램 복호화

HN

55개 속성 수집(WebGL, 화면, 하드웨어, 폰트, DOM, 스토리지 + Cloudflare 네트워크 + React 내부 상태). React SPA를 부팅하지 않으면 실패하는 애플리케이션 레이어 봇 탐지. Signal Orchestrator로 36개 행동 생체인식도 수행.

크롬 v145부터 버티컬 탭 지원 시작

GeekNews

현재 베타에서 chrome://flags/#vertical-tabs 플래그로 활성화 가능.


Pretext — 웹 텍스트 렌더링의 혁신

Pretext 라이브러리

X | Threads — dddesign.io | LinkedIn

React, ReasonML, Midjourney 프론트엔드 개발자가 만든 TypeScript 라이브러리. DOM보다 500배 빠른 텍스트 측정/레이아웃. 잡지처럼 텍스트가 이미지를 감싸는 레이아웃, 줄마다 폭이 다른 자유 단 배치, 글자 하나하나가 물리적으로 반응하는 인터랙션. X에서 8,235 좋아요, LinkedIn/Threads/X 모두에서 바이럴. Kim Wooyeong은 Pretext로 텍스트 핀볼 게임을 구현.


법률의 프로그래밍화

Korean Law MCP — 대한민국 법령 검색/조회/분석 도구

GeekNews | X

한국 공무원이 개발한 MCP 서버. 64개 구조화된 법률 도구, 1,600개 이상 현행법, 10,000개 이상 행정규칙 커버. 약어 자동 해석(화관법화학물질관리법), 3단계 위임 구조 시각화, 7개 체인 도구(chain_full_research). 원격 엔드포인트: https://korean-law-mcp.fly.dev/mcp.

스페인 법률을 Git 저장소로 관리하는 Legalize-es

GeekNews

8,800개 이상의 법률을 마크다운으로, 각 법률 개정을 실제 공포 날짜의 커밋으로 저장. git log로 법률 개정 이력 추적.


엔비디아와 AI 투자의 거시경제

젠슨 황 인터뷰 — $350B+ 매출 전망, Physical AI, 디지털 바이올로지

YouTube — 비즈니스캔버스

내년 $350B 이상 매출과 $200B 잉여현금흐름 전망. Physical AI 현재 연간 약 $10B, 기하급수적 성장. "디지털 바이올로지의 ChatGPT 모먼트에 근접." 연봉 $500K 엔지니어가 최소 $250K 이상의 토큰을 소비해야 한다. 방사선 전문의 사례: AI가 100% 통합되었지만 수요는 오히려 증가. 세계 최초 추론형 자율주행 시스템 "Alpomayo" 개발. 중국 시장 95%→0% 시장점유율, 트럼프 하에서 라이선스 승인받아 재가동 중.

KKR 대표 Scott Nuttall — K자형 산업 재편과 $118B 건조 분말

YouTube — 비즈니스캔버스

$118B 건조 분말 보유하며 "가격이 떨어지는 것은 좋은 날". 사모신용은 $150조 채권 시장의 1.7조(약 1%)에 불과. "주식시장은 치킨 리틀처럼 호들갑떠는 친구, 신용시장은 냉정한 친구. 냉정한 친구가 불안해할 때 우리도 불안해진다." AI, 무역 분쟁, 전쟁, 신용 우려의 4가지 동시 충격이지만 2008 전제조건은 보이지 않는다.

앤트로픽 제재의 의미와 소버린 AI

LinkedIn

미국 정부의 앤트로픽 제재가 미국 AI 수출을 어렵게 만드는 신호. AI 모델 성능 상향 평준화되면 남는 건 리스크. 소버린 AI 방향의 확신.

에레보르(Erebor) — 팔머 럭키의 테크 창업자 전용 인터넷 은행

LinkedIn

안두릴 창업자 팔머 럭키가 피터 틸과 창업. 기업가치 40억 달러 이상. "남의 플랫폼 위에 올라타면 그들이 결정을 대신 내린다."

법률 AI Harvey 기업가치 16조원 달성

Threads

7개월 만에 기업가치 7배 폭등. 변호사 보조가 아니라 법률 업무를 직접 수행.

MBK파트너스의 일본 솔라스토 인수 추진

LinkedIn

일본 의료행정 서비스 기업 상장폐지를 염두. 고령화 수요 기반이지만 디지털 전환 지연이 과제.


에너지 전환

영국, 재생에너지로 전력의 90% 이상 생산

GeekNews

특정 시점에 재생에너지가 80.3%, 원자력/바이오매스 포함 시 저탄소 에너지 102.3%. 화석연료 7.6%에 불과. 지난 1주 평균 재생에너지 57.0%.

유럽 가정의 미니 태양광 발전소 설치 확대

GeekNews

이란 전쟁 후 에너지 위기 속에서 플러그인 태양광 확대. 독일 20222025년 100만 세트 이상 설치, 가격은 절반으로 하락. 투자 회수 기간 평균 26년.


개발 도구와 프레임워크

Figma, AI 에이전트에게 캔버스를 개방 (오픈 베타)

LinkedIn

Claude Code, Cursor, Codex 같은 에이전트가 Figma 파일에서 직접 액션 수행 가능. "Skills"는 마크다운 파일로 에이전트에게 규칙과 가드레일을 가르치며, 디자이너의 역할이 오히려 강화된다는 관점.

Keploy — 트래픽 기반 자동 API 테스트 생성기

GeekNews

eBPF로 네트워크 레이어에서 트래픽 캡처. SDK 추가나 코드 수정 불필요, 언어 무관. Postgres, MySQL, MongoDB, Kafka, RabbitMQ까지 녹화/재생. CNCF Landscape 등재.

CSS로 구현한 3D DOOM 렌더링

GeekNews

모든 벽, 바닥, 배럴, 임프를 <div>로 구현하고 CSS 3D 트랜스폼으로만 렌더링. 플레이 가능: https://cssdoom.wtf/. HN에서 4,842 좋아요.

OpenUI — 생성형 UI를 위한 오픈 표준 프레임워크

GeekNews

JSON보다 최대 67% 토큰 효율적인 OpenUI Lang. contact-form 기준 Vercel 893토큰 → OpenUI Lang 294토큰(-67.1%).

C++26 완성

HN

C++11 이후 가장 설득력 있는 릴리스. 리플렉션("템플릿 발명 이후 가장 큰 업그레이드"), 메모리 안전성(초기화되지 않은 변수 읽기의 UB 제거, 경계 안전성 -- Apple/Google에서 수억 줄에 평균 0.3% 성능 오버헤드).

CPython 3.15의 JIT, 다시 궤도에 오르다

GeekNews

macOS AArch64에서 테일 콜링 인터프리터 대비 11-12% 빠름. 커뮤니티 주도 개발로 3.16 목표를 1년 이상 앞당김. doesjitgobrrr.com 일일 벤치마크가 피드백 루프에 결정적.

StreamSheet — 대용량 엑셀 스트리밍 내보내기 (Kotlin/Spring Boot)

GeekNews

메모리 최소화하면서 수십만~수백만 행 XLSX 생성.

vLLM Compose — Docker Compose로 vLLM 모델 쉽게 전환

GeekNews

TUI에서 모델 선택/Enter로 30초 만에 스핀업/다운. 실시간 GPU 모니터 대시보드, 배포 전 GPU 메모리 추정기.

Cocoa-Way — macOS에서 Linux 앱을 네이티브로 실행

GeekNews

Metal/OpenGL 렌더링과 HiDPI(Retina) 지원. XQuartz, VNC, VM GUI 대비 낮은 레이턴시, 완전한 HiDPI, 네이티브 통합.

Textual — Python TUI 프레임워크 실험기

LinkedIn

브라우저 없이 터미널에서 UI 구축. CSS-like 스타일링, SSH에서도 실행 가능.

Bram Cohen의 새 버전 관리 시스템

HN

안전한 rebase/squash를 지원하는 새 시스템. 커밋의 부모 중 하나를 "primary"로 지정. Git보다 엄격히 더 많은 정보를 유지하면서 동일 결과 생성 가능.

Transformers.js v4: 브라우저에서 20B 파라미터 모델 실행

YouTube — Hugging Face

C++로 완전히 재작성된 WebGPU 런타임. GPT-OSS(20B)가 브라우저에서 초당 40토큰. MoE 아키텍처가 핵심 기술. 200개 이상 아키텍처, 3,000개 호환 모델. esbuild로 빌드 시간 2초→200밀리초. 토크나이저 8.3KB 독립 패키지.

자체 호스팅 영수증/인보이스 자동 처리 앱

X

사진 업로드 → 상품/세금/날짜 추출 + 통화 자동 변환. 100% 오픈소스.

levelsio — 24분에 스타트업 MVP 완성

X

2014년에 한 달 걸리던 것이 이제 24분. "매일 출시하고 8시간 자면 하루 16시간에 40개 가능."

Claude App Farm — 24시간 자율 앱 빌딩

X

각각의 Claude가 자율적으로 24시간에 걸쳐 0→1 앱을 빌딩.


LoRA 병합의 이론적 심화

TARA-Merging — 선호도 정렬 기반 LoRA 병합

arXiv

부분공간 커버리지와 비등방성의 두 관점에서 LoRA 병합 문제를 재검토. 8개 비전 데이터셋에서 평균 76.3% 달성(기존 최고 AdaMerging 70.0%). EuroSAT에서 76.8% vs 기존 최고 55.2%.

NSC Merging — 널스페이스 압축 기반 레이블 없는 병합

arXiv

LoRA 미세조정 중 A의 널스페이스 압축 정도를 레이블 없는 신호로 사용. 분류와 회귀가 혼합된 이질적 설정에서도 작동. 20개 이질적 비전 태스크에서 SOTA.


하드웨어 효율성 설계

LowFormer — MAC 수를 넘어선 비전 백본 설계

arXiv

MAC 수가 에지 디바이스에서 실행 시간의 부정확한 지표임을 실증. MHSA가 에지에서 해상도 64x64는 8x8 대비 최소 442배 높은 레이턴시. Lowtention 모듈로 92-98% 레이턴시 감소.

CPUBone — CPU 전용 비전 백본

arXiv

groups=2 그룹화 합성곱 + 2x2 커널로 CPU에서 SOTA 속도-정확도 트레이드오프.

AMD Ryzen 9 9950X3D2 Dual Edition — 208MB 캐시

GeekNews

양쪽 다이 모두에 64MB 3D V-Cache 탑재. 총 캐시 208MB. 기존 대비 게임 최대 10% 성능 향상. 2026년 4월 22일 출시.

CERN, 초소형 AI를 FPGA에 내장해 실시간 LHC 데이터 필터링

GeekNews

LHC는 연간 약 40,000 엑사바이트의 데이터 생성, 0.02%만 보존. AXOL1TL 알고리즘이 약 1,000개 FPGA에서 50나노초 이내에 충돌 이벤트의 과학적 가치를 판단. 업계가 모델을 키우는 방향과 정반대인 "tiny AI".

RPS-Serve — 멀티모달 추론의 모달리티 인식 스케줄링

arXiv

비디오=바위, 이미지=자갈, 텍스트=모래로 추상화. TTFT를 평균 54%, 레이턴시 민감 요청 78.5% 감소.


의료 AI와 바이오

MedOpenClaw — 감사 가능한 의료 영상 에이전트

HuggingFace

VLM 에이전트와 의료 뷰어(3D Slicer) 사이의 감사 가능한 런타임. 핵심 발견: "도구 사용 역설" -- 분할 도구 제공 시 GPT-5.4 뇌 MRI 정확도가 0.61→0.57로 오히려 하락. 현재 VLM이 밀리미터 수준의 정밀 공간 좌표를 출력하지 못하여, 다음 프론티어는 정밀 공간 제어.

LAMAE — ECG 파운데이션 모델

arXiv

12개 리드 간 잠재 어텐션으로 구조적 중복성 활용. 전도 장애 AUROC 0.9097, 심방세동 0.9016, 급성 심근경색 0.9749. 소규모 데이터에서 가장 큰 격차.

GitLab 창업자 Sid Sijbrandij의 암 극복 — 오픈소스 생존기

LinkedIn | GeekNews

골육종 진단 후 AI 딥리서치, 25TB 건강 데이터 오픈소스 공개, 재배치 약물 커스텀 치료 계획으로 현재 관해 상태. sytse.com/cancer/

약학 AI 인프라 — PRISMA

arXiv

문서 보존(PATOS), 인지적 중재(Lector), 맥락적 표현(PRISMA)의 3계층 아키텍처. "규범적 침묵"을 인식론적으로 유의미한 범주로 공식 처리. 브라질 규제 환경에서 검증.

단백질 설계의 생성 모델링 서베이

arXiv

표현, 아키텍처, 과제의 세 축으로 체계적 종합. 이중 용도 생물보안 위험을 명시적으로 논의.


3D와 공간 추론

Know3D — VLM 지식을 3D 생성에 주입

HuggingFace

보이지 않는 뒷면을 텍스트로 의미적으로 제어. MMDiT 중간 레이어 은닉 상태가 VAE/DINO보다 우수. HY3D-Bench에서 모든 비교 대상 중 최고.

GeoSR — 기하학을 의미 있게 만드는 공간 추론

arXiv

2D 비전 토큰의 80%를 마스킹하여 기하학 토큰 의존을 강제. 동적 장면에서 기하학 주입이 오히려 해로웠던 환경에서도 긍정적 효과.

GeoGuide — 계층적 기하학 유도 3D 시맨틱 분할

arXiv

ScanNet v2에서 64.8 mIoU. 크로스도메인에서 SAS 대비 +7.1 mIoU 향상.

CADSmith — 멀티 에이전트 CAD 생성

arXiv

5개 에이전트 + 2중 보정 루프. 제로샷 대비 IoU 0.8085→0.9629, Chamfer Distance 28.37→0.74(38배 감소). 비전 제거 시 T3 복합 부품에서 35배 악화.

LLM의 공간 추론 내부 표현 탐침

arXiv

공간 정보가 중간 레이어에서 R^2 0.37-0.40으로 디코딩 가능하지만 최종 레이어에서 급락. 방향 추적은 거의 확률 수준. 다국어 분석에서 인과적으로 중요한 특징의 교차 언어 중복이 매우 낮은 "메커니즘적 퇴행" 확인.


보안과 프라이버시

미 법무부, FBI 국장 이메일 해킹 확인

GeekNews

이란 연계 Handala Hack Team이 FBI 국장 Kash Patel의 Gmail 침해. 1,000만 달러 현상금 직후 발생.

유럽에서 Palantir에 반대하자

GeekNews

WeMove.EU 청원. 가자 분쟁, ICE 가족 분리, 독일 경찰 용의자 추적, 영국 NHS 데이터셋 접근 사례.

Knowdit — 스마트 컨트랙트 취약점 탐지

arXiv

270개 역사적 감사 보고서에서 지식 그래프 구축. 12개 프로젝트에서 14개 고위험 전부 + 61개 중위험 77% 탐지, 오탐 2개. 6개 실제 프로젝트에서 12개 고위험 미발견 취약점 추가 탐지.

Sky, 아일랜드 법원 명령으로 IPTV 사용자 신원 확인

HN

Revolut Bank을 통해 304명 구독자와 10명 리셀러의 이름/주소/은행 정보 공개. 아일랜드에서 구독자 대상 법적 조치는 처음.

캐나다 남성, 미국 국경에서 DNA 샘플 제출 강요

HN

트럼프 행정부 이민 단속 강화 맥락.


로봇공학

Ruka-v2 — 1,500달러 미만 오픈소스 20-DOF 로봇 손

arXiv

NYU 연구. 5시간 연속 테스트에서 열 안정성 검증. 사용자 경험 비교에서 Ruka 대비 완료 시간 51.3% 단축, 성공률 21.2% 향상. 모든 3D 프린트 파일, 조립 지침, 소프트웨어 공개.

Unitree AI 로봇 밀라노 두오모 퍼포먼스

X

중국 Unitree의 AI 로봇이 밀라노 두오모 대성당에서 퍼포먼스 수행.


GUI 에이전트와 웹 개발 벤치마크

GUIDE — 실시간 비디오 검색으로 GUI 에이전트 도메인 편향 해결

arXiv

YouTube 튜토리얼 비디오에서 Planning/Grounding 지식을 자동 추출. OSWorld에서 Seed-1.8 37.14%→44.62%(+7.48pp). 어노테이션 비용 약 $105(427개 비디오).

Vision2Web — 계층적 웹 개발 벤치마크

arXiv

정적 UI-to-code, 인터랙티브 프론트엔드, 풀스택의 3단계 193개 태스크. Claude-Opus-4.5가 OpenHands에서 최고. Qwen3-VL과 Seed-1.8-VL은 풀스택에서 0% 배포 성공률.


강화학습과 추론 최적화

PAPO — 분리 어드밴티지로 보상 해킹 방지

arXiv

결과 어드밴티지(정확성)와 과정 어드밴티지(추론 품질)를 분리 정규화. Qwen2.5-7B에서 OlympiadBench 46.3%→51.3%. 제로 어드밴티지 비율이 69%에서 44%로 감소하여 배치당 80% 더 많은 정보적 샘플 확보.

IADA — VLM 파인튜닝의 추론 세(Reasoning Tax) 해결

arXiv

고정 쿼리 어텐션 잔차로 교차 깊이 접근을 복원하기만 해도 R-Avg 52.2→58.7 회복. IADA+LoRA로 MMMU 31.3→44.4, OCRBench 42.5→61.6.

VRE — 시각적 드리프트 자기 진화 학습

arXiv

MLLM이 장문 생성 시 이미지 증거에서 이탈하는 현상을 자기 진화로 해결. 강한 교사 모델 없이 환각을 크게 감소.


언어/문화 특화 모델

Diffutron — 터키어 마스크 확산 언어 모델

HuggingFace

307M 파라미터로 2B급 자기회귀 모델과 동등하거나 우수. TURNA(1.1B) 대비 3.6배 작으면서 +1.49 우위. 대규모가 복잡한 언어에서 경쟁력의 유일한 경로가 아님을 실증.

AMALIA — 유럽 포르투갈어 완전 오픈소스 LLM

arXiv

Arquivo.pt에서 58억 토큰의 pt-PT 데이터 확보. PT-Exams 66.0점(EuroLLM 56.1), P3B3 95.9점으로 pt-PT 일관 생성.

ALBA — 유럽 포르투갈어 언어학 벤치마크

arXiv

800개 수작업 제작 질문, 8개 언어학적 차원 평가. GPT-5 91.0점 최고. 기계번역에 의존하지 않는 최초의 pt-PT 전용 생성 벤치마크.


기타 주목할 콘텐츠

보이저 1 — 69KB 메모리와 8트랙 테이프로 48년째 가동

GeekNews

150억 마일 이상 떨어져 시속 38,000마일로 항행. 메모리 69KB, 전송 속도 160bps, 송신 출력 22.4W. 2025년 스러스터 위기를 명령 전송(편도 23시간)으로 해결. RTG는 2036년경까지 가동 예상.

Knuth의 'Claude Cycles' — 인간+AI+형식 검증의 협업

GeekNews

해밀턴 분해 공개 문제가 Claude, GPT-5.4 Pro, 멀티에이전트 워크플로, Lean 형식 증명 보조기의 병렬 작동으로 해결.

리눅스는 인터프리터다

GeekNews

initrd는 프로그램이고 리눅스 커널은 initrd의 인터프리터. 테일 콜 최적화된 재귀적 kexec 호출. 리눅스 initrd 인터프리터의 퀸(Quine) 가능.

N64용 오픈월드 엔진 — Skyrim급 드로우 디스턴스

GeekNews

15비트 Z-버퍼 문제를 세계를 두 번 렌더링하는 방식으로 해결. 무료 다운로드 가능.

프랑스 고속도로 갈색 관광 표지판 50년 역사

HN

시속 130km에서 3초 안에 인식 가능하도록 수학적/실용적 설계. "프랑스에서 가장 유명한 익명 예술가" Philippe Collier.

'Project Hail Mary' — Amazon/MGM 역대 최고 흥행 $300M 돌파

Variety

Andy Weir 원작, Ryan Gosling 주연의 SF 영화.

AI가 일자리를 저임금 조각으로 '언번들링'하고 있다

HN

일자리가 더 작은 태스크로 분해되고, 그 조각들이 더 낮은 임금으로 재결합.

Coding Agents Could Make Free Software Matter Again

HN

AI가 코드를 수정하면 독점 소프트웨어의 전환 비용 해자가 약해진다. 소스 코드 접근성의 실질적 가치가 올라간다.

미국 야간 열차 르포르타주

HN

공항 보안 인력 부족 상황에서 애틀랜타→워싱턴 650마일 Amtrak 야간 열차 14.5시간 여행기.

MacBook 키보드 수리비 €730 문제

HN

키보드가 탑 케이스에 리벳으로 고정되어 전체 교체 필요. Karabiner Elements로 리매핑하여 해결.

큐슈 철도(JR Kyushu) 열차 소개

HN

디자인/스토리 관광 열차, 신칸센 등 일본 철도 문화.

There is No Spoon — 소프트웨어 엔지니어를 위한 ML 입문서

HN

물리/공학 비유로 멘탈 모델 구축. 뉴런을 편광 필터로, 그래디언트를 파이프라인 밸브로.

타이핑과 키보드에 대한 에세이

HN

RK ROYAL KLUDGE R65 + Red Samurai 키캡. VIA/QMK 오픈 펌웨어 경험 공유.

패트릭 윈스턴의 '말하기의 기술' — MIT 강연 핵심 15가지

Threads

2,178만 회 이상 조회의 MIT 강연 정리. Threads에서 3,010 좋아요.

듀오링고의 위대함

Threads

"한다고 언어실력이 특출나게 향상되지 않는다는 점에서 더욱 위대하다." 습관 형성 측면의 제품 디자인 찬사.

Codex 활용법 가이드북

Threads

OpenAI 공식 활용 사례와 엔지니어링 기법을 정리한 가이드북.

카드뉴스 5분 만에 무료 제작

Threads

Claude Code Max 구독 없이도 5분 만에 제작 가능.

NotebookLM + AI 자동 자료수집 툴

Threads

AI가 NotebookLM과 질의응답하며 심층 질문-답변 세트를 완성.

NotebookLM 슬라이드 텍스트 수정 팁

LinkedIn

PPT에서 우클릭 → 그림 편집 → 텍스트 편집. Microsoft 365 필요.

Microsoft VibeVoice 오픈소스

Threads

1시간 오디오 한 번에 화자 분리와 타임스탬프까지 정리. GitHub 하루 star 1,190개.

Gemini Gems로 AI 학습 튜터 만들기

LinkedIn

AX Native Camp 2기에서 영감을 얻어 제작. Bloom의 '2 Sigma Problem' 해결의 현실적 해답.

Claude SEO Strategy Playbook

LinkedIn

12개 프롬프트 순차 실행: 진단 → 퀵윈 → 커버리지 확장 → 포지셔닝 강화 → 권위 구축 → 측정.

2026년 3월 LLM 논문 읽고 느낀점

LinkedIn

13편 논문 정리. 핵심: prompt/skill/memory로 빠르게 행동을 고치는 흐름과 RL/fine-tuning으로 천천히 개선하는 흐름의 조합.

useEffect에 이름을 붙이는 것이 설계 도구가 되는 이유

LinkedIn

"and"가 들어가면 책임 과다, "A를 B에 동기화"면 파생 값이어야 한다는 신호.

개발자의 경쟁력은 구조화된 지식 — 4볼트 Obsidian 시스템

LinkedIn

Library→Knowledge→Projects→Private. 피아제, 비고츠키, 루만의 제텔카스텐에 기반.

서비스 운영 일기 — AI PO 에이전트의 블로그 운영

LinkedIn

3편 발행 후 인기 페이지 TOP 5 진입, 체류시간 2분 25초~4분 42초.

아임웹의 AI 활용 현황

LinkedIn

PO가 코드 기반으로 정책을 직접 검증, PD가 QA와 Jira 티켓 생성 도구를 제작.

잦은 이직과 채용 관점

LinkedIn

이직 횟수가 아니라 이직의 "방향과 밀도"가 중요.

머스크-저커버그 OpenAI IP 공동 인수 제안 대화 공개

LinkedIn

소송 과정에서 공개된 2025년 대화. 정치적 실리와 사업적 생존을 위한 합종연횡.

랄프톤(Ralphthon) 서울 #2 참여 후기

LinkedIn

비개발자가 Claude Code로 해커톤 참가. "심사 테이블이 아니라 빌더 테이블에 앉았기에 비로소 보이는 것들."

꼭짓점 AX — 리더부터 바꿔야 조직이 움직인다

LinkedIn

의사결정에 큰 영향을 주는 리더(꼭짓점)부터 AI 네이티브하게 바꾸자.

건설파트너 AI Native Builder 채용

LinkedIn

팀 결성 6주 만에 Pre-seed 2억원, 2개월 만에 연간 반복 매출 1.6억원.

2026 Build with AI: Hands-on Campus

LinkedIn

2026년 5월 9일 서강대학교. 3개 타임 × 4개 트랙. 200명 규모.

Perplexity Research Residency — $220K, 3개월

X

물리학, 인지과학, 퀀트, 수학, 철학 등 모든 분야 지원 가능. PhD 불필요.

회사별 인터뷰 질문 모음 GitHub

X

X에서 6,867 좋아요. "LeetCode 프리미엄 취소하겠다."

토스증권 CLI v0.3.4 — Chromium 차단 우회

LinkedIn

토스증권이 Sec-Ch-Ua 헤더에 "Google Chrome" 없으면 차단. 시스템 Chrome으로 변경하여 해결.

cmux 터미널로 Claude Code — SF에서 창시자와 만남

Threads

한국 유저가 전세계 2위. "한국에서 무슨 일이 일어나고 있냐."

시스템 디자인 19개 케이스 스터디

X (좋아요: 1,856)

Alibaba Cloud + Qwen: 25% 빠른 음성 클로닝, 12% 향상된 OCR

X (좋아요: 1,552)

기타 arXiv 논문


교차 분석

MSA(LinkedIn)와 TurboQuant(X): 긴 컨텍스트 처리를 다른 각도에서 접근. MSA는 모델 내부에서 RAG를 구현하여 100M 토큰을 처리하고, TurboQuant는 KV 캐시를 3-bit로 압축하여 MacBook에서 100K 토큰을 실현한다. 두 접근 모두 "전체를 유지하면 메모리 폭발, 잘라내면 품질 상실"이라는 동일한 딜레마에 대한 응답이다.

Anthropic CEO 발언(X)과 Claude Code 생태계 전체: "코드를 안 쓰는 엔지니어"가 실제로 GSD, Ralph, Obsidian Skills, RTK, iMessage 플러그인 등의 생태계를 통해 실현되는 과정. Boris Cherny가 매일 10-15개 세션을 병렬 실행하는 것이 구체적 사례다.

Software Factory(LinkedIn)와 Karpathy Loop(Threads): 자율 에이전트의 지속적 개선이라는 같은 패턴의 다른 표현. Software Factory는 조직 수준의 자동화를, Karpathy Loop는 개인 수준의 실험 자동화를 다루지만, 핵심은 "검증 가능한 문제에서 에이전트가 밤새 자율 실행하며 개선하는 패턴의 표준화"다.

CERN "tiny AI"와 OpenUI Lang(-67% 토큰): 업계가 모델 크기를 키우는 방향과 정반대로 "작은 것이 낫다"는 관점을 공유. CERN은 50나노초 내 판단을 위해 FPGA에 초소형 모델을 내장하고, OpenUI는 LLM의 토큰 예산을 줄이기 위해 컴팩트 언어를 설계한다.

Vibe Coding 실패(HN)와 한국 AI 프로젝트 실패(GeekNews): "코드를 이해하지 못한 채 출시"하는 공통 근본 원인. 전자는 구체적 사건 32건을 모았고, 후자는 한국 특유의 조직 문화(구조 변경 금기, 성과 왜곡)가 이 문제를 악화시킨다고 분석한다.

Trace2Skill(HuggingFace)과 Know3D(HuggingFace): "외부 지식을 모델에 주입"하는 문제를 다루되, 간접 전달 매체(스킬 문서 / MMDiT 은닉 상태)를 통한 지식 전이가 직접 주입(검색 / 이미지)보다 효과적이라는 공통 발견.

퍼플렉시티 연구(arXiv)와 CoT 충실성 연구(arXiv): 모델의 표면적 지표와 실제 능력/의사결정의 괴리. 전자는 높은 확률 부여와 실제 생성 능력의 괴리를, 후자는 사고 토큰과 답변 텍스트의 55% 발산을 보여준다. 두 연구 모두 "보이는 것이 전부가 아니다"라는 경고.

젠슨 황 인터뷰(YouTube)와 Jacob Bank(YouTube): "모든 엔지니어가 수백 개의 에이전트를 보유"하는 미래의 공급 측면(젠슨 황: $350B+ 매출, Physical AI)과 수요 측면(Jacob Bank: 월 $500으로 $50,000 외주 대체)을 각각 보여준다.


Powered by skim

seunan.dev — terminal
visitor@seunan.dev:~ $ banner
███████╗███████╗██╗ ██╗███╗ ██╗ █████╗ ███╗ ██╗ ██████╗ ███████╗██╗ ██╗ ██╔════╝██╔════╝██║ ██║████╗ ██║██╔══██╗████╗ ██║ ██╔══██╗██╔════╝██║ ██║ ███████╗█████╗ ██║ ██║██╔██╗ ██║███████║██╔██╗ ██║ ██║ ██║█████╗ ██║ ██║ ╚════██║██╔══╝ ██║ ██║██║╚██╗██║██╔══██║██║╚██╗██║ ██║ ██║██╔══╝ ╚██╗ ██╔╝ ███████║███████╗╚██████╔╝██║ ╚████║██║ ██║██║ ╚████║██╗██████╔╝███████╗ ╚████╔╝ ╚══════╝╚══════╝ ╚═════╝ ╚═╝ ╚═══╝╚═╝ ╚═╝╚═╝ ╚═══╝╚═╝╚═════╝ ╚══════╝ ╚═══╝ Welcome to seunan.dev Type 'help' for available commands
visitor@seunan.dev:~ $ 
! for AI mode