AI 자료 모음 (24h) - 2026-02-17
지난 수집 자료(공식/뉴스) 중 중요한 링크를 모아 정리했다.
Gemini, DeepMind, 그리고 Google AI 생태계.
허브 콘텐츠는 점진적으로 업데이트됩니다.
지난 수집 자료(공식/뉴스) 중 중요한 링크를 모아 정리했다.
정적 벤치마크 상승이 체감 품질로 직결되지 않는 이유와 오염 리스크, 실무 평가 프레임을 정리.
IP 장편 애니를 AI로 연속 제작할 때 성경·자산·검수 루프와 2차적저작물 리스크를 정리한다.
툴 호출은 실행이다. JSON 유효성만으론 부족하니 strict 스키마, allowed_tools, refusal·상태 검증을 게이트로 둔다.
AI 대화의 관계시험에 대응하는 거절·경계 설정을 규칙과 평가로 고정하는 방법.
RAG와 파라미터 업데이트의 비용·리스크를 비교하고 재귀개선 검증 체계를 정리한다.
GPU 부족이 학습보다 반복·배치 중심으로 전략을 바꾸며 혼합정밀도·체크포인팅·ZeRO 트레이드오프를 수치로 정리한다.
Blackstone-Neysa 지원과 2만+ GPU 목표, 인도 내 처리 조건이 비용·규제·지연에 영향.
리더보드 상위권 점수 차이가 작을수록 오차와 평가조건 변화가 커진다. 3~6개월 추세는 검증이 필요하다.
연속 배칭·스트리밍·KV 캐시로 TTFT/TBT와 처리량이 달라진다. 점검 기준을 정리.
LLM 지연을 queue/compute·prefill/decode로 나눠 계측하고 배치·KV캐시·양자화를 조정하는 방법
온디바이스 AI의 경계 재정의와 NPU, 양자화·증류의 정확도 손실, 하이브리드 PoC 가이드.
RAG top-K 뒤 reranking으로 상위 결과를 재정렬해 NDCG@10 개선과 비용·지연 트레이드오프를 평가한다.
비신뢰 입력이 툴콜 권한 경로로 이어지는 프롬프트 인젝션을 최소권한·격리·출력검증으로 막는 설계 체크리스트.
모델명 고정으로 생기는 출력 흔들림을 줄이려면 성공 기준·형식·실패 처리와 Evals로 회귀를 관리하자.
코딩 에이전트 속도를 토큰/초 대신 duration(출력·프리필·도구·네트워크)로 분해해 병목을 찾는다.
Codex Spark 추론을 Cerebras WSE-3로 구동. 코딩 워크로드 병목과 PoC 측정 포인트 정리.
지난 수집 자료(공식/뉴스) 중 중요한 링크를 모아 정리했다.
Secure Lock Device·침입 로깅·Identity Check 확장으로 잠금이 OS 상태가 되는 흐름을 정리.
LLM 선택은 구조화 출력, 캐시·배치, 레이트리밋, 데이터 통제 등 운영 기능 차이에서 갈린다.
GPT-OSS에 에이전틱 RL 적용 시 GRPO·다중 보상 설계가 효율·성능과 보상 해킹 리스크를 좌우한다.
Codex가 Cerebras WSE‑3에서 추론, TTFT·왕복 오버헤드 감소로 저지연 경쟁이 부상.
OpenAI의 PostgreSQL 수백만 QPS 확장 사례: 복제·캐시·레이트리밋·격리로 DB 병목을 줄인다.
PersonaPlex는 텍스트·오디오 프롬프트를 결합해 저지연 음성대화에서 페르소나 일관성을 겨냥한다.