유효 UI가 속이는 순간: 행위 정합성
스키마를 통과한 UI도 라벨-액션·바인딩 불일치로 사용자를 속인다. 의미 정합성 게이트와 이상탐지 접근을 정리.
876개 · 7 / 37페이지
스키마를 통과한 UI도 라벨-액션·바인딩 불일치로 사용자를 속인다. 의미 정합성 게이트와 이상탐지 접근을 정리.
소형 LLM 쌍대비교를 Bradley–Terry+Bayesian MCMC로 집계해 랭킹의 불확실성과 취약성을 다룬다.
작은 병변이 배경에 묻히는 공간적 불균형을 LAW 픽셀 재가중으로 완화, FID 개선을 정리.
4비트 양자화에서 PPL이 FP16보다 낮아질 수 있는 조건과 재현 검증 절차를 정리한다.
음주가 반응 억제를 낮춰 AI 설명이 길어질 때, 분위기를 지키는 대화 규칙을 제안한다.
Model Spec의 체인 오브 커맨드와 정책 충돌로 페르소나·사고 규칙이 흔들린다. 우선순위·예외·fallback으로 재현성을 높인다.
지난 수집 자료(공식/뉴스) 중 중요한 링크를 모아 정리했다.
CAPTCHA는 맥락에 따라 마찰이 달라지고, ML 우회로 보안 대비 비용이 커진다.
3.5B 토큰 연소 지식베이스와 CombustionQA로 지식 주입과 평가를 파이프라인으로 고정.
MLLM 제로샷 VAD의 오탐·미탐, 프롬프트·클립 길이(1–3초) 영향과 점검법을 정리.
EVMbench는 스마트컨트랙트 보안을 탐지뿐 아니라 패치와 익스플로잇까지 에이전트로 평가한다.
딥러닝 인지 불확실성을 자율성 게이팅 신호로 써 반자율·텔레옵을 전환하는 SPIRIT 접근.
신모델 과신·의인화·환각을 줄이기 위해 주장-근거-검증으로 업무를 쪼개는 방법.
LegalBench로 법률 LLM을 평가하고, 정당화·감사가능성을 논증 구조로 설계하는 방법을 정리한다.
Logi-PAR은 임상 PAR에 미분가능 논리 규칙을 넣어 규칙 추적과 반사실 개입으로 설명·감사를 강화한다.
장기 메모리 오염을 줄이고 감사성을 높이는 LLM 에이전트 메모리 입장제어 설계와 계측을 정리한다.
의료 멀티모달 추론은 평균 점수보다 grounding·실패 모드·감사 로그 중심 통제 평가가 핵심이다.
PDF 표 추출은 입력 방식·용량 제한·시각 분석 여부에 따라 결과가 달라져 구조 지표 기반 평가가 필요하다.
조밀 GT 없이 희소·이동 센서로 물리장을 학습·평가하는 SOLID와 불확실성 보정을 정리.
웹검색·추론 모드가 정확도·재현성·응답시간에 주는 트레이드오프와 검증 절차를 정리한다.
LLM 자기보고는 내부 접근이 아니라 단서 기반 추론일 수 있음을 두 메커니즘으로 분해해 점검한다.
지난 수집 자료(공식/뉴스) 중 중요한 링크를 모아 정리했다.
Cryo-SWAN은 밀도맵(복셀) 중심 VAE로 3개 벤치마크에서 재구성 품질 개선을 보고한다.
AI 코딩 쿼터를 권한으로 볼 때 마켓 설계, 약관 위반·보안·검수 리스크를 If/Then으로 정리.