규제 QA의 인용 폐쇄
규제 QA에서 답변 정확도보다 규칙별 출처 귀속과 인용 폐쇄의 중요성을 짚는다.
규제 QA에서 답변 정확도보다 규칙별 출처 귀속과 인용 폐쇄의 중요성을 짚는다.
개인 구독과 API의 과금·계약 구조 차이와 AI 한도 재판매의 정책·보안 리스크를 짚는다.
K-12 글쓰기에서 LLM을 교사·학생·모델 협업과 통제 기준으로 설계하는 연구를 짚는다.
불완전한 applied ML 논문을 에이전트형 절차와 슬롯 기반 표준으로 벤치마크화하는 쟁점을 다룬다.
지난 수집 자료(공식/뉴스) 중 중요한 링크를 모아 정리했다.
해상 네트워크의 단절과 민감 데이터를 고려해 서버리스 가십 학습과 탄소 인지형 오케스트레이션을 짚는다.
확률형 신뢰 AI의 병목을 연산보다 메모리·난수 이동에서 재해석한 관점과 설계 점검 기준.
MRI·CT 기반 신경영상 벤치마크로 VLM의 임상 추론, 오류, 안전 트레이드오프를 점검한다.
유아의 저데이터 시각 학습이 개념, 인과, 예측을 묶어 AI 비전과 로보틱스 설계를 바꾸는 이유를 짚는다.
Minibal은 상대 모델링 없이도 사람과 균형 있게 겨루는 게임 AI 가능성을 제시한다.
사법 AI의 핵심은 성능보다 인간-기계 결합, 권고 수용 방식, 감사와 TEVV 체계다.
같은 예측을 내는 모델도 설명은 달라질 수 있다. XAI의 신뢰성과 감사 기준 재점검이 필요하다.
대학 직무발명 절차와 AI 특허 요건을 바탕으로 아이디어를 권리화하는 핵심 기준을 정리한다.
의료 드론 배송을 최단경로가 아닌 협업 의사결정 문제로 본 UAV-MARL 연구를 짚는다.
동일 의미 프롬프트의 마스크 변동을 줄이는 그룹 일관성 학습과 제로샷 Dice 개선을 정리.
작은 병변이 배경에 묻히는 공간적 불균형을 LAW 픽셀 재가중으로 완화, FID 개선을 정리.
Cryo-SWAN은 밀도맵(복셀) 중심 VAE로 3개 벤치마크에서 재구성 품질 개선을 보고한다.
IDE 플러그인에서 CLI 코딩 에이전트로 이동하며 AGENTS.md와 컨텍스트 파이프라인이 신뢰성을 좌우한다.
폴란드어 11B 모델에서 2-bit PTQ 6종을 비교, 지표와 생성 붕괴 괴리를 분석.
GPS·텔레메트리 없이 UAV 단안 영상에서 차량을 앵커로 GSD를 추정해 절대 스케일을 복원한다.
CoT 중간 교란은 정답률을 크게 낮춘다. 단위·수학은 별도 검증과 합의가 필요하다.
3D 병변 분할에서 다중 정답·불확실성 평가와 VDD의 합의 prior 앵커링을 정리.
LLM이 쉽게 푸는 과제가 만드는 난이도 착시와 다중지표·프로토콜 기반 평가/게이트 설계법
희소·구식 상호작용 데이터에서, 하드 클리핑 대신 log-ratio 가우시안 신뢰가중으로 안정적 재사용을 제안.