합의 기반 3D 분할 불확실성 평가
3D 병변 분할에서 다중 정답·불확실성 평가와 VDD의 합의 prior 앵커링을 정리.
3D 병변 분할에서 다중 정답·불확실성 평가와 VDD의 합의 prior 앵커링을 정리.
LLM이 쉽게 푸는 과제가 만드는 난이도 착시와 다중지표·프로토콜 기반 평가/게이트 설계법
희소·구식 상호작용 데이터에서, 하드 클리핑 대신 log-ratio 가우시안 신뢰가중으로 안정적 재사용을 제안.
에이전틱 AI 실패를 모델 한계가 아닌 외부화 거버넌스로 재정의하고 3-트랙을 제안한다.
부분관측 TAMP에서 과업 비관련 객체도 반영해 LLM로 belief를 보강하고, 캘리브레이션·안전필터로 신뢰성을 다룬다.
LLM 연구 에이전트 루프에서 정식화 병목을 줄이려면 로그·지속평가·도구정확도 지표가 핵심이다.
경영 조언에서 모호성 감지·명확화와 시코팬시 억제가 품질·책임에 미치는 영향과 평가 지표를 정리.
MASS는 추론 중 합성데이터로 self-update해 즉시 적응한다. 로그·감사·무결성 설계가 핵심.
AI 구독은 가격보다 한도·약관·업타임 공개를 점검해 업무 중단 위험을 줄이는 최소 조합이 핵심이다.
LLM 추천이 대화로 추론한 트라우마·자해 등 민감도를 무시하면 개인 맞춤형 안전 위반이 된다.
PlugMem은 에이전트 밖 플러그인형 장기 메모리로 컨텍스트 팽창·관련성 저하를 줄이고 지속 리스크를 점검한다.
도구 금지·확대 금지 같은 퍼즐평가 제약은 문장보다 API 설정과 로그로 고정해야 재현된다.
NVML/DCGM/nvidia-smi는 구간 평균·비율이다. 1Hz 로깅에서 LLM 추론 전력 변동을 해석한다.
AI의 노력 대체는 인지 자동화와 신체·뇌 증강으로 나뉜다. 근거와 규제로 과장을 가린다.
AI 자동화로 고용이 밀릴 때 에너지비용과 부가가치 귀속이 UBI 등 현금이전의 재정을 제약한다.
전장 작전계획 AI 도입은 성능보다 HITL·TEVV·감사·책임 설계가 핵심이다.
모델 성능과 생산성의 시차 원인과 과업 점수·NIST RMF로 줄이는 방법
공감·기억·일관성 설계가 친밀감과 신뢰에 미치는 영향과 안전 평가 기준을 정리합니다.
LLM 도입·전환 시 장애 공지, RCA, 도구 호출 통제, 재시도·SLO로 운영 안정성을 평가하는 법.
LLM의 모사와 자기 일관성을 분리해 장기 기억·페르소나 드리프트를 벤치마크로 평가하는 방법.
검색 AI가 답변 중심에서 캔버스형 작업공간으로 옮겨가며 초안과 도구 제작이 검색 안에 들어온다.
단편 지식을 붙여넣고 이해 점검→구조화 설명→퀴즈로 학습을 대화 루프로 잇는 방법.
지도·지형 입력에서 리사이즈·타일링·토큰화 차이가 지리 오인식을 재현 가능한 제품 리스크로 만든다.
AGI 도래 연도 주장, 정의·지표·확률·사후채점을 갖춰 검증 가능한 예측으로 바꾸는 법.