불확실성으로 로봇 권한 조절
딥러닝 인지 불확실성을 자율성 게이팅 신호로 써 반자율·텔레옵을 전환하는 SPIRIT 접근.
범용 인공지능/초지능을 둘러싼 연구와 논쟁, 그리고 신호들.
허브 콘텐츠는 점진적으로 업데이트됩니다.
딥러닝 인지 불확실성을 자율성 게이팅 신호로 써 반자율·텔레옵을 전환하는 SPIRIT 접근.
LegalBench로 법률 LLM을 평가하고, 정당화·감사가능성을 논증 구조로 설계하는 방법을 정리한다.
장기 메모리 오염을 줄이고 감사성을 높이는 LLM 에이전트 메모리 입장제어 설계와 계측을 정리한다.
Cryo-SWAN은 밀도맵(복셀) 중심 VAE로 3개 벤치마크에서 재구성 품질 개선을 보고한다.
AI 코딩 쿼터를 권한으로 볼 때 마켓 설계, 약관 위반·보안·검수 리스크를 If/Then으로 정리.
IDE 플러그인에서 CLI 코딩 에이전트로 이동하며 AGENTS.md와 컨텍스트 파이프라인이 신뢰성을 좌우한다.
폴란드어 11B 모델에서 2-bit PTQ 6종을 비교, 지표와 생성 붕괴 괴리를 분석.
GPS·텔레메트리 없이 UAV 단안 영상에서 차량을 앵커로 GSD를 추정해 절대 스케일을 복원한다.
CoT 중간 교란은 정답률을 크게 낮춘다. 단위·수학은 별도 검증과 합의가 필요하다.
3D 병변 분할에서 다중 정답·불확실성 평가와 VDD의 합의 prior 앵커링을 정리.
LLM이 쉽게 푸는 과제가 만드는 난이도 착시와 다중지표·프로토콜 기반 평가/게이트 설계법
희소·구식 상호작용 데이터에서, 하드 클리핑 대신 log-ratio 가우시안 신뢰가중으로 안정적 재사용을 제안.
에이전틱 AI 실패를 모델 한계가 아닌 외부화 거버넌스로 재정의하고 3-트랙을 제안한다.
부분관측 TAMP에서 과업 비관련 객체도 반영해 LLM로 belief를 보강하고, 캘리브레이션·안전필터로 신뢰성을 다룬다.
경영 조언에서 모호성 감지·명확화와 시코팬시 억제가 품질·책임에 미치는 영향과 평가 지표를 정리.
MASS는 추론 중 합성데이터로 self-update해 즉시 적응한다. 로그·감사·무결성 설계가 핵심.
PlugMem은 에이전트 밖 플러그인형 장기 메모리로 컨텍스트 팽창·관련성 저하를 줄이고 지속 리스크를 점검한다.
도구 금지·확대 금지 같은 퍼즐평가 제약은 문장보다 API 설정과 로그로 고정해야 재현된다.
AI 자동화로 고용이 밀릴 때 에너지비용과 부가가치 귀속이 UBI 등 현금이전의 재정을 제약한다.
전장 작전계획 AI 도입은 성능보다 HITL·TEVV·감사·책임 설계가 핵심이다.
공감·기억·일관성 설계가 친밀감과 신뢰에 미치는 영향과 안전 평가 기준을 정리합니다.
LLM의 모사와 자기 일관성을 분리해 장기 기억·페르소나 드리프트를 벤치마크로 평가하는 방법.
지도·지형 입력에서 리사이즈·타일링·토큰화 차이가 지리 오인식을 재현 가능한 제품 리스크로 만든다.
AGI 도래 연도 주장, 정의·지표·확률·사후채점을 갖춰 검증 가능한 예측으로 바꾸는 법.