코딩 모델, 실행형과 계획형
코딩 모델 차이는 문장력이 아니라 계획 수립, 도구 호출, 문맥 해석 범위에서 드러난다.
코딩 모델 차이는 문장력이 아니라 계획 수립, 도구 호출, 문맥 해석 범위에서 드러난다.
RTG 숫자 조건의 한계를 짚고 Q값 정렬로 오프라인 RL 제어성과 신뢰성을 높이는 접근을 살핀다.
멀티모달 AI의 차트·도표 해석 한계와 연구·검토 업무에서 필요한 교차검증 원칙을 짚는다.
MOV-Bench가 시간 분산 오디오·비주얼 단서 추론의 평가 공백과 에이전트형 개선 가능성을 짚는다.
이질적 시뮬레이터 환경의 FedRL에서 입력 분포 불일치를 줄이는 PON 논문 핵심과 실험 의미를 정리했다.
MOCHA는 에이전트 스킬을 다중 필드 아티팩트로 보고, 플랫폼 제약까지 함께 최적화해야 함을 보여준다.
GPU 메모리 제약에서 멀티모델 LLM의 오프로딩·선점 비용과 모델별 성능 차이를 짚는다.
COBALT는 스마트폰·클라우드 텔레오퍼레이션으로 로봇 시연 데이터 수집 병목을 낮추는 접근을 제안한다.
손글씨 수학 자동 채점의 핵심은 OCR보다 과정 이해다. 배포 전 부분점수와 재검토 절차를 검증해야 한다.
의료·금융의 주장 검증에서 이진 판정 대신 삼진 분류와 설명 가능한 논증 구조를 제안한 연구.
Florence-2를 ROS 2 토픽·서비스·액션으로 감싸 로컬 추론과 재현 가능한 통합을 강조한 사례
지난 수집 자료(공식/뉴스) 중 중요한 링크를 모아 정리했다.
유아의 저데이터 시각 학습이 개념, 인과, 예측을 묶어 AI 비전과 로보틱스 설계를 바꾸는 이유를 짚는다.
Minibal은 상대 모델링 없이도 사람과 균형 있게 겨루는 게임 AI 가능성을 제시한다.
LLM 입력에서 지시문과 데이터를 분리하는 마크업 제안과 구조화 인터페이스의 의미를 짚는다.
사법 AI의 핵심은 성능보다 인간-기계 결합, 권고 수용 방식, 감사와 TEVV 체계다.
의료 AI 로봇 도입의 핵심은 성능보다 책임, 검증, 모니터링 체계라는 점을 짚는다.
MLLM의 세그멘테이션 표현이 어댑터에서 약해지고 LLM 어텐션으로 회복되는 과정을 분석한다.
교육 AI 성능은 모델 크기보다 역할, 스킬, 도구, 교사 전문성 주입 같은 설계 축이 좌우할 수 있다.
요약·번역 같은 무해 과업에서 유해 입력을 어디까지 처리할지, LLM 안전 경계를 짚는다.
ARROW는 이중 버퍼와 분포 정합 재생으로 메모리 부담을 낮추며 망각을 줄인 지속학습 RL 접근이다.
멀티에이전트 조정을 환경 메모리·인센티브·피드백 루프로 읽는 최소 이론과 실전 시사점.
단일 RGB-D 카메라로 손 3D를 복원해 로봇에 리타기팅하는 저비용 텔레오퍼레이션 접근과 한계를 다룬다.
오토인코더의 입력·잠재표현·복원 간 의존성을 더 안정적으로 재는 새 추정기와 상호정보량의 한계를 짚는다.