"deep-dive" 태그

394개 · 3 / 17페이지

AI 자동화 뒤 노동·소득 재편 속에서 메타버스가 일·거래 공간이 될지 따져본다.

llm

커뮤니티2026년 7월 6일2026-07-06

에이전트형 LLM 운영 원칙

에이전트형 LLM의 화면 제어와 장기 문맥 시대, 성능보다 권한·승인·안전 설계가 중요하다.

hardware

공식/신뢰2026년 7월 6일2026-07-06

국가 AI 전략, 실행의 시대

국가 AI 전략이 모델 경쟁을 넘어 조달·전력·컴퓨팅 인프라 중심의 실행 경쟁으로 이동한다.

agi

커뮤니티2026년 7월 6일2026-07-06

AI 인프라 경쟁의 전력망 변수

AI·데이터센터 경쟁력은 발전 용량보다 전력망 접속 시점, 송변전 여건, 냉각·백업 설계가 좌우한다.

llm

출처2026년 7월 6일2026-07-06

소형 모델 신뢰도 라우팅

소형 LLM의 내부 confidence signal로 답변·검색·거부를 가르는 라우팅 설계 쟁점을 짚는다.

llm

커뮤니티2026년 7월 6일2026-07-06

요리 휴머노이드의 승부처

가정용 요리 휴머노이드는 외형보다 성공률·시간·안전성·비용으로 평가해야 한다.

llm

커뮤니티2026년 7월 6일2026-07-06

AI 시대, 희소성은 어디로

생성형 AI가 문서·정보처리 직무를 바꾸며, 시장가치는 학력보다 AI 활용·검증·조정 역량으로 이동한다.

llm

커뮤니티2026년 7월 6일2026-07-06

왜 LLM은 코딩을 앞세우나

LLM 기업이 코딩을 대표 성능 지표로 내세우는 이유와 비개발자에게 생기는 편중 효과를 짚는다.

llm

커뮤니티2026년 7월 4일2026-07-04

LLM 성격보다 정렬이 핵심

사과, 거절, 맞장구는 LLM 성격보다 정렬·보상·프롬프트 설계의 결과에 가깝다.

llm

출처2026년 7월 4일2026-07-04

콜드스타트 PPI의 5개 모달리티

MKGR은 서열 1개와 지식그래프 4개를 결합해 콜드스타트 PPI에서 기존 베이스라인보다 전반적 우위를 보고했다.

llm

출처2026년 7월 4일2026-07-04

의료 AI, 시험보다 임상 추론

객관식 의료 벤치마크 이후, 오픈엔디드 임상 추론과 안전성 평가가 더 중요해지고 있다.

agi

출처2026년 7월 4일2026-07-04

오픈웨이트 안전의 새 기준

오픈웨이트 LLM 안전성은 출시 성능뿐 아니라 저비용 파인튜닝 후 약화 가능성까지 함께 봐야 한다.

llm

출처2026년 7월 4일2026-07-04

PACE로 에이전트 평가 압축

PACE는 저비용 비에이전트 평가로 고비용 에이전트 성능 예측 가능성을 점검한다.

llm

출처2026년 7월 4일2026-07-04

ReContext, 장문맥의 착시를 넘다

ReContext는 128K 장문맥 지원보다 입력 속 증거를 다시 꺼내 쓰게 하는 추론 하네스의 가치를 보여준다.

llm

출처2026년 7월 4일2026-07-04

논문 재현 에이전트의 조건

과학 ML 논문 재현에서 코드 생성보다 중요한 진행 관리와 증거-주장 검증 워크플로우의 의미를 짚는다.

llm

출처2026년 7월 3일2026-07-03

에이전트 안전 테스트 자동화

수작업 위반 사례와 고정 규칙 한계를 넘어, 증거 기반 에이전트 안전 검증 자동화를 다룬 논문 요약.

llm

출처2026년 7월 3일2026-07-03

RLVR와 인간시연 결합 학습

RLVR에 인간 시연 신호를 더해 문체·구조·다양성까지 함께 학습하는 논문을 다룬다.

hardware

커뮤니티2026년 7월 3일2026-07-03

코드 모델 비교의 기준

코드 모델 평가는 벤치마크 점수보다 이슈 해결, 재시도, 토큰 비용을 함께 봐야 한다.

llm

출처2026년 7월 3일2026-07-03

DiscoLoop 내부 추론 실험

DiscoLoop는 CoT를 길게 쓰지 않고 단일 포워드 패스 내부에서 멀티홉 추론을 처리하는 가능성을 탐색한다.

llm

출처2026년 7월 3일2026-07-03

철도 건널목 AI 안전도 검증

철도 건널목 이미지와 사고 이력 결합 AI의 안전도 추정 가능성과 검증 범위를 짚는다.

llm

출처2026년 7월 3일2026-07-03

OCB로 본 오피스 이해 한계

OCB는 네이티브 오피스 파일 이해를 평가하며, PDF QA를 넘는 문서 AI 한계를 드러낸다.

hardware

커뮤니티2026년 7월 2일2026-07-02

AI 데이터센터 병목은 전력망

AI 데이터센터 쟁점은 총량 공포보다 전력망 연계, 냉각 방식, 물 추적 같은 운영 조건에 있다.

llm

출처2026년 7월 2일2026-07-02

DART-VLN, 재학습 없는 길찾기

DART-VLN은 재학습 없이 테스트 단계 제어만으로 discrete VLN의 메모리 오류와 루프를 줄이려 한다.

robotics

출처2026년 7월 2일2026-07-02

NTN 로봇 통신의 기억 설계

야외 로봇의 NTN 통신에서 순간 채널 대신 과거 상태와 작업 맥락을 반영하는 설계 필요성을 짚는다.

Aionda

"deep-dive" 태그

AI 시대, 메타버스의 재시험

에이전트형 LLM 운영 원칙

국가 AI 전략, 실행의 시대

AI 인프라 경쟁의 전력망 변수

소형 모델 신뢰도 라우팅

요리 휴머노이드의 승부처

AI 시대, 희소성은 어디로

왜 LLM은 코딩을 앞세우나

LLM 성격보다 정렬이 핵심

콜드스타트 PPI의 5개 모달리티

의료 AI, 시험보다 임상 추론

오픈웨이트 안전의 새 기준

PACE로 에이전트 평가 압축

ReContext, 장문맥의 착시를 넘다

논문 재현 에이전트의 조건

에이전트 안전 테스트 자동화

RLVR와 인간시연 결합 학습

코드 모델 비교의 기준

DiscoLoop 내부 추론 실험

철도 건널목 AI 안전도 검증

OCB로 본 오피스 이해 한계

AI 데이터센터 병목은 전력망

DART-VLN, 재학습 없는 길찾기

NTN 로봇 통신의 기억 설계