LLM과 과학모델 결합의 평가 루프
LLM은 설계·조정, 과학모델은 제약·평가를 맡아 재귀 최적화를 만든다.
LLM은 설계·조정, 과학모델은 제약·평가를 맡아 재귀 최적화를 만든다.
4비트 양자화에서 PPL이 FP16보다 낮아질 수 있는 조건과 재현 검증 절차를 정리한다.
지난 수집 자료(공식/뉴스) 중 중요한 링크를 모아 정리했다.
3.5B 토큰 연소 지식베이스와 CombustionQA로 지식 주입과 평가를 파이프라인으로 고정.
신모델 과신·의인화·환각을 줄이기 위해 주장-근거-검증으로 업무를 쪼개는 방법.
LegalBench로 법률 LLM을 평가하고, 정당화·감사가능성을 논증 구조로 설계하는 방법을 정리한다.
PDF 표 추출은 입력 방식·용량 제한·시각 분석 여부에 따라 결과가 달라져 구조 지표 기반 평가가 필요하다.
지난 수집 자료(공식/뉴스) 중 중요한 링크를 모아 정리했다.
AI 코딩 쿼터를 권한으로 볼 때 마켓 설계, 약관 위반·보안·검수 리스크를 If/Then으로 정리.
폴란드어 11B 모델에서 2-bit PTQ 6종을 비교, 지표와 생성 붕괴 괴리를 분석.
연속학습 망각을 정확도뿐 아니라 구조적 붕괴·가소성 상실로 해석하고 eRank로 추적한다.
지난 수집 자료(공식/뉴스) 중 중요한 링크를 모아 정리했다.
희소·구식 상호작용 데이터에서, 하드 클리핑 대신 log-ratio 가우시안 신뢰가중으로 안정적 재사용을 제안.
부분관측 TAMP에서 과업 비관련 객체도 반영해 LLM로 belief를 보강하고, 캘리브레이션·안전필터로 신뢰성을 다룬다.
AI 구독은 가격보다 한도·약관·업타임 공개를 점검해 업무 중단 위험을 줄이는 최소 조합이 핵심이다.
NVML/DCGM/nvidia-smi는 구간 평균·비율이다. 1Hz 로깅에서 LLM 추론 전력 변동을 해석한다.
외부 LLM API 기반 리셀러형 서비스의 원가·운영 최적화와 보안·컴플 이슈, 계약 체크포인트를 정리.
미국 혁신을 ‘최초 발명’과 ‘상용화·확산’으로 나눠 1차 기록과 특허로 교차검증한다.
공백·정규화·토큰 경계 차이가 추론 실패처럼 보이는 이유와 평가 통제법.
AI CapEx 기대와 금리·환율이 장비주 변동성을 만드는 경로를 데이터로 분해·검증하는 방법.
추론·메모리·지속학습 용어 혼선을 KPI로 분리해 검증하는 의사결정 메모.
Roofline 조건 I≤π/β로 LLM 추론 병목을 판정하고, 대역폭·캐시·인터커넥트 투자 우선순위를 정리한다.
같은 질문에도 바뀌는 AI 추천을 반복 실행, seed·fingerprint로 측정·통제한다.
지난 수집 자료(공식/뉴스) 중 중요한 링크를 모아 정리했다.