"llm" 태그

1060개 · 13 / 45페이지

기계적 해석가능성의 핵심 쟁점이 해석 자체보다 감사·재현 가능한 검증 규칙에 있음을 짚는다.

llm

출처2026년 6월 2일2026-06-02

계산수학 AI의 핵심은 루프

계산수학 AI는 정답률보다 수치실험, 검증, 재시도 루프의 완수력이 더 중요하다.

llm

출처2026년 6월 2일2026-06-02

TriLens 환각 조기탐지

TriLens가 레이어별 엔트로피로 환각 징후를 조기 탐지하는 화이트박스 접근의 의미와 한계를 짚는다.

k-ai-pulse

자료 모음2026년 6월 1일2026-06-01

AI 자료 모음 (24h) - 2026-06-01

지난 수집 자료(공식/뉴스) 중 중요한 링크를 모아 정리했다.

llm

출처2026년 6월 1일2026-06-01

CHECKMATE와 알고리즘 진화

정답 형식과 설명만으로 조합최적화 알고리즘 코드를 진화시키는 CHECKMATE의 의미와 한계를 짚는다.

llm

출처2026년 6월 1일2026-06-01

코드골프 벤치의 함정

CodeGolf Bench가 60개 언어에서 LLM의 간결한 코드 생성을 평가하지만 실무 생산성과는 구분해 봐야 한다.

agi

출처2026년 6월 1일2026-06-01

국가별 생성형 AI 사용 격차

국가 소득과 언어 환경에 따라 생성형 AI의 교육·활용 목적이 어떻게 달라지는지 짚는다.

llm

출처2026년 6월 1일2026-06-01

LLM 신뢰성의 운영 패치

범용 신뢰성보다 운영 경계 안의 패치별 통제와 실패 관리가 중요하다는 논문 분석.

llm

출처2026년 6월 1일2026-06-01

SCALE, 웹 에이전트의 자가탐색

SCALE은 웹 에이전트가 전문가 시연 의존을 줄이고 자기탐색·자기평가로 학습할 수 있는지 짚는다.

llm

출처2026년 6월 1일2026-06-01

따뜻한 AI, 더 설득적일까

개인화와 따뜻한 표현이 AI 신뢰·설득·의존에 미치는 영향을 실험 결과 중심으로 짚는다.

agi

커뮤니티2026년 6월 1일2026-06-01

AI는 왜 가사를 멈출까

AI가 가사·장문 원문 재현을 막고, 사용자 제공 텍스트 변환은 허용하는 이유를 짚는다.

k-ai-pulse

자료 모음2026년 5월 31일2026-05-31

AI 자료 모음 (24h) - 2026-05-31

지난 수집 자료(공식/뉴스) 중 중요한 링크를 모아 정리했다.

llm

커뮤니티2026년 5월 31일2026-05-31

AI 글쓰기 평가는 누가 정하나

AI 글 품질은 생성력만이 아니라 숙련도·맥락·검수 기준에 따라 달라진다.

hardware

커뮤니티2026년 5월 31일2026-05-31

번역과 이미지 AI의 다른 잣대

번역과 이미지 생성 AI가 다른 평가를 받는 이유를 데이터 권리, 직무 구조, 노동·지재권 관점에서 짚는다.

k-ai-pulse

자료 모음2026년 5월 30일2026-05-30

AI 자료 모음 (24h) - 2026-05-30

지난 수집 자료(공식/뉴스) 중 중요한 링크를 모아 정리했다.

agi

출처2026년 5월 30일2026-05-30

규제 QA의 인용 폐쇄

규제 QA에서 답변 정확도보다 규칙별 출처 귀속과 인용 폐쇄의 중요성을 짚는다.

llm

출처2026년 5월 30일2026-05-30

DistractionIF와 RAG 취약점

외부 문서의 지시문형 잡음을 명령으로 오인하는 RAG 취약점과 대응 우선순위를 짚는다.

llm

출처2026년 5월 30일2026-05-30

해양 납 데이터, LLM이 읽다

전문가 가이드형 LLM 에이전트로 해양 납·동위원소 문헌 데이터를 구조화하는 접근을 짚는다.

agi

출처2026년 5월 30일2026-05-30

PRO-CUA, 단계 보상의 전환

PRO-CUA는 브라우저 에이전트를 trajectory 보상 대신 단계별 process reward로 학습시키는 구조를 제안한다.

agi

커뮤니티2026년 5월 30일2026-05-30

AI 한도 재판매의 경계

개인 구독과 API의 과금·계약 구조 차이와 AI 한도 재판매의 정책·보안 리스크를 짚는다.

hardware

출처2026년 5월 30일2026-05-30

GPF-LiveNews 편향 감사

정적 벤치마크를 넘어, 뉴스·모델 변화에 맞춰 LLM 프레이밍 편향을 추적하는 운영형 평가 접근.

llm

출처2026년 5월 30일2026-05-30

학생 맞춤 추론 증류 기준

DMC는 데이터 품질보다 학생 모델과의 난이도 정합성이 추론 증류 성능에 중요할 수 있음을 짚는다.

k-ai-pulse

자료 모음2026년 5월 29일2026-05-29

AI 자료 모음 (24h) - 2026-05-29

지난 수집 자료(공식/뉴스) 중 중요한 링크를 모아 정리했다.

llm

커뮤니티2026년 5월 29일2026-05-29

AI, 수학의 전략 보조자

AI를 수학의 정답 생성기보다 장기 과제 수행자이자 전략 보조자로 보는 관점을 짚는다.

Aionda

"llm" 태그

해석보다 중요한 검증 규칙

계산수학 AI의 핵심은 루프

TriLens 환각 조기탐지

AI 자료 모음 (24h) - 2026-06-01

CHECKMATE와 알고리즘 진화

코드골프 벤치의 함정

국가별 생성형 AI 사용 격차

LLM 신뢰성의 운영 패치

SCALE, 웹 에이전트의 자가탐색

따뜻한 AI, 더 설득적일까

AI는 왜 가사를 멈출까

AI 자료 모음 (24h) - 2026-05-31

AI 글쓰기 평가는 누가 정하나

번역과 이미지 AI의 다른 잣대

AI 자료 모음 (24h) - 2026-05-30

규제 QA의 인용 폐쇄

DistractionIF와 RAG 취약점

해양 납 데이터, LLM이 읽다

PRO-CUA, 단계 보상의 전환

AI 한도 재판매의 경계

GPF-LiveNews 편향 감사

학생 맞춤 추론 증류 기준

AI 자료 모음 (24h) - 2026-05-29

AI, 수학의 전략 보조자