Tag: prompting

10 articles available

SourceMay 23, 20262026-05-23

Structuring Table QA With Navigation And Progressive Inference

A look at structuring table QA with guided cell navigation and staged inference to improve accuracy and verify evidence paths.

Prompt-Guided Image Compression for VLM Efficiency Gains

llm

SourceApr 3, 20262026-04-03

Prompt-Guided Image Compression for VLM Efficiency Gains

How prompt-guided image compression for VLMs shifts focus from human visual quality to preserving clues needed for tasks.

Distinguishing Logprobs From Self-Reported Confidence in Prompts

hardware

CommunityMar 10, 20262026-03-10

Distinguishing Logprobs From Self-Reported Confidence in Prompts

Explains why token logprobs differ from natural-language confidence, and how to test multi-candidate prompts with seeds and evals.

Why Custom Instructions Personas Drift Under Hierarchy

hardware

CommunityMar 8, 20262026-03-08

Why Custom Instructions Personas Drift Under Hierarchy

Model Spec’s chain of command can override custom instructions, causing persona and reasoning drift. Design priorities, exceptions, and fallbacks to improve reproducibility.

Evaluating Zero-Shot MLLMs for Reliable Video Anomaly Alerts

hardware

SourceMar 7, 20262026-03-07

Evaluating Zero-Shot MLLMs for Reliable Video Anomaly Alerts

Assesses zero-shot MLLMs for video anomaly detection, focusing on false alarms/misses, prompt specificity, 1–3s clips, and PR/F1 evaluation.

Tokenizer Pitfalls That Masquerade As Reasoning Failures

agi

CommunityMar 4, 20262026-03-04

Tokenizer Pitfalls That Masquerade As Reasoning Failures

How whitespace, Unicode normalization, and token boundaries can look like reasoning failures, and how to control evaluation setups.

Measuring And Controlling Variance In Generative AI Recommendations

agi

CommunityMar 2, 20262026-03-02

Measuring And Controlling Variance In Generative AI Recommendations

Generative AI recommendations can vary by default. Measure variance via reruns, improve reproducibility with seed and system_fingerprint, and add constraints and checklists.

Sycophancy Risks: When Conversational AI Over-Agrees With Users

agi

CommunityFeb 17, 20262026-02-17

Sycophancy Risks: When Conversational AI Over-Agrees With Users

Why conversational AI sycophancy is treated as a quality/alignment risk in official docs and evals, plus practical mitigation prompts.

Designing Boundaries for Relationship Tests in AI Chats

hardware

CommunityFeb 16, 20262026-02-16

Designing Boundaries for Relationship Tests in AI Chats

How to handle relationship-test prompts in AI chats: set refusal boundaries with Safe Complete, document branching rules, and validate via evaluation.

PersonaPlex Enables Low Latency Consistent Voice Personas

hardware

CommunityFeb 12, 20262026-02-12

PersonaPlex Enables Low Latency Consistent Voice Personas

PersonaPlex combines text role prompts and audio voice prompts to keep consistent personas in low-latency, full-duplex speech conversations.