new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

by AK and the research community

Sep 5

Submitted by

akhaliq

Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency

·
6 authors

Submitted by

Xidong

LongLLaVA: Scaling Multi-modal LLMs to 1000 Images Efficiently via Hybrid Architecture

·
5 authors

Submitted by

NeoZ123

LongCite: Enabling LLMs to Generate Fine-grained Citations in Long-context QA

·
11 authors

Submitted by

akhaliq

MMMU-Pro: A More Robust Multi-discipline Multimodal Understanding Benchmark

·
14 authors

Submitted by

Fanzhri

Affordance-based Robot Manipulation with Flow Matching

·
2 authors

Submitted by

akhaliq

Arctic-SnowCoder: Demystifying High-Quality Data in Code Pretraining

·
3 authors

Submitted by

akhaliq

FastVoiceGrad: One-step Diffusion-Based Voice Conversion with Adversarial Conditional Diffusion Distillation

·
4 authors

Submitted by

davanstrien

Political DEBATE: Efficient Zero-shot and Few-shot Classifiers for Political Text

·
4 authors