new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

by AK and the research community

Dec 7

Submitted by

akhaliq

Kandinsky 3.0 Technical Report

·
9 authors

Submitted by

akhaliq

Schrodinger Bridges Beat Diffusion Models on Text-to-Speech Synthesis

·
5 authors

Submitted by

akhaliq

Relightable Gaussian Codec Avatars

·
5 authors

Submitted by

akhaliq

Gaussian Head Avatar: Ultra High-fidelity Head Avatar via Dynamic Gaussians

·
7 authors

Submitted by

akhaliq

MotionCtrl: A Unified and Flexible Motion Controller for Video Generation

·
7 authors

Submitted by

akhaliq

OneLLM: One Framework to Align All Modalities with Language

·
9 authors

Submitted by

akhaliq

Cache Me if You Can: Accelerating Diffusion Models through Block Caching

·
14 authors

Submitted by

akhaliq

HiFi4G: High-Fidelity Human Performance Rendering via Compact Gaussian Splatting

·
8 authors

Submitted by

akhaliq

Context Diffusion: In-Context Aware Image Generation

·
6 authors

Submitted by

akhaliq

LooseControl: Lifting ControlNet for Generalized Depth Conditioning

·
3 authors

Submitted by

akhaliq

MagicStick: Controllable Video Editing via Control Handle Transformations

·
8 authors

Submitted by

akhaliq

Generative agent-based modeling with actions grounded in physical, social, or digital space using Concordia

·
10 authors

Submitted by

akhaliq

DreamComposer: Controllable 3D Object Generation via Multi-View Conditions

·
8 authors

Submitted by

akhaliq

Self-conditioned Image Generation via Generating Representations

·
3 authors

Submitted by

akhaliq

HybridNeRF: Efficient Neural Rendering via Adaptive Volumetric Surfaces

·
8 authors

Submitted by

akhaliq

Language-Informed Visual Concept Learning

·
4 authors

Submitted by

akhaliq

Multimodal Data and Resource Efficient Device-Directed Speech Detection with Large Foundation Models

·
7 authors