Léo Hunout's picture

422082.9 TFLOPS

Léo Hunout

hunoutl

·

AI & ML interests

AI Engineer working on Jean Zay supercomputer in France 🇫🇷

Organizations

hunoutl's activity

upvoted 2 papers 21 days ago

TPI-LLM: Serving 70B-scale LLMs Efficiently on Low-resource Edge Devices

Paper • 2410.00531 • Published 22 days ago • 28

Hyper-Connections

Paper • 2409.19606 • Published 24 days ago • 19

upvoted 4 papers 29 days ago

Gated Slot Attention for Efficient Linear-Time Sequence Modeling

Paper • 2409.07146 • Published Sep 11 • 19

Breaking reCAPTCHAv2

Paper • 2409.08831 • Published Sep 13 • 4

Kolmogorov-Arnold Transformer

Paper • 2409.10594 • Published Sep 16 • 38

Scaling Smart: Accelerating Large Language Model Pre-training with Small Model Initialization

Paper • 2409.12903 • Published Sep 19 • 21

upvoted 20 papers about 1 month ago

Configurable Foundation Models: Building LLMs from a Modular Perspective

Paper • 2409.02877 • Published Sep 4 • 27

Transformer Explainer: Interactive Learning of Text-Generative Models

Paper • 2408.04619 • Published Aug 8 • 154

The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery

Paper • 2408.06292 • Published Aug 12 • 115

Imagen 3

Paper • 2408.07009 • Published Aug 13 • 60

To Code, or Not To Code? Exploring Impact of Code in Pre-training

Paper • 2408.10914 • Published Aug 20 • 40

Diffusion Models Are Real-Time Game Engines

Paper • 2408.14837 • Published Aug 27 • 121

Efficient LLM Scheduling by Learning to Rank

Paper • 2408.15792 • Published Aug 28 • 19

Law of Vision Representation in MLLMs

Paper • 2408.16357 • Published Aug 29 • 92

LinFusion: 1 GPU, 1 Minute, 16K Image

Paper • 2409.02097 • Published Sep 3 • 31

GPUDrive: Data-driven, multi-agent driving simulation at 1 million FPS

Paper • 2408.01584 • Published Aug 2 • 7

Language Model Can Listen While Speaking

Paper • 2408.02622 • Published Aug 5 • 37

Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters

Paper • 2408.03314 • Published Aug 6 • 33

Achieving Human Level Competitive Robot Table Tennis

Paper • 2408.03906 • Published Aug 7 • 26

Jamba-1.5: Hybrid Transformer-Mamba Models at Scale

Paper • 2408.12570 • Published Aug 22 • 29

Hermes 3 Technical Report

Paper • 2408.11857 • Published Aug 15 • 36

Foundation Models for Music: A Survey

Paper • 2408.14340 • Published Aug 26 • 38

FLUX that Plays Music

Paper • 2409.00587 • Published Sep 1 • 31

OLMoE: Open Mixture-of-Experts Language Models

Paper • 2409.02060 • Published Sep 3 • 77

LongLLaVA: Scaling Multi-modal LLMs to 1000 Images Efficiently via Hybrid Architecture

Paper • 2409.02889 • Published Sep 4 • 54

Attention Heads of Large Language Models: A Survey

Paper • 2409.03752 • Published Sep 5 • 87

upvoted 17 papers 3 months ago

Stable Audio Open

Paper • 2407.14358 • Published Jul 19 • 22

Scalify: scale propagation for efficient low-precision LLM training

Paper • 2407.17353 • Published Jul 24 • 11

Gemma 2: Improving Open Language Models at a Practical Size

Paper • 2408.00118 • Published Jul 31 • 73

SAM 2: Segment Anything in Images and Videos

Paper • 2408.00714 • Published Aug 1 • 106

Q-Sparse: All Large Language Models can be Fully Sparsely-Activated

Paper • 2407.10969 • Published Jul 15 • 20

Efficient Training with Denoised Neural Weights

Paper • 2407.11966 • Published Jul 16 • 8

Scaling Diffusion Transformers to 16 Billion Parameters

Paper • 2407.11633 • Published Jul 16 • 25

Spectra: A Comprehensive Study of Ternary, Quantized, and FP16 Language Models

Paper • 2407.12327 • Published Jul 17 • 76

Attention Overflow: Language Model Input Blur during Long-Context Missing Items Recommendation

Paper • 2407.13481 • Published Jul 18 • 9

Fast Matrix Multiplications for Lookup Table-Quantized LLMs

Paper • 2407.10960 • Published Jul 15 • 11

Associative Recurrent Memory Transformer

Paper • 2407.04841 • Published Jul 5 • 31

Unveiling Encoder-Free Vision-Language Models

Paper • 2406.11832 • Published Jun 17 • 49

CosmoCLIP: Generalizing Large Vision-Language Models for Astronomical Imaging

Paper • 2407.07315 • Published Jul 10 • 6

Inference Performance Optimization for Large Language Models on CPUs

Paper • 2407.07304 • Published Jul 10 • 52

MambaVision: A Hybrid Mamba-Transformer Vision Backbone

Paper • 2407.08083 • Published Jul 10 • 27

Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15 • 155

LazyLLM: Dynamic Token Pruning for Efficient Long Context LLM Inference

Paper • 2407.14057 • Published Jul 19 • 44

upvoted 5 papers 4 months ago

Wavelets Are All You Need for Autoregressive Image Generation

Paper • 2406.19997 • Published Jun 28 • 29

μLO: Compute-Efficient Meta-Generalization of Learned Optimizers

Paper • 2406.00153 • Published May 31 • 9

pOps: Photo-Inspired Diffusion Operators

Paper • 2406.01300 • Published Jun 3 • 16

SF-V: Single Forward Video Generation Model

Paper • 2406.04324 • Published Jun 6 • 23

BitsFusion: 1.99 bits Weight Quantization of Diffusion Model

Paper • 2406.04333 • Published Jun 6 • 36

upvoted 11 papers 5 months ago

Thermodynamic Natural Gradient Descent

Paper • 2405.13817 • Published May 22 • 13

The Road Less Scheduled

Paper • 2405.15682 • Published May 24 • 20

Matryoshka Multimodal Models

Paper • 2405.17430 • Published May 27 • 30

An Introduction to Vision-Language Modeling

Paper • 2405.17247 • Published May 27 • 85

Instruct-MusicGen: Unlocking Text-to-Music Editing for Music Language Models via Instruction Tuning

Paper • 2405.18386 • Published May 28 • 20

LLaMA-NAS: Efficient Neural Architecture Search for Large Language Models

Paper • 2405.18377 • Published May 28 • 18

2BP: 2-Stage Backpropagation

Paper • 2405.18047 • Published May 28 • 23

What matters when building vision-language models?

Paper • 2405.02246 • Published May 3 • 98

Layer-Condensed KV Cache for Efficient Inference of Large Language Models

Paper • 2405.10637 • Published May 17 • 19

Reducing Transformer Key-Value Cache Size with Cross-Layer Attention

Paper • 2405.12981 • Published May 21 • 28

Your Transformer is Secretly Linear

Paper • 2405.12250 • Published May 19 • 150

upvoted a paper 6 months ago

Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone

Paper • 2404.14219 • Published Apr 22 • 251