Research

At K-Scale, our research focuses on building efficient and effective end-to-end multimodal models for embodied intelligence. We share our latest findings here.

September 9, 2024

6 min read

Efficient Vision-Language-Action Models

Improving inference speed of vision-language-action models for edge devices while preserving encoding power.