研究热点

LLM + 无人机 + 机器人领域 · 每日更新

📦 历史归档

🔥 研究趋势

🤖 LLM + VLA 双层架构

LLM做意图理解,VLA做动作执行,分工明确。DIAL架构成为主流范式。

📡 NL → STL → 控制

自然语言先转为时序逻辑(STL),再生成安全轨迹。CoT+GRPO确保翻译正确性。

🖥️ 边缘部署优先

实时VLA、TensorRT-LLM等都在优化边缘推理速度,适合机载计算。

🎯 仿真平台统一

CARLA-Air统一AirSim和CARLA,减少仿真-真机迁移gap。

类型:
标签:
🔍
0 条结果

📚 最新论文 (6)

DIAL: Decomposing Vision-Language Models into Intent Understanding and Action Decoding

Stanford / Berkeley · 2026-03-31

⭐ 高优先级

VLA架构创新:VLM不应只做编码器,应利用高层意图理解。分为Intent Bottleneck(潜世界模型编码意图)和Action Decoding(潜逆动力学解码动作),实现LLM→VLA→PX4架构解耦。

VLALLMRobotEmbodied AIIntent

arXiv 原文 →

LLM-Enabled UAV NL Navigation: Natural Language to Signal Temporal Logic for Autonomous Flight

港科大 · 2026-03-30

⭐ 高优先级

自然语言→信号时序逻辑(STL)→MILP轨迹优化。CoT推理+GRPO优化确保翻译正确性,STL修复机制处理不可行约束。已有实机飞行验证。

LLMUAVSTLNLPMotion Planning

arXiv 原文 →

CARLA-Air: Unified Aerial-Ground Simulation Infrastructure

ETH Zurich · 2026-03-30

⭐ 高优先级

AirSim + CARLA统一到单一Unreal Engine进程,零修改复用AirSim API+ROS 2。18种传感器模态同步采集。完整仿真验证环境,适合毕设仿真验证。

SimulationUAVROSCARLASensor Fusion

arXiv 原文 →

AeroGen: Agentic Drone Autonomy through Single-Shot Structured Prompting

MIT / UC Berkeley · 2026-03-25

⭐ 高优先级

PX4 + LLM agent单步结构化提示,一次prompt完成多任务规划。轻量级方案,适合边缘部署。支持语音控制和云端API。

LLMUAVPX4AgentEdge AI

arXiv 原文 →

Realtime-VLA V2: Learning to Run VLAs Fast, Smooth and Accurate

上海AI Lab · 2026-03-20

实时VLA,在边缘设备(Jetson)上快速流畅运行VLAs。EAGLE-3投机解码+NVFP4量化优化,兼顾精度和速度。适合无人机实时性需求。

VLAReal-timeEdge AIQuantization

arXiv 原文 →

FocusVLA: Visual Attention Optimization for Efficient Vision-Language-Action Models

字节跳动 · 2026-03-28

VLA瓶颈在于如何利用视觉而非视觉质量本身。提出Modality Cascaded Attention消除快捷路径。边缘部署计算优化参考。

VLAAttentionEdge AIEfficiency

arXiv 原文 →

📡 数据来源: arXiv · GitHub · 📦 历史归档
研究方向:LLM + 无人机 + 具身智能 · 每日 08:45 自动更新