研究热点
LLM + 无人机 + 机器人领域 · 每日更新
🔥 研究趋势
🤖 LLM + VLA 双层架构
LLM做意图理解,VLA做动作执行,分工明确。DIAL架构成为主流范式。
📡 NL → STL → 控制
自然语言先转为时序逻辑(STL),再生成安全轨迹。CoT+GRPO确保翻译正确性。
🖥️ 边缘部署优先
实时VLA、TensorRT-LLM等都在优化边缘推理速度,适合机载计算。
🎯 仿真平台统一
CARLA-Air统一AirSim和CARLA,减少仿真-真机迁移gap。
📰 最新资讯 (5)
Amazon 收购 Rivr 爬楼配送机器人
🟢TechCrunch · 2026-03-19
亚马逊收购能爬楼梯的配送机器人Rivr,凸显电商对无人化送货上门服务的高度重视,加速末端配送无人化进程。
阅读原文 →
OpenAI 正在开发桌面端超级应用
🟢The Verge · 2026-03-19
OpenAI正在开发整合ChatGPT、Codex和Atlas浏览器的桌面超级应用,AI应用从分散工具向平台化整合转型。
阅读原文 →
Valve 发布 SteamOS 3.8 游戏系统更新
🟢The Verge · 2026-03-19
Valve发布SteamOS 3.8.0预览版,首次支持Steam Machine客厅游戏PC,扩展对第三方掌机支持,构建跨设备游戏生态。
阅读原文 →
NVIDIA GR00T N1.6 + Cosmos Reason 2 发布
🟢NVIDIA Newsroom · 2026-04-01
NVIDIA发布开源物理AI模型GR00T N1.6和Cosmos Reason世界模型,全球合作伙伴推出下一代机器人,机器人的ChatGPT时刻已至。
阅读原文 →
Jeff Bezos 收购传统工业公司用AI改造
🟢TechCrunch · 2026-03-19
Jeff Bezos启动新项目,收购传统工业公司并用AI技术进行数字化改造,标志科技巨头从消费互联网向工业实体经济渗透。
阅读原文 →
📚 最新论文 (6)
DIAL: Decomposing Vision-Language Models into Intent Understanding and Action Decoding
Stanford / Berkeley · 2026-03-31
VLA架构创新:VLM不应只做编码器,应利用高层意图理解。分为Intent Bottleneck(潜世界模型编码意图)和Action Decoding(潜逆动力学解码动作),实现LLM→VLA→PX4架构解耦。
arXiv 原文 →
LLM-Enabled UAV NL Navigation: Natural Language to Signal Temporal Logic for Autonomous Flight
港科大 · 2026-03-30
自然语言→信号时序逻辑(STL)→MILP轨迹优化。CoT推理+GRPO优化确保翻译正确性,STL修复机制处理不可行约束。已有实机飞行验证。
arXiv 原文 →
CARLA-Air: Unified Aerial-Ground Simulation Infrastructure
ETH Zurich · 2026-03-30
AirSim + CARLA统一到单一Unreal Engine进程,零修改复用AirSim API+ROS 2。18种传感器模态同步采集。完整仿真验证环境,适合毕设仿真验证。
arXiv 原文 →
AeroGen: Agentic Drone Autonomy through Single-Shot Structured Prompting
MIT / UC Berkeley · 2026-03-25
PX4 + LLM agent单步结构化提示,一次prompt完成多任务规划。轻量级方案,适合边缘部署。支持语音控制和云端API。
arXiv 原文 →
Realtime-VLA V2: Learning to Run VLAs Fast, Smooth and Accurate
上海AI Lab · 2026-03-20
实时VLA,在边缘设备(Jetson)上快速流畅运行VLAs。EAGLE-3投机解码+NVFP4量化优化,兼顾精度和速度。适合无人机实时性需求。
arXiv 原文 →
FocusVLA: Visual Attention Optimization for Efficient Vision-Language-Action Models
字节跳动 · 2026-03-28
VLA瓶颈在于如何利用视觉而非视觉质量本身。提出Modality Cascaded Attention消除快捷路径。边缘部署计算优化参考。
arXiv 原文 →
⭐ GitHub 热门项目 (8)
PX4 Autopilot
★ 11.4k开源无人机自动驾驶软件,支持多旋翼、固定翼、VTOL等。学术界最流行的无人机研究平台。
Prometheus_PX4
★ 11PX4无人机自主飞行解决方案,包含目标追踪、集群控制、SLAM等应用模块。活跃开源社区。
embodied-drone-agents
★ 18LLM drone agent系统,使用MAVSDK-Python作为工具,LangGraph编排任务规划,支持自然语言控制无人机。
llm-uav (Atmaca)
★ 0集成Gemma 3 4B与无人机控制,支持自然语言指令,边缘部署。
MAVLinkMCP
★ 16MCP (Model Context Protocol) server for LLM与MAVLink无人机的通信,支持通过MCP协议控制PX4无人机。
Awesome-RL-VLA
★ 613RL+VLA论文汇总:强化学习视觉-语言-动作模型综述。
Awesome-LLM-Robotics
★ 4.3k大语言模型/多模态模型在机器人领域的应用论文汇总。
Awesome-Aerial-VLN
★ 46空中视觉-语言导航(Aerial VLN)论文汇总:无人机VLN方向最新研究。
🔍 没有找到匹配的结果
尝试调整筛选条件或关键词