正在阅读:沈阳自动化所机器视觉研究多篇论文获AAAI2026录用
资讯
微谱检测有奖调研
当前位置:仪器网>新闻首页>行业要闻

沈阳自动化所机器视觉研究多篇论文获AAAI2026录用

2025-11-17 09:07:01来源:中国科学院沈阳自动化研究所关键词:机器视觉阅读量:21624
我要评论

  近日,国际人工智能顶级会议AAAI 2026论文接收结果公布,中国科学院沈阳自动化研究所在机器视觉研究方面的多篇研究论文获录用。
 
  在多模态大模型视觉生成方面,研究团队提出了一种专家表征对齐的多模态大模型训练框架ARRA,可有效促进大模型学习跨模态表征,实现多任务通用多模态生成。相关研究成果Unleashing the Potential of Large Language Models for Text-to-Image Generation through Autoregressive Representation Alignment被大会选为口头汇报(Oral)论文,论文第一作者为博士生谢兴,通讯作者为范慧杰研究员与屈靓琼助理教授。
 
  在多模态大模型方面,研究团队提出了创新的物体分词框架ObjecTok,显著提升了模型以物体为中心的感知与推理能力。相关成果论文为ObjecTok: Learning Holistic and Robust Object Tokens for MLLMs,第一作者为博士生王思翰,通讯作者为刘西瑶副研究员。
 
  在具身智能操作方面,研究团队提出了一种仿人知识总结与继承的终身学习框架,赋予智能操作机器人持续演进、不断适应新技能的终身学习能力。相关研究成果论文为Lifelong Language-Conditioned Robotic Manipulation Learning,第一作者为博士生王旭东与沈阳自动化所实习生韩泽斌,通讯作者为韩志研究员。
 
  在具身智能导航方面,研究团队提出了一种基于分层规划策略的导航智能体,可提升智能机器人在复杂大场景中具身导航的鲁棒性。相关研究成果论文为SeqWalker: Sequential-Horizon Vision-and-Language Navigation with Hierarchical Planning,第一作者为沈阳自动化所实习生、中北大学本科生韩泽斌,通讯作者为博士生王旭东。
 
  在视频定制化生成方面,研究团队提出了一种连续定制化视频扩散模型,可在连续动态空间中实现任意概念的个性化视频生成。相关研究成果论文为Bring Your Dreams to Life: Continual Text-to-Video Customization,第一作者为沈阳自动化所博士毕业生、穆罕默德·本·扎耶德人工智能大学博士后董家华和沈阳自动化所博士生王旭东,通讯作者为韩志研究员。
 
  在生成式世界模型方面,研究团队提出了首个可用自然语言控制的 4D LiDAR 生成模型,实现了高逼真、可编辑的动态点云场景生成,可用于多种下游感知模型的安全验证和闭环仿真。该研究成果LiDARCrafter: Dynamic 4D World Modeling from LiDAR Sequences被大会选为口头汇报(Oral)论文,第一作者为博士生梁奥,通讯作者为赵怀慈研究员。
 
  上述研究成果得到了国家自然科学基金、国家重点研发计划、机器人与智能系统全国重点实验室自主项目、沈阳自动化所基础研究项目等支持。(机器人学研究室 光电信息技术研究室)
版权与免责声明:1.凡本网注明“来源:仪器网”的所有作品,均为浙江兴旺宝明通网络有限公司-兴旺宝合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:仪器网”。违反上述声明者,本网将追究其相关法律责任。 2.本网转载并注明自其它来源(非仪器网)的作品,目的在于传递更多信息,并不代表本网赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品第一来源,并自负版权等法律责任。 3.如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。
全部评论

昵称 验证码

文明上网,理性发言。(您还可以输入200个字符)

所有评论仅代表网友意见,与本站立场无关

相关新闻更多
  • 上海微系统所在机器视觉弱小目标检测方面取得进展

    目标检测是具身智能实现场景理解与环境交互的基石。在图像探测等典型应用中,受观测视角、拍摄距离、传感器分辨率等成像条件限制,所获取的图像中常包含大量微小且密集的关键目标。
    2026-01-30 15:52:31
    19285
  • 科学岛团队提出一种跨模态机器视觉人工智能模型实现跨模态图像检索技术

    近日,中国科学院合肥物质院智能所先进制造中心王红强研究员团队提出一种宽域跨模态机器视觉AI模型,突破了传统单域模型跨模态信息处理瓶颈,实现了跨模态图像检索技术新突破。
    2024-09-12 09:02:10
    17880
  • 汇聚创新,以“视觉”致远——VisionChina2024(上海)机器视觉展圆满闭幕,共绘工业智能化新蓝图

    2024年7月10日,由机器视觉产业联盟主办,慕尼黑展览(上海)有限公司承办,为期三天的中国(上海)机器视觉展暨机器视觉技术及工业应用研讨会【VisionChina2024(上海)】在上海新国际博览中心圆满闭幕!现场人头攒动,国际交流的热烈氛围如同盛夏的烈日般炽热,各国参展商与观众之间,大模型、通用机器视觉、工业元宇宙成为共通的语言,AI 视觉系统的应用也将继续引领机器视觉行业高速的发展。今年,展
    2024-07-12 08:39:30
    11605
  • VisionChina(上海)2024特色活动等你来探!

    VisionChina(上海)机器视觉展即将在2024年7月8-10日于上海新国际博览中心的E1&E2馆召开。 作为国内外机器视觉领域的全品类展示平台,本次展会将全面呈现机器视觉系统及其核心部件和插件的前沿科技与创新成果。届时,各地的工业应用领域专家、学者和技术精英将汇聚一堂,共同探索行业发展的新趋势,为企业增强市场竞争力、发掘创新解决方案提供绝佳的交流与合作平台。与此同时,展会同期还将举办一系列
    2024-06-27 16:58:02
    11405
  • 光学传感器让“机器视觉”走进千家万户

    美国俄勒冈州立大学在新型光学传感器研发上取得重大进展。他们开发出一种新型光学传感器,可更逼真地模仿人眼感知物体变化的能力。这一成果有望带来图像识别、机器人技术和人工智能等领域的重大突破。
    2020-12-14 10:21:21
    2477
推荐产品
浙公网安备 33010602002722号