国际前沿观察|推出AtomoVideo高保真图生视频框架;我国攻克短波红外成像芯片技术;人形机器人未来5年复合增长率超50%


Time:

2024-09-10

01 大模型|Anthropic发布Claude 3系列模型,具有接近人类的理解能力

3月4日,被称为“OpenAI最强竞对”的大模型公司Anthropic重磅发布了其第三代人工智能模型——Claude 3系列模型,包括Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku。其中,Claude 3 Opu为Claude 3系列模型的最强版本,具有接近人类的理解能力,可以灵巧地处理开放式提示和复杂的任务,根据官方给到的资料,其性能全面超过了GPT-4。据了解,Claude 3 系列模型具有与其他领先模型同等的复杂视觉功能,可以处理各种视觉格式,包括照片、图表、图形和技术图表。

02 大模型|阿里巴巴推出AtomoVideo高保真图生视频框架,兼容多种文生图模型

3月7日,阿里巴巴研究团队推出了AtomoVideo高保真图生视频框架,使用静态图像生成高质量的视频内容,并与各种文生图模型兼容,目前相关论文已公开。

该框架基于多粒度图像注入,实现了生成的视频对给定图像的高保真度。此外,由于高质量的数据集和训练策略,该框架实现了更大的运动强度,同时保持了优越的时间一致性和稳定性,可以灵活地扩展到视频帧预测任务,通过迭代生成实现长序列预测。AtomoVideo使用预先训练好的T2I模型为基础,在每个空间卷积层和注意力层之后新添加一维时空卷积和注意力模块,T2I模型参数固定,只训练添加的时空层。由于输入的串联图像信息仅由VAE编码,代表的是低层次信息,有助于增强视频相对于输入图像的保真度。同时,团队还以Cross-Attention的形式注入高级图像语义,以实现更高的图像语义可控性。

图:输入的图片到生成的视频

来源:论文https://arxiv.org/abs/2403.01800

03 人工智能|俄罗斯总统批准新版《2030年人工智能发展国家战略》

2月中旬,俄罗斯总统普京签署第124号总统令,批准新版《2030年人工智能发展国家战略》(以下简称《AI战略》)。《AI战略》从基础设施建设到人才保障均提出了详细的计划安排。以下节选部分内容:

到2030年,俄罗斯境内所有采用人工智能技术的超级计算机总算力将从2022年的0.073exaflops(每秒浮点运算百亿亿次)至少提升到1 exaflops;人工智能技术对国内生产总值的贡献应从2022年的0.2万亿卢布(21.89亿美元)至少提升到11.2万亿卢布(1226亿美元);人工智能解决方案研发和应用服务规模应从2022年的120亿卢布(1.3亿美元)至少提升到600亿卢布(6.56亿美元);与人工智能领域相关的高校毕业生数量应该从3048人/年提高至1.55万人/年;拥有人工智能技术使用技能的员工数量在员工总数的比重从2022年的5%提升到80%。

此外,战略中增加了如下内容:增加开发人工智能技术所需的基础设施;支持人工智能技术的开发者组织;支持研究和开发,以确保人工智能的先进发展;提升人工智能能力水平以及公民对人工智能技术的认识;鼓励在经济和社会部门引入人工智能技术;推广可信的人工智能技术;建立与开发和使用人工智能技术相关的全面监管和法律监管制度;确保这些技术的安全性;在使用人工智能技术方面开展国际合作;为执行该战略提供专家分析和方法支持。

04 芯片|英特尔有望获35亿美元政府拨款,用以推动先进芯片生产

3月7日,彭博社报道称美国政府准备向英特尔公司投资35亿美元,英特尔将为美国国防领域生产先进的半导体芯片。该资金来自于《芯片与科学法案》拨款项目,为了让芯片制造商在美国生产半导体产品。据了解,这是美国政府引导半导体制造业回归美国计划中的最大一笔投资,他们的目标是到2030年至少建立两个领先的制造业集群。

05 芯片|我国攻克短波红外成像芯片新技术,成本降至传统方式百分之一 

3月7日,湖北光谷实验室宣布,其科研团队研发的胶体量子点成像芯片已实现短波红外成像,面阵规模 30 万、盲元率低于 6‰、波长范围 0.4-1.7 微米、暗电流密度小于 50nA / cm2、外量子效率高于 60%,号称“性能优越”。 光谷实验室表示,在食品检测、半导体检测等工业应用中,基于短波红外成像的机器视觉如同机器的“眼睛”,具有重要意义。成像芯片作为成像系统最核心部件,对成像质量以及相机成本均起着决定性作用。

光谷实验室是由华中科技大学牵头组建,以国家和湖北经济社会发展的重大战略需求为导向,以提升原始创新能力、突破产业发展关键技术瓶颈为使命,坚持“四个面向”,瞄准代表世界先进水平的“0”到“1”原创性基础科学研究和“卡脖子”关键核心技术研究,产出世界级重大成果,力争建设国家实验室,打造国家的战略科技力量。

06 芯片|机器人AI芯片组市场价值在2028年预计达到8.66亿美元

随着生成式人工智能技术在机器人领域的普及化,市场调查企业Omdia估计,全球机器人人工智能芯片组市场规模将达到8.66亿美元。目前虽然NVIDIA 的GPU仍然是云基础设施和机器人的人工智能芯片组架构,但Qualcomm、Intel和AMD等非GPU供应商已经推出了针对机器视觉、导航和测绘以及功能安全等设备端机器人应用的人工智能系统级芯片(SoC)或专用人工智能芯片组。

07 芯片|香港城市大学与香港中文大学合作研发出全球领先的微波光子芯片

3月7日,香港城市大学电机工程学系王骋教授团队与香港中文大学研究人员合作,开发出了全球领先的微波光子芯片,比传统电子处理器快 1000 倍且耗能更低,可运用光学进行超快模拟电子信号处理及运算。研究院对表示,他们的研究成果不仅开辟了新的研究领域,即铌酸锂微波光子学,使微波光子芯片更小巧、具高讯号保真度与低延迟性能,也是芯片级模拟电子处理与运算引擎的突破。相关研究成果已经以《集成铌酸锂微波光子处理引擎》为题发表在《自然》上。

08 机器人|人形机器人未来5年复合增长率超50%

中投产业研究院发布的《2024-2028年中国未来产业之人形机器人行业趋势预测及投资机会研究报告》显示,2022年全球人形机器人市场规模达到15亿美元。人形机器人在全球范围内处于高速发展阶段,未来市场增长潜力巨大。预计2028年全球人形机器人市场规模将增至138亿美元,5年内年均复合增长率达50.29%。

从技术上看,人形机器人发展的一个主要痛点是其运动能力与实际使用的应用场景匹配度不够,其原因在于算法复杂度和数据规模限制,导致其智能化不足。ChatGPT等人工智能大模型技术发展有望使机器人智能水平获得跨越式提升,包括人机交互增强、自主学习和决策能力提升、感知和行为有望形成闭环。

09 机器人|日本高校研发新型蠕动机器人

受尺蠖的运动机制启发,日本名古屋大学和东京工业大学研究人员研发出新型蠕动机器人。该机器人机身采用Autodesk Inventor 2023软件设计并使用Objet260 Connex 3 3D打印机制造,主体材料为Agilus30柔性材料。机体嵌入McKibben型人工肌肉,内表面涂覆润滑剂以提高运动流畅性。实验表明,该机器人的最大速度为8.54毫米/秒,负载能力超过100克。这一进步不仅证明了机器人仿生设计在提高运输任务的效率和适应性方面的潜力,而且为精密物体运输和自动化物流的实际应用开辟了新的途径。

10 机器人|星动纪元联合清华大学、上海期智研究院发布人形机器人强化学习训练框架

具身智能与人形机器人公司星动纪元联合清华大学、上海期智研究院开源了人形机器人强化学习训练框架Humanoid-Gym。Humanoid-Gym框架通过其精心设计的奖励函数以及域随机化技术,有望显著简化人形机器人的训练并降低从模拟世界到真实世界(sim-to-real)转换的难度。本次Humanoid-Gym开源后,用户还可以通过该框架轻松运用sim-to-sim转换功能,即先在更高精度的仿真环境Mujoco中进行初步验证与筛选,从而提升sim-to-real转换的效率和成功率。目前,该框架已在星动纪元旗下的两款机器人——小星(1.2米高)和小星max(1.65米高)上成功验证。