AI 技术周刊 | 2026.03.04 - 2026.03.11

本文最后更新于 2026年3月11日 上午

本期 AI 技术周刊覆盖 2026.03.04 - 2026.03.11,共收录 13 篇文章,涵盖大模型、AI 应用、开源项目等热点方向。



🔹 AI 应用落地

Gemini in Google Sheets just achieved state-of-the-art performance.

Google 将 Gemini 深度集成至 Sheets,支持自然语言驱动的整表创建、结构化编辑与复杂数据分析;通过端到端推理优化与表格感知提示工程,在多项基准测试中达到 SOTA 水平。

🔗 原文链接

Google Search 新增 AI Mode Canvas,支持用户在搜索界面内直接进行多步协同创作——包括文档草拟、代码生成与交互式工具构建,采用链式调用与上下文保留机制实现跨任务状态一致性。

🔗 原文链接


🔹 开源项目

How our open-source AI model SpeciesNet is helping to promote wildlife conservation

SpeciesNet 是一个轻量级、可扩展的开源视觉模型,专为野外图像细粒度物种识别设计,支持低资源场景下的零样本迁移与主动学习标注闭环,已部署于多个保护区监测系统。

🔗 原文链接

Introducing Storage Buckets on the Hugging Face Hub

Hugging Face 推出 Hub Storage Buckets 功能,提供类 S3 的对象存储接口,支持大模型权重、数据集分片及中间产物的版本化、权限隔离与带宽优化访问,显著降低开源模型协作的数据管理开销。

🔗 原文链接

Introducing Modular Diffusers - Composable Building Blocks for Diffusion Pipelines

Modular Diffusers 重构了扩散模型架构范式,将采样器、调度器、UNet 组件等解耦为可插拔模块,支持运行时动态组合与热替换,大幅提升 pipeline 可复现性与实验迭代效率。

🔗 原文链接

LeRobot v0.5.0: Scaling Every Dimension

LeRobot v0.5.0 发布统一机器人学习框架,集成多模态观察编码、VLA(Vision-Language-Action)微调流水线及跨硬件部署工具链,首次支持从仿真到真实嵌入式机械臂的端到端策略迁移。

🔗 原文链接


🔹 大模型进展

The latest AI news we announced in February

Google 正式发布 Gemini 3.1 Pro 多模态大模型,强化长上下文推理(2M tokens)、实时网络检索增强与工具调用可靠性;同步推出 Nano Banana 2 轻量级边缘模型,专为手机端低延迟多步任务编排优化。

🔗 原文链接

Granite 4.0 1B Speech: Compact, Multilingual, and Built for the Edge

IBM Granite 4.0 Speech 是一款仅 10 亿参数的语音大模型,支持 128 种语言端到端语音识别与合成,在 4GB 内存设备上实现实时推理,采用知识蒸馏与量化感知训练保障边缘精度损失低于 1.2%。

🔗 原文链接

Ulysses Sequence Parallelism: Training with Million-Token Contexts

Ulysses 提出新型序列并行算法,通过沿 token 维度动态切分注意力计算与梯度更新,突破传统张量并行限制,首次在单节点 8×H100 上稳定训练百万 token 上下文模型,通信开销降低 67%。

🔗 原文链接


🔹 AI 基础设施与研究方法

How NVIDIA Builds Open Data for AI

NVIDIA 系统性构建开放数据基础设施,涵盖合成数据引擎(Omniverse Replicator)、领域特定数据飞轮(如 Earth-2 气象数据集)及数据质量评估框架,强调可审计性、许可合规性与跨模态对齐。

🔗 原文链接

Keep the Tokens Flowing: Lessons from 16 Open-Source RL Libraries

该综述分析 16 个主流开源 RL 库的异步训练架构,提炼出事件驱动调度、梯度流控与回放缓冲区分层压缩三大关键模式,为大规模离线强化学习提供可扩展性设计指南。

🔗 原文链接

Bringing Robotics AI to Embedded Platforms: Dataset Recording, VLA Fine‑Tuning, and On‑Device Optimizations

恩智浦联合 Hugging Face 提出嵌入式机器人 AI 全栈方案:支持低成本硬件原生采集多模态机器人轨迹数据、基于 LoRA 的 VLA 模型轻量化微调,以及 TVM 编译器自动算子融合优化。

🔗 原文链接


🔹 技术原理与科普

Ask a Techspert: How does AI understand my visual searches?

文章深入解析 Google 视觉搜索背后的技术栈:多阶段特征对齐(CLIP-style 图文编码器 + 专用局部特征提取器)、查询意图消歧机制,以及基于图神经网络的跨域视觉概念泛化能力。

🔗 原文链接


📝 编辑寄语

以上内容由 AI 自动聚合与摘要生成,仅供参考。如有遗漏或错误,欢迎反馈。


本期周刊由 Weekly AI Tech Digest 自动生成于 2026-03-11 10:24:15


AI 技术周刊 | 2026.03.04 - 2026.03.11
https://www.vgtmy.com/2026/03/11/AI技术周刊自动生成-20260311/
作者
二郎神表弟
发布于
2026年3月11日
更新于
2026年3月11日
许可协议