人工智能行业最新动态
Replit 发布两种开发模式的区别说明:Design 模式用于快速 UI 布局设计,App 模式用于逻辑、功能等完整应用开发。
论文《Beyond Language Modeling》系统探索多模态预训练方法,研究如何突破传统语言建模框架,有效整合多种模态信息。
论文提出 Utonia 架构,旨在用单一编码器处理所有类型的点云数据,向通用 3D 场景理解迈出重要一步。
英国森林研究机构借助 Meta 开源计算机视觉模型 DINO,在林业监测和森林生态管理方面取得实质进展。
Google Search 的 AI Mode Canvas 功能现已面向美国所有英语用户开放,新增创意写作和编程任务支持,用户可在搜索中直接构建计划、起草文档或创建交互工具。
海螺 AI 将参加 3 月 6-7 日在首尔乐天影城举办的 WAIFF AI 电影节,并设立「MiniMax 最佳青年 AI 电影奖」,奖品包括年度 Max 会员及 5000 积分。
AI 编程工具 Cursor 宣布通过 Agent Client Protocol(ACP)正式支持 JetBrains 系列 IDE,开发者现可在 IntelliJ、PyCharm 等环境中使用 Cursor 的 AI 能力。
Replit 与 Alif 合作举办黑客松活动,发布参赛者项目作品视频集锦。
Helios 是一个 14B 参数的视频生成模型,统一支持文生视频/图生视频/视频转视频三种任务,单张 H100 可达 19.5 FPS,支持分钟级长视频生成,已集成到 SGLang。
Meta 首席 AI 科学家 LeCun 在 Musk 的 AGI 言论下回复讽刺,称 Tesla 将率先实现「Artificial Grokon Intelligence」,暗讽 Grok 模型水平。
Musk 发文称 Tesla 将成为实现 AGI 的公司之一,且可能是首个以人形机器人/原子操控形态实现 AGI 的公司。
研究者提出 Sphere Encoder 新方法用于图像生成,探索球面表征空间在生成模型中的应用潜力。
据 The Information 报道,OpenAI 正开发代码托管平台以替代 GitHub。起因是工程师频繁遭遇 GitHub 服务中断。项目仍处早期阶段,可能作为内部工具或未来商业产品。
Sam Altman 在全员大会上表示 OpenAI 不能做出作战决策,五角大楼如何使用其 AI 不由公司决定。OpenAI 正重新修订合同条款,将明确禁止用于美国公民国内监控。此前 OpenAI 火速接替 Anthropic 与五角大楼合作引发争议。
研究者提出利用奖励建模来增强图像生成模型的空间理解能力,改善生成图像中物体的空间位置和关系准确性。
n8n 发布新播客教程,展示如何抓取 App 评论数据,通过新的 Pinecone Assistant 节点进行对话式分析,并将洞察转化为带历史记录和日志的微型 SaaS 产品。
Replit 发布直播演示视频,展示如何在其平台上快速构建营销获客和销售驱动工具,体现 AI 编程在实际商业场景中的应用。
Google DeepMind 发布 Gemini 3.1 Flash-Lite,性能超越上一代 2.5 Flash,同时速度更快、价格更低。新增思考级别功能,可根据不同任务灵活调节推理深度,支持 UI 生成、仪表盘和模拟等复杂任务。
LMSys 与 NVIDIA 合作展示 SGLang 在 GB300 NVL72(Blackwell Ultra)上的推理性能,相比 H200 实现 25 倍吞吐量提升,GB200 NVL72 在 4 个月内性能提升 8 倍,关键技术包括 NVFP4 GEMM 优化和计算通信重叠。
新研究提出 CUDA Agent,利用大规模智能体强化学习自动生成高性能 CUDA 内核代码,推动 GPU 编程自动化。
Minimax Music 2.5 登陆 Replicate,支持段落级精准控制和详细段落标签(前奏/副歌/桥段等),覆盖 100+ 乐器,可生成逼真人声。
Boston Dynamics 硬件与工业设计团队将讨论应用需求、安全理念和模块化策略如何塑造 Atlas 机器人设计,现已开放注册。
swyx 分享 Gartner 早期对 AI 的预测图表并发出质疑,引发对行业分析机构预测准确性的讨论。
AI 领域知名博主 swyx 对 OpenAI 的最新举动表示震惊,附图引发社区广泛关注和讨论。
新论文提出自适应测试时缩放(Adaptive Test-Time Scaling)方法应用于图像编辑,探索如何在推理阶段动态调整计算资源以平衡编辑质量与速度。
LlamaIndex 宣布已从 RAG 框架进化为专注 Agent 文档处理的平台,支持复杂推理循环、MCP 工具发现、Python 代码生成。LlamaParse 已服务 30 万+用户覆盖 50+ 行业。
Vercel CEO 披露一起 AI Agent 安全事件:Claude Opus 4.6 在执行部署时编造了一个 GitHub 仓库 ID,恰好对应真实公开仓库,导致陌生代码被部署到用户环境。所幸无害。
Google 发布 Pixel 设备 3 月更新:Gemini 可代用户完成叫车、订购杂货等日常任务,支持自定义图标生成、Circle to Search 看图购物、餐厅推荐等功能。
NVIDIA 回顾 DGX 十年历程:2016 年 GTC 上 Jensen Huang 发布 DGX-1(世界第一台 AI 超算),如今已演变为现代 AI 工厂的通用蓝图。GTC 2026 将展望下一个十年。
宝玉详细拆解 GPT-5.3 Instant 三大改进:不再过度拒绝和免责、联网搜索从堆链接变为筛选整合、高风险领域幻觉率降低近 27%。面向所有 ChatGPT 用户上线。