人工智能行业最新动态
AI 博主宝玉发帖询问是否有类似 pi-mono、claude-agent-sdk 的 Python Agent 框架,反映当前 AI Agent 开发框架需求旺盛。
Karpathy 表示,普通用户不应需要知道 App 的存在,LLM Agent 应该代替用户完成操作,这才是 AI 的正确方向。
Elon Musk 分享了一张经 Grok 修复并上色的历史照片,展示了 xAI 大模型在图像处理方面的能力。
Google 发布 Unified Latents (UL) 研究论文,提出统一潜空间训练方法,探索如何更高效地训练潜在表示模型。
AI 开发者宝玉分享经验,认为 Claude Agent SDK 做原型开发简单方便,但正式上线建议使用 pi-mono 或类似轻量级框架。
Google 在印度 AI 影响力峰会上宣布多项更新,包括新的实时语音对语音翻译模型,支持超过 70 种语言含 10 种印度语言,可消除对话中的语言障碍。
Supabase 邀请 Bolt.new CEO Eric Simons 举办线上活动,分享企业创新团队如何利用 AI 编程工具在 Supabase 上构建真实应用。
Together AI 发布 CDLM 方法,通过后训练方案解决扩散语言模型的 KV 缓存不兼容和高步数问题,在 Dream-7B 上实现 4.1-7.7 倍步数减少和最高 14.5 倍延迟降低,数学和编码准确率保持竞争力。
What if you could cut your sales cycle by 67% and grow to multi-seven-figure ARR with half the staff? That's exactly what @mathewtisson, CEO and Founder of @skypointcloud, has done by building 10–15…
Split view, Save to Google Drive and PDF annotations are designed to give you a productivity boost and make Chrome more helpful than ever. Here’s what to know: 1️⃣ Use split view to see two pages at…
Browserbase 宣布与 n8n 合作,在 n8n 节点目录中推出 Browserbase Agent Node,为工作流自动化增加浏览器智能代理能力。
Vercel AI Gateway 新增 Grok Imagine Video 和 Grok Imagine Image 模型,2 月 25 日前可免费使用。
Meta AI 的 alexandr_wang 在印度 AI 影响力峰会上分享了 Meta 对个人超级智能的愿景,并展示了印度开发者如何利用 AI 解决重大社会挑战。
SLA2 论文提出结合可学习路由与量化感知训练的稀疏线性注意力机制,优化 Transformer 推理效率。
自动化工作流平台 n8n 宣布与 Cognee 合作,共同推进 AI 记忆领域的技术创新。
Google 新论文发现大模型的事实性问题根源在于「召回」(Recall)而非「存储」,为提升模型可靠性提供新方向。
Replicate 宣布 Gemini 3.1 Pro 已上线平台,推理性能相比 Gemini 3 Pro 翻倍,费用保持不变。
RynnBrain 开源具身基础模型论文发布,旨在推进机器人通用智能研究。
Vercel 宣布 AI Gateway 支持视频生成,开发者可通过 AI SDK 6 的 generateVideo 函数快速接入视频生成能力。
Gemini 3.1 Pro 的 ARC-AGI-2 得分从 31.1% 跃升至 77.1%,超越 Claude Opus 4.6(68.8%)和 GPT-5.2(52.9%),Google 重回 AI 第一梯队。
Google 分享一位员工使用 Gemini 优化储蓄策略、创建专业财务追踪工具的实际案例。
宝玉感慨技术老手常一眼看穿技术本质却忽视产品价值,许多成功产品并不需要高深技术含量。
Google 用 Gemini 3.1 Pro 实时构建国际空间站追踪面板,展示模型在多流推理、实时 API 对接和物理渲染方面的能力。
Perplexity 宣布 Gemini 3.1 Pro 已向所有 Pro 和 Max 订阅用户开放使用。
Replit 发布 Animation 功能,用户可通过 Vibe Coding 在数分钟内生成视频内容,由 Gemini 3.1 Pro 驱动。
Karpathy 分享用 Vibe Coding 一小时编写个人心率训练仪表盘的经历,展望高度定制化软件将成为新趋势。
swyx 认为 Gene Kim 和 Steve Yegge 去年 11 月关于后 IDE 时代的演讲是 AIE 历史上最精准的预测,2026 年 AI 编程正从 IDE 向 Agent 工程化转型。
ElevenLabs 发布 ElevenAgents 中的 Experiments 功能,支持运行 A/B 测试来优化 Agent 配置,涵盖提示词结构、工作流逻辑、语音和个性等维度。
Google DeepMind 展示使用 Gemini 3.1 Pro 构建的城市规划应用,模型能处理复杂地形、规划基础设施并模拟交通,生成高质量可视化效果。
Cursor 在过去三个月陆续上线了全平台 Agent 沙箱功能,允许 Agent 在安全环境中自由运行,仅在需要越界时请求用户批准。