全部 今日 本周 本月
2026-06-12

Kimi-Moonshot开源K2.7-Code编程模型登陆SGLang

长多步代码任务可靠性提升,推理Token减少30%,与K2.5/K2.6架构兼容,现有部署环境可直接运行。

产品发布 AI 摘要 · 单一来源
@lmsysorg 阅读 →

Codex推出双向Token用量重置机制

邀请好友双方各获一次重置机会,Codex通过社交裂变方式重置个人用量限制。

大模型 AI 摘要 · 单一来源
@dotey 阅读 →

高级RAG解决基础检索的噪声和准确性问题

n8n发布生产级检索系统构建指南,详解信息搜索、排序、过滤的优化方法,提升LLM查询质量。

大模型 AI 摘要 · 单一来源
@n8n_io 阅读 →

海螺AI用户创作世界杯足球支持视频

用户Seedily利用MiniMaxHub制作巴西、阿根廷、西班牙、英格兰等队加油视频,展示AI视频创作能力。

行业 AI 摘要 · 单一来源
@Hailuo_AI 阅读 →

AI摘要正在取代传统搜索成为流量入口

a16z指出AI摘要驱动搜索流量下滑、零点击搜索上升的趋势,并附相关数据图表。

行业 AI 摘要 · 单一来源
@a16z 阅读 →

Replit NYC Vibecon 即将开启:2 天艺术、代码与文化大咖齐聚

Vibecon 将于纽约举办为期两天的艺术、代码与文化盛会,邀请业界最具影响力的创作者参与,活动详情见链接,合作伙伴包括 BrandNewSchool。

行业 AI 摘要 · 单一来源
@Replit 阅读 →

Allen AI 发布 olmo-eval 工作台,专为迭代式 LLM 评估设计

训练 LLM 时每次调参或规模扩大都需要重新跑基准测试,olmo‑eval 工作台提供检查点追踪、自动化循环和可视化分析,帮助开发者快速迭代模型。

研究 AI 摘要 · 单一来源
@allen_ai 阅读 →

连市长都在关注 Replit NYC 的氛围

在纽约的 Replit 活动现场,市长也出现在现场,关注氛围和活动,显示出活动的热度与影响力。

行业 AI 摘要 · 单一来源
@Replit 阅读 →

Replit 推出并行智能体,可同步交付网站、App、视频与路演文档

用户可在单个项目中同时运行多个代理,构建并部署网站、移动端 App、宣传视频以及演示文档,还可向已有项目添加多个产物。

产品发布 AI 摘要 · 单一来源
@Replit 阅读 →

Git 是否会是下一个被淘汰的遗留技术?

PR 与代码审查结束后,合并冲突仍占代码工作量 20‑40%。作者质疑 Git 是否必要,建议采用类似人与人协作的聊天、侧评论、负责人发布的模式,取代逐行合并。

产品发布 AI 摘要 · 单一来源
@swyx 阅读 →

Paul Graham用奥卡姆剃刀分析Epstein文件:至少部分指控为真

推测Elon在两人分歧时提及此事,说明并非泛泛指控,而是有实质内容支撑;简单声明"出现在文件中但内容全假"会显得无力

行业 AI 摘要 · 单一来源
@paulg 阅读 →

SGLang在GB300 NVL72上创纪录:DeepSeek V4 Pro达每秒1.2万toke…

通过NVIDIA Dynamo编排和MTP技术,在FP4精度下8K/1K配置实现高性能,且交互曲线全程保持强劲表现

研究 AI 摘要 · 单一来源
@lmsysorg 阅读 →

YC Paper Club热议:LLM自我博弈、蛋白质世界模型、流式RAG

研究者展示AI在生物学、形式验证和代理编程中的应用,涵盖从蛋白质建模到Scaling Self-Play等前沿议题

研究 AI 摘要 · 单一来源
@ycombinator 阅读 →

Claude Fable 5推理追踪功能曝光,可深入互动思考过程

OpenClaw新增forceBlockStreamingForReasoning参数,能清晰展示推理痕迹,提供更深层次的思考互动体验

大模型 AI 摘要 · 单一来源
@garrytan 阅读 →

MiniMax Hub上线:本地AI代理工作站,支持并行项目与批量生成

AI工作流正从编程转向创作,涵盖研究、脚本、图片、音乐到最终剪辑的全流程,支持无限画布和本地资产访问

产品发布 AI 摘要 · 单一来源
@Hailuo_AI 阅读 →

黄仁勋:计算正经历60年来最大转变,从检索转向生成

这一转变代表AI蛋糕生态五层架构中价值数万亿美元的机会,涵盖构建、发现和解决问题的全新可能

行业 AI 摘要 · 单一来源
@nvidia 阅读 →

NVIDIA AI Enterprise提供政府级安全AI部署方案

合规性常阻碍AI项目从试点阶段推进。NVIDIA AI Enterprise提供符合政府要求的安全软件,为全球团队打造可投入生产的基础设施,使团队能专注于AI部署而非漏洞管理。

行业 AI 摘要 · 单一来源
@nvidia 阅读 →

GTC Taipei精彩回顾:台北活动激发AI社区热情

GTC Taipei期间,台北展现了充满活力的技术社区氛围。从满座的keynote会场、前沿机器人技术到有趣的本地互动(小龙虾钳钥匙扣),这座城市给参与者留下深刻印象。NVIDIA感谢所有参与者共同…

观点 · 观点/主张 AI 摘要 · 单一来源
@nvidia 阅读 →

MiniMax M3发布:开源模型集成百万token上下文与Agent能力

MiniMax M3具备前沿编码和代理能力,支持原生图像视频输入及计算机使用。核心创新为MSA稀疏注意力架构,查询仅需评分128-token KV块并仅对高分块执行注意力,使百万token上下文服务…

大模型 AI 摘要 · 单一来源
@vllm_project 阅读 →

AI时代的关键技能:学会"向上循环"获取杠杆效应

Loopcraft讨论AI堆叠循环的策略。早期知道何时"向下"降级可提高可靠性,但随着模型改进,学会"向上"循环才能获得更大杠杆。若不掌握此技能,终将被掌握者超越。

观点 · 观点/主张 AI 摘要 · 单一来源
@swyx 阅读 →

首个代理AI基础设施基准AgentPerf出炉,NVIDIA Blackwell能效领先20倍

代理AI需串联数十至数百次模型调用,现有基准无法评估。AgentPerf为开发者、企业和基础设施提供商提供统一比较标准,首轮测试显示NVIDIA Blackwell每兆瓦处理代理数量是竞品的20倍。

产品发布 AI 摘要 · 单一来源
@nvidia 阅读 →

Google披露8种Google I/O上的AI创新用法

Google展示了从搜索、翻译到Pixel相机等场景的AI应用,揭示了AI在产品中的深度融合。

行业 AI 摘要 · 单一来源
@Google 阅读 →

MIT免费课程讲解计算机科学核心数学(Lecture 4)

MIT教授Erik Demaine在第4讲中解析状态机,帮助学生掌握计算机科学必备的数学基础。

行业 AI 摘要 · 单一来源
@MIT_CSAIL 阅读 →

NVIDIA祝贺SpaceX IPO首日大涨,双方合作近十年

NVIDIA与SpaceX自2016年交付首台DGX-1超级计算机到定制DGX Spark,双方在加速计算助力太空探索方面持续突破。

产品发布 AI 摘要 · 单一来源
@nvidia 阅读 →

Karpathy赞叹SpaceX发展历程,祝贺团队

从过去到现在,SpaceX不断突破航天技术边界,Karpathy对其多维度视角仍感惊讶,并高度赞扬团队成就。

观点 · 观点/主张 AI 摘要 · 单一来源
@karpathy 阅读 →

Musk期待把与NVIDIA合作推向新台阶

在SpaceX与NVIDIA近十年的合作基础上,双方计划在AI和太空计算领域进一步深度协同。

产品发布 AI 摘要 · 单一来源
@elonmusk 阅读 →

开发者吐槽现有平台基础设施冗余

swyx指出Vercel、Cloudflare、Netlify等平台在错误处理与项目监控上存在缺口,每次项目都需重复搭建基础设施,效率低下。

观点 · 观点/主张 AI 摘要 · 单一来源
@swyx 阅读 →

ChatGPT Pro用户收到专属纪念笔

知名AI博主宝玉分享收到ChatGPT Pro专属纪念笔,展现产品对用户的关怀与认可。

大模型 AI 摘要 · 单一来源
@dotey 阅读 →

Google DeepMind 机器人加速器启动,15家欧洲初创公司入选

为期三个月的项目将为其提供AI技术栈、Gemini Robotics模型及团队实战指导,助力欧洲物理AI发展。

产品发布 AI 摘要 · 单一来源
@GoogleDeepMind 阅读 →

vLLM现已支持Kimi K2.7-Code部署

1T参数MoE架构、32B活跃参数、256K上下文窗口,推理token减少约30%;复用K2.6部署配置即可。

观点 · 观点/主张 AI 摘要 · 单一来源
@vllm_project 阅读 →