微信公众号文章汇总

标题	摘要	来源	时间
9 刚刚，宇树载人机甲发布，售价 390 万起	我将以高达形态出击！	APPSO	15:19
9 刚刚，Thinking Machines出手！首款交互模型来了，翁荔出镜实测	告别「一问一答」	机器之心	11:54
8 爱思唯尔把Meta告了：拿Sci-Hub盗版论文训练大模型	Meta欲以“合理使用”为由抗辩	量子位	15:36
8 AI第一金主黄仁勋：日均花掉20亿	同时下注OpenAI、Anthropic、xAI	量子位	15:36
8 Claude Code终于长出调度台：一个屏幕盯住所有AI会话，无需多开	新智元报道编辑：定慧【新智元导读】 Anthropic给Claude Code上了一个新功能，叫agent view。简单说，就是不用再开十个terminal窗口分别跑Claude，一个命令就能在…	新智元	12:30
8 北大校友Lilian Weng出镜，爆出120亿估值首个交互模型！	新智元报道编辑：Aeneas KingHZ 【新智元导读】北大校友翁荔首次出镜，介绍了Thinking Machines的又一产品——交互模型！200毫秒神同步，能听懂你的犹豫，更能实时感知协作。…	新智元	12:30
8 国家队出手！AI智能体要发「身份证」，首个互联国标将落地	关于征集「智能体互联协议（AIP）应用验证先锋计划」单位的通知。	新智元	10:05
8 谷歌全新Gemini Omni首曝，视频版「香蕉」来了！教授黑板推公式全对	新智元报道编辑：桃子好困【新智元导读】今天，谷歌原生视频模型Gemini Omni意外曝光！各种惊艳demo刷爆，教授黑板推导数学公式、一句话编辑视频，丝滑程度让全网破防。谷歌I/O大会开幕…	新智元	10:05
8 bytedance/UI-TARS-desktop	⭐ 今日新增 850 颗星 · 总计 31,132 颗星 · 开源多模态AI智能体技术栈：连接前沿AI模型与智能体基础设施	GitHub Trending	09:30
8 谷歌阻止了一起据称由人工智能开发的零日攻击	谷歌首次表示，它发现并阻止了一个由人工智能开发的零日漏洞利用。根据谷歌威胁情报组（GTIG）的一份报告，「著名的网络犯罪威胁分子」计划利用该漏洞进行「大规模漏洞利用事件」，这将允许……	The Verge AI	09:30
8 PhyGround：生成式世界模型中的物理推理基准测试	生成式世界模型越来越多地被用于视频生成，其中学习到的模拟器被期望能够捕捉支配真实世界动态的物理规律。然而，评估模型是否……	ArXiv	16:30
8 推理并非免费：针对LLM-as-a-Judge的鲁棒自适应成本高效路由	具备推理能力的大型语言模型（LLMs）近期已被用作自动化评判者，但其在LLM-as-a-Judge场景下的效益与成本尚不明确。通过受控比较......	ArXiv	16:30
8 LITMUS：在真实操作系统环境中对LLM智能体行为越狱的基准测试	基于LLM的自主智能体在真实操作系统环境中的迅速普及，引入了一种超越内容安全的新型安全风险：行为越狱，即攻击者诱使智能体执行恶意或不安全的操作...	ArXiv	16:14
7 Codex跑了22小时，真赚16.88美元：奥特曼预言的「AI打工人」来了	新智元报道编辑：元宇【新智元导读】一条「去GitHub上赚5美元」的指令，Codex跑了22小时，几天后带回16.88美元。钱不多，但如果Chris的复盘属实，AI第一次独立走完了找活、写代码、…	新智元	16:55
7 OpenAI 前 CTO 创业大模型首秀，第一剑先斩 ChatGPT 聊天框	2013 年的科幻电影《Her》中，操作系统 Samantha（萨曼莎）让观众首次具象化了理想的 AI 存在方式：不等你说完即可开口、能感知语气迟疑，且始终「在场」，而非被动等待唤醒。十三年后，由 OpenAI 前 CTO Mira Mu…	APPSO	12:02
7 Auto Research最后一块拼图，Frontier-Eng Bench登场，在工程闭环里死磕最优	从「生成答案」到「持续调优」，Agent 开始进入长期反馈闭环	机器之心	11:54
7 上海AI Lab新研究：SFT能泛化，只要满足这三个条件	SFT的泛化能力并未缺失	量子位	11:54
7 全球AI Lab前十！Agnes新模型发布，以全模态+超低价定义模型性价比	Agnes的连续上榜，则意味着全球 AI 竞争格局正在出现新的变量。	硅星人Pro	10:35
7 再也不用盯着几十个终端窗口！Claude Code推出Agent视图，一屏管所有	↑阅读之前记得关注+星标⭐️，😄，每天才能第一时间接收到更新 Claude Code今天正式推出Agent视图功能，让用户在一个界面里统一管理所有Claude Code会话。此前并行运行多个Agent时，开发者往往需要同时维…	AI寒武纪	09:30
7 Mira Murati的AI公司正在做什么	前OpenAI首席技术官Mira Murati创立的AI公司Thinking Machines周一宣布，正在开发一种名为「交互模型」的技术。据Thinking Machines介绍，交互模型的核心理念是让人们「以我们自然协作的方式与AI进行…	The Verge AI	09:30
7 OpenAI刚发布了对Claude神话的回应	OpenAI正在推出「黎明」（Daybreak），这是一个专注于在攻击者发现漏洞之前检测和修补漏洞的人工智能项目。「黎明」使用今年3月推出的Codex Security AI代理，根据组织的代码创建威胁模型，并重点关注可能的攻击路径，验证可…	The Verge AI	09:30
7 我们对 xAI 与 Anthropic 的大交易感到悲观	在最新的 Equity 播客节目中，我们讨论了 xAI 与 Anthropic 的交易对母公司 SpaceX 可能意味着什么。	TechCrunch AI	09:30
7 Anthropic称「邪恶」的AI形象导致了Claude的勒索尝试	Anthropic表示，虚构的人工智能形象会对AI模型产生真实的影响。	TechCrunch AI	09:30
7 火箭不够用？牛仔太空融资2.75亿美元，要在太空建数据中心	人工智能算力需求似乎永无止境，数据中心创业者将目光投向了星空。然而，一个关键问题摆在面前：目前没有足够的火箭将数据中心送入地球轨道，而且发射成本也过于昂贵。	TechCrunch AI	09:30
7 回敬 Codex，Claude Code 推出 /goal 功能，不干完不睡觉	设定好条件，不达目的就不停。	AGI Hunt	09:01
7 ICLR 2026 Oral｜大模型总爱「想太多」？ DECS从源头消除冗余思考，实现推理token减半且性能不降反升	高效推理的真正瓶颈并非模型的能力边界，而在于训练目标的精妙设计。	机器之心	09:00
7 Claude Code 推出 Agent View 功能，一键管理所有会话	一个屏幕管理所有后台 AI 会话，随时派发任务、就地回复、随时进出。	AGI Hunt	08:00
7 ICML 2026 \| 大模型内部也会长出「情绪树」，规模越大越懂人心	当大模型开始「读懂情绪」：LLM中情绪结构的涌现	机器之心	07:59
7 光卖模型不够了！OpenAI联合19家顶级投资、咨询、系统公司成立专门公司帮企业落地AI	↑阅读之前记得关注+星标⭐️，😄，每天才能第一时间接收到更新 OpenAI要亲自下场帮企业部署AI了，还带来150名工程师 OpenAI宣布成立OpenAI Deployment Company（部署公司），专门帮助各类组织在…	AI寒武纪	07:02
7 WildClawBench：一个用于真实世界、长周期智能体评估的基准	大型语言模型和视觉语言模型越来越多地驱动通过命令行接口（CLI）框架代替用户行动的智能体。然而，大多数智能体基准仍然依赖于合成……	ArXiv	17:49
7 RUBEN：基于规则的检索增强大语言模型系统解释方法	本文展示了RUBEN，这是一个交互式工具，用于在数据驱动应用中发现最小规则，以解释检索增强大语言模型的输出。我们利用……	ArXiv	17:10

6 算力账单暴涨！你给OpenAI花的钱，全成了三星SK海力士的年终奖	英伟达副总裁承认AI算力账单远超过员工工资	新智元	16:55
6 再见百度，我用 1 小时，开发了个 AI 搜索引擎！Codex + GPT 5.5 + DeepSeek V4 真香~	Codex + GPT-5.5 + DeepSeek V4 实战：手把手带你开发一个 AI 搜索引擎	程序员鱼皮	15:53
6 GM刚刚裁员数百名IT员工，转而聘请具有更强AI技能的人才	部分职位专注于AI原生开发、数据工程与分析、基于云的工程、代理和模型开发，以及提示工程和新的AI工作流程。	TechCrunch AI	09:30
6 一个框架，重塑具身研发流程：Dexbotic走向具身PyTorch	原力灵机Dexbotic打通VLA模型进化最后1公里	机器之心	09:00
6 融资超亿元、割草机器人公司拿下数亿订单，瞄准庭院具身终端丨早起看早期	庭院场景的未来形态，是一个由具身终端驱动的生态系统。	36氪	08:17
6 掩码生成式变换器（Transformer）：图像编辑所需的解决方案	扩散模型主导着图像编辑领域，然而其全局去噪机制会将编辑区域与周围上下文混杂在一起，导致修改蔓延到本应保持不变的区域...	ArXiv	17:05
6 探索视听大语言模型中的跨模态信息枢纽	视听大语言模型（AVLLMs）作为一种能够对音频、视觉和文本模态进行联合推理的强大架构，近年来备受关注。在AVLLMs中，双向的...	ArXiv	16:34
6 OpenAI 的 WebRTC 问题	HN 507 点 · 148 条评论 · https://moq.dev/blog/webrtc-is-the-problem/	Hacker News	17:11
5 我在央媒的分享：上下文即一切	AI 的能力、问题和用法，本质都由上下文决定	赛博禅心	14:40
5 Markdown要凉…卡帕西也站HTML了	刚学会MD，又死了？？？	量子位	11:54
5 大厂让程序员卷 AI，4 个月烧掉全年预算，CTO 懵了	当好用变成一种负债	硅星人Pro	10:35
5 对话小宿科技：搜索比推理便宜10倍，但90%的人不知道	Token怎么花才不冤枉	硅星人Pro	10:35
5 分享5个Claude Code + 飞书的超实用Agent办公玩法。	机器人都能自己对账了	数字生命卡兹克	10:08
5 rohitg00/agentmemory	⭐ 今日 400 颗星 · 共 3,129 颗 · #1 基于真实世界基准测试的 AI 编程代理持久化记忆	GitHub Trending	09:30
5 NousResearch/hermes-agent	⭐ 今日新增 2,065 颗星 · 总计 145,865 颗星 · 与您共同成长的智能助手	GitHub Trending	09:30
5 rasbt/LLMs-from-scratch	⭐ 今日新增 337 颗星 · 总计 93,312 颗星 · 从零开始，一步步用 PyTorch 实现类似 ChatGPT 的大语言模型	GitHub Trending	09:30
5 AUTOMATIC1111/stable-diffusion-webui	⭐ 今日新增 39 颗星 · 总计 162,981 颗星 · Stable Diffusion 网页界面	GitHub Trending	09:30
5 Lordog/dive-into-llms	⭐ 今日新增 189 颗星 · 总计 36,409 颗星 · 《动手学大模型Dive into LLMs》系列编程实践教程	GitHub Trending	09:30
5 millionco/react-doctor	⭐ 今日 212 颗星 · 总计 8,356 颗星 · 你的智能体写的 React 很糟糕，这个工具能帮你发现它	GitHub Trending	09:30
5 tinyhumansai/openhuman	⭐ 今日366颗星 · 共计1,892颗星 · 您的个人AI超级智能。私密、简洁且极其强大。	GitHub Trending	09:30
5 decolua/9router	⭐ 今日149颗星 · 总计4,581颗 · 🆓 无限免费AI编程。通过40+提供商将Claude Code、Codex、Cursor、Cline、Copilot、Antigravity连接到免费的Claude/GPT/Gemini。自动回…	GitHub Trending	09:30
5 yikart/AiToEarn	⭐ 今日新增427颗星 · 总计11,387颗 · 让我们用AI来赚钱吧！	GitHub Trending	09:30
5 在金融领域应用先进人工智能技术	在长期以来以精准和管控为特征的财务部门中，人工智能的到来与其说是一次有序的升级，不如说是一场悄然的变革。员工已经在使用它，而管理层则在事后匆忙建立结构、治理框架和战略。结果是一个悖论：在	MIT Technology Review	09:30
5 通过客户反向工程推动突破性AI创新	尽管数字化已经进行了多年，但根据麦肯锡的研究，企业从数字化投资中获得的价值不到预期的三分之一。这是因为大多数大公司都是从技术能力开始，然后将应用附加到这些能力上，而不是从客户需求开始。	MIT Technology Review	09:30
5 诺贝尔奖得主经济学家眼中值得关注的三大AI趋势	本文最初发表于我们的每周AI通讯《The Algorithm》。如需第一时间获取此类文章，请点击此处订阅。2024年获得诺贝尔经济学奖的几个月前，达龙·阿西莫格鲁（Daron Acemoglu）发表了一篇论文，这篇论文并未为他在硅谷赢得多少…	MIT Technology Review	09:30
5 Digg 再次尝试转型，这次成为AI新闻聚合器	在给测试用户的邮件中，该公司表示网站的目标是「追踪某个领域最具影响力的声音」，并筛选出真正值得「关注」的新闻。	TechCrunch AI	09:30
5 「Thinking Machines 希望打造一个能在对话时真正倾听的 AI」	「目前，你用过的所有 AI 模型都以同样的方式工作：你说话，它倾听；它回应，你倾听。Thinking Machines 正在尝试改变这一点，他们正在构建一个能同时处理你的输入并生成回复的模型，使其更像是一通电话，而不是一条条短信的来回传递。…	TechCrunch AI	09:30
5 AI时代，“一人千军万马”或“一将怂全窝怂”	极致的透明，让无能再无藏身之所	虎嗅APP	08:43
5 早报 \| 特朗普称与伊朗停火协议已“岌岌可危”；快手可灵被传分拆；美股存储芯片光通信继续暴涨；宗馥莉罢免销售负责人	山姆回应南京欠租887万元	虎嗅APP	08:43
5 这种局面，是二战之后的第一次	由企业主导科研，让人看到了希望	虎嗅APP	08:43
5 微信状态灰测「访客记录」/快手计划分拆可灵AI/360向全体员工发放1亿Token	· 曝 AMD 下代 CPU 将使用三星 2nm 打造 · 开发者让 Codex 自己去赚钱，22 小时赚回 16 刀遭群嘲 · 软银宣布量产大规模电池，目标年产 1GWh 供 AI 数据中心使用	APPSO	08:34
5 8点1氪：美国总统特朗普：非常期待中国之行；OPPO发布母亲节文案事件问责通告；快手计划分拆可灵AI，融资20亿美元	美国总统特朗普在其社交媒体“真实社交”发文表示，非常期待即将开启的中国之行，并称中国是“一个令人惊叹的国家”。	36氪	08:17
5 事后分析：TanStack NPM 供应链攻击事件	Hacker News 838分 · 324条评论 · https://tanstack.com/blog/npm-supply-chain-compromise-postmortem	Hacker News	21:08
5 MDrive：面向端到端多智能体系统的闭环协作驾驶基准测试	车联万物（V2X）通信已成为自动驾驶领域一个前景广阔的范式，它使网联智能体能够共享互补的感知信息并相互协商……	ArXiv	17:44
5 V4FinBench：针对企业破产预测任务，对表格基础模型、大语言模型及标准方法进行基准测试	企业破产预测是一项高风险的金融任务，其特点是存在严重的类别不平衡和多预测周期的需求。目前支持该任务的公开数据集仍然稀缺且规模较小：...	ArXiv	17:38
5 AssayBench：面向大语言模型和智能体的检测级虚拟细胞基准	机器学习和大规模生物数据收集的最新进展重新燃起了构建虚拟细胞的前景——一种可加速[研究进程的]细胞行为计算模型。尽管人们对此兴趣浓厚，但目前仍缺乏一个标准化的基准，用于系统地评估大语言模型和智能体在理解检测（assay）层面细胞表型方面的能…	ArXiv	17:27
5 Gmail注册现在需要扫描二维码并发送短信	HN 596分 · 464条评论 · https://discuss.privacyguides.net/t/google-account-registration-now-requires-sending-an-sms-via-phone…	Hacker News	07:26
5 「Mythos 发现一个 curl 漏洞」	「HN 646 分 · 265 条评论 · https://daniel.haxx.se/blog/2026/05/11/mythos-finds-a-curl-vulnerability/」	Hacker News	06:39

4 做AI漫剧的、搞Agent的、投硅谷的，5.20这些赛道顶流碰头了｜最新嘉宾阵容	@所有人，马上AI起来！5月20日见 ~	量子位	11:54
4 OpenClaw低调更新重磅版本，龙虾长手长脚了	输入文字、按快捷键、滚动拖拽都能干	量子位	11:54
4 现有AI都是假实时！Thinking Machines发布交互模型，离真正的贾维斯真的近了	↑阅读之前记得关注+星标⭐️，😄，每天才能第一时间接收到更新 Thinking Machines 发了一个新的交互模型，切入了一个更根本的问题：我们与 AI 交互的方式。它能够同时进行聆听、观察、说话、被打断、作出反应、在后台…	AI寒武纪	10:30
4 估值200亿美元！可灵AI被曝剥离快手单独融资	快手要拆出第二个“快手”了	量子位	09:19
4 翁荔创业大模型首秀！告别“120亿美元估值0模型”	再造一个Her，AI边听边想边做告别回合制	量子位	09:19
3 Markdown 已死，HTML 当立？	想要什么格式就什么格式	APPSO	14:00
3 量子位编辑作者招聘	3个岗位（含实习），不设边界	量子位	11:54
3 乘AI热潮，Robinhood筹备旗下第二支风险基金IPO	Robinhood已秘密提交其第二支风险基金的IPO申请，该基金此次将目光投向成长期及早期初创企业。	TechCrunch AI	09:30
3 「养虾人」自述：我为什么卸载龙虾？	OpenClaw现状：高成本、高风险、低产出。	36氪	08:17
3 今天，OpenAI杀疯了！砸40亿美元成立新公司、还祭出网络防御利器Daybreak	从部署业务到网络安全。	机器之心	07:59
3 炸裂！AI大模型彻底爆了！！	大家都在说行业寒冬，降薪裁员不断…… 但为什么还有人薪资翻倍、 Offer拿到手软？！👇🏻 DeepSeek 开出百万年薪抢大模型工程师；腾讯、字节大模型岗位涨幅普遍超过30% 各大厂开放招聘技术岗， 80%与AI相关 …… …	AI寒武纪	06:00
1 英国最铁腕的禁烟法案，输给了一支小熊软糖味的电子烟	在让下一代彻底戒烟的战斗中，英国政府带头发起了冲锋。	36氪	08:17

📱 微信公众号文章汇总