MCP-Flow 提出全自动 pipeline,从 6 个 MCP 市场自动抓取服务器配置,通过 Slot-Fill Revision + WizardLM Evolution 两阶段数据增强,产出 68733 对 instruction-function call(1166 服务器、11536 工具)。实验表明:GPT-4o 在 10 工具场景下 AST 仅 58.8%,100 工具时 Groq-8B AST 跌至 3%;而 MCP-Flow-Qwen3-0.6B 在同场景下 AST 达 81.2%,全面超越所有大模型。用 MCP-Flow 做 RAG 检索增强后,GPT-4o 在 GAIA 任务上成功率 +17%,步数减少 32%。
全部 AI 信息索引
这里保留全部经过展示层清洗和去重后的条目。搜索适合精确查找,频道适合日常浏览。
Greg Brockman 分享了一个 Codex Skill,可以对创业想法进行压力测试。用户只需输入创业想法,Codex 会自动找到核心假设、暴露致命缺陷、检查问题是否真实存在,并给出坦诚的批判性评估。这个 Skill 解决了一个常见痛点:大多数创业想法听起来都不错,但缺乏系统性的验证机制。对于独立开发者、天使投资人以及正在构思 MVP 的创业者,这个工具提供了一个低成本的初期验证手段,可以快速筛选出想法中的致命漏洞。
Google推出的首个原生多模态嵌入模型,支持视频分析、视觉购物助手等多种应用场景,已向公众开放使用。
Pete Yang 与前 Tinder CPO Ravi Mehta 合作,提出构建有用 AI 产品的3层 context 系统:Functional 层(应用做什么)、Visual 层(应用长什么样)和 Context 层(当前交互上下文)。Pete 指出目前 AI 使用中最常见的错误是不主动管理 context——模型无法有效利用历史信息,导致输出质量下降。这套3层框架可帮助产品经理和开发者系统性地设计 AI 产品的信息架构,避免常见的信息流混乱问题,是一个可复用的产品方法论。
Peter Steinberger 转发 OpenClaw 2026.5.2 发布,重点是修复 npm 安装依赖与速度问题,让插件安装和更新更稳定,并把大部分能力迁入 extensions 以降低包体负担。发布同时提到 Gateway 与 agent hot path 精简,以及 Discord、Slack、Telegram、WhatsApp、TTS、Realtime、web search 等集成修复。
独立开发者 Tibo 复盘5款AI产品做到100万美金/月 快速验证快速失败是核心
华尔街日报对 OpenAI CFO Sarah Friar 的深度专访。知情人士透露,Friar 私下建议将 OpenAI IPO 推迟至 2027 年,以避免在 Anthropic 之前匆忙上市导致估值受损。她帮助维持了 OpenAI 与微软的关键合作关系,并正在管理 Sam Altman 的雄心与公司实际发展节奏之间的平衡。报道指出 OpenAI 正处于 11 年历史上最关键的发展阶段,走得太快可能透支业务,太慢则可能被 Anthropic 抢先。
马斯克对 OpenAI 的诉讼在首周审理中遭遇波折。据彭博社报道,庭审过程中出现多个不利信号。这起备受关注的案件被视为 AI 行业治理走向的风向标,涉及 OpenAI 从非营利向营利转型的合法性、创始团队的信义义务等核心问题。案件的走向将对整个 AI 行业的公司治理结构产生深远影响。
串串狗小刊发布的一篇从 Claude Code 迁移到 Codex 的实践指南。文章对比了两个 AI 编程工具在日常使用中的差异,包括上下文管理、工具调用方式、权限模型等方面的区别,并分享了作者在实际项目中完成迁移的经验和踩坑记录。对于同时使用或考虑切换 AI 编程工具的开发者有直接参考价值。(原文抓取失败,基于 RSS 元数据提取)
据 The Information 报道,Anthropic 正在与英国 SRAM 基 AI 芯片初创公司 Fractile 进行早期洽谈,计划在 2027 年 Fractile 产品上市后采购其推理芯片。随着 Anthropic 销售额爆发式增长,现有服务器供应(来自 Google、Amazon、Nvidia)已面临压力。此举反映了 AI 公司正在积极多元化芯片供应链,以应对日益增长的推理算力需求。Fractile 的 SRAM 基方案代表了一种不同于传统 GPU 的推理加速路径。
吴恩达(Andrew Ng)指出2026年的 Prompt 技巧与2022年 ChatGPT 刚发布时已截然不同。他新推出课程「AI Prompting for Everyone」,旨在帮助各种技能水平的用户成为AI power user。课程覆盖跨 ChatGPT、Gemini、Claude 等主流模型的通用 Prompt 技巧,强调如何针对不同模型特性优化 Prompt 策略。对于想系统提升 AI 使用效率的读者,这门跨模型的通用方法论比单一工具教程更有长期价值。
xAI 发布 Grok 4.3 模型,主打"常驻推理"(always-on reasoning)能力,具备 100 万 token 上下文窗口,API 定价仅为 Grok 4.20 的 60%(输入 $1.25/百万token,输出 $2.50/百万token)。在 Artificial Analysis Intelligence Index 上比 Grok 4.20 提升 4 分,以 500B 参数超越 Claude Sonnet 4.6。同时发布 Custom Voices 语音克隆套件,仅需 1 分钟语音样本即可生成可用的语音克隆。xAI 工程师表示更大规模的模型正在训练中。
使用GPT-5.5和Image Gen构建项目,每周选出2-3个最佳项目赢得免费DevDay 2026门票,提供实践AI前沿技术的机会。
Meta 收购了 Assured Robot Intelligence(ARI),一家专注于为机器人开发 AI 模型的初创公司。ARI 团队将加入 Meta 超级智能实验室(MSL),与 Lerrel Pinto、Xiaolong Wang 等共同推进人形机器人智能。ARI 联合创始人表示,目标是将"能思考和说话的 AI"转变为"能行动的 AI",在物理世界中安全可靠地协助人类。此举是 Meta 在裁员 8000 人的同时加码物理 AI 和人形机器人赛道的重要布局。
Introducing Koog Integration for Spring AI: Smarter Orchestration for Your Agents 英文原文 Introducing Koog Integration for Spring AI: Smarter Orchestration for Your Agents > 作者: @jetbrains > 发布时间: 2026-04-16 > 原文链接: --- ## JetBrains AI Supercharge your tools with AI-powered features inside many JetBrains products Follow - Follow: - _RSS_ RSS Explore More # Introducing Koog Integr...
调研时间:2026-04-12 > 耗时:约 15 分钟 > 类型:对比分析(开源 Android AI Phone Agent) DroidClaw 和 Open-AutoGLM 是 2025-2026 年两个最具代表性的开源 Android AI Phone Agent 项目,均通过「感知屏幕 → LLM 推理 → ADB 执行」的循环实现手机自动化. 但二者在架构哲学、感知方式、模型策略、生态定位上差异显著:DroidClaw 走「轻量实用主义」路线——Bun/TypeScript、accessibility tree 为主、任意 LLM、旧机复用;O
调研时间: 2026-04-16 调研人: AI 助理(Subagent) 主题分类: AI 开发工具 / Claude Code 生态 --- Claude Code 已成为当前 AI 辅助编程的事实标准,而其真正的威力取决于周边工具链的搭配质量. 本次调研覆盖 9 款 GitHub 上与 Claude Code 强相关的工具与插件,按功能分为知识增强、技能增强、自动化设计三类. 核心结论:Superpowers 和 GSD 是本次评测中唯二达到"必装"标准的工具——前者重塑了软件工程的纪律与方法论,后者用原子化 subagent 执行模型根治了长会话
与此同时,Anthropic 的年经常性收入刚突破 300 亿美元,是去年 12 月的三倍. 华尔街已经开始紧张了,WSJ 说投资者对传统 SaaS 公司的股价越来越谨慎,担心 Anthropic 这类产品会让一些传统软件服务变得多余. 和你已经在用的 Claude Code 有什么区别. 如果你用过 Claude Code,你知道 AI 智能体怎么工作:你给它一个任务,它自己规划步骤、调用工具、写代码、改文件,一步步把事做完. Claude Code 跑在你自己的电脑上,是给开发者个人用的命令行工具. Managed Agents 跑在 Anthropic 的云上,是给企业用的 API 服务
com/s/x_FUUG4wBUqYs1H5DUtpgQ 作者: 夜天之书(tison) 本文结合作者 Agentic Coding 的实践经验,深入讨论当前 LLM Coding Agent 的能力边界与局限性. 文章指出:LLM 能够生成"疑似正确"的方案,但到"经得起考验的产品"之间存在 AI 无法覆盖的鸿沟. 当前 LLM 的核心动作是对现有知识的搜索和组合,这推理出两个重要现象: 现状代码多为浆糊(Big Ball of Mud):现实中程序员倾向于就地打补丁,导致 AI 训练的语料本身就充满问题代码. AI 容易生成"似是而非"的并发代码,因为能找到的并发代码语料本身就存在
Source: Gary Marcus | 2026-04-23 URL: com/p/please-dont-trust-your-chatbot-for > 注:原文抓取失败,此内容基于 RSS 摘要整理. Gary Marcus compiles four new studies warning against LLM medical advice. BMJ: nearly 50% of chatbot responses on cancer/vaccines/nutrition had serious problems, delivered wi
Source: Sean Goedecke | 2026-04-23 URL: com/luddites-and-ai-datacenters/ > 注:原文抓取失败,此内容基于 RSS 摘要整理. Sean Goedecke's detailed analysis of historical Luddism based on multiple historical texts. Real Luddites were skilled craftspeople (7-year apprenticeships) whose trade was being
坚持深耕技术领域的 T 型前端程序员, 关注独立开发与 AI,喜欢 Vuejs、Nestjs, 还会点 Python、搜索引擎、NLP、Web3、后端 --- > ✨文章摘要(AI生成) 本文以一个 15,400 tokens 的登录 Bug 修复场
标签打好,结构理清,交叉链接也做了 两个月后标签过时了没人改,断链了没人修. 新笔记往里一扔就不管了 再过两个月打开一看,一堆垃圾 然后重建. 所有人的第二大脑都是这么死的:维护太累了,累到比写笔记本身还累 但有少数人已经跳出这个循环了. 他们的知识库是复利的:每天都在变厚,喂给 AI 的上下文每天都在变好,输出质量每天都在拉开差距 他们用的方法来自 Karpathy. 就是那个 OpenAI 创始团队、前 Tesla AI 总监的 Karpathy. 这条推文几天跑了几千万曝光 核心思路一句话:让 Claude Code 替你维护 Wiki 我花了几天把围绕这套方法的内容翻了个遍. 怎么安装
BUT there's a level most people are missing. 3 million views on Ole Lehmann's article alone. - thousands of people running it to make real decisions. - the idea is genuinely brilliant: > instead of asking one AI a question and trusting whatever comes back, you force multiple perspectives to argue, r
com/langchain-ai/agents-from-scratch 官方文档: com/langchain-ai/agents-from-scratch 该仓库是一个"从零构建 Agent"的实战指南,以构建一个 Gmail 接入的"环境感知"(ambient)邮件助手为最终目标. 分为 4 个章节,每章配有 Jupyter Notebook 和对应的 src/email_assistant 目录代码. 从 Agent 基础开始,逐步递进到 Agent 评估、人在回路(Human-in-the-Loop),最终到记忆系统,最终组合成一个可部署的 Age
备注:原文抓取自 GitHub(iamzhihuix/skills-manage),README 全文保存于此. > 原文链接: com/iamzhihuix/skills-manage > 作者:iamzhihuix > 发表时间:2026-04-21 > 抓取时间:2026-04-22 --- (全文见 Obsidian 本地备份:`Cubox/iamzhihuix-skills-manage- Desktop app to manage AI coding agent skills across Claude Code, Cursor, G
Source: geohot | 2026-04-22 URL: io/blog/jekyll/update/2026/04/22/ai-has-no-moat. html geohot 撰文称「AI 没有护城河」. 核心论点:Cursor 60B 估值收购是因为 FOMO,实际没人真正用;opencode 确实是最好的 coding agent 但写一个类似的并不难;真正的壁垒在模型,但模型折旧极快,开源已有详细训练指南. 1)的 10 倍,但能力差距只有约 6 个月. 判断「AGI singularity」是硅谷特有狂热,中国 AI 是正常指数增长曲线,AI
《Harness Engineering——Claude Code 设计指南》:不是源码注释汇编,也不是产品功能介绍. 它关注的是 Claude Code 如何把不稳定模 型收束进可持续运行的工程秩序,让控制面、主循环、工具权限、上下文治理、恢复路 径、多代理验证与团队制度长成一套完整骨架 《Claude Code 和 Codex 的 Harness 设计哲学——殊途同归,还是各表一枝》:比较两套 AI coding harness,最容易犯的错误,是拿一张功能对照表当作思想史. 左边写“有技能”,右边也写“有技能”;左边写“有沙箱”,右边也写“有沙箱”;左边写“能开子代理”,右边也写“能开子
GitHub: com/chenhg5/cc-connect Stars: 6424 (截至 2026-04-27) License: MIT cc-connect bridges AI agents running on your machine to the messaging platforms you already use. Code review, research, automation, data analysis — anything an AI agent can do, now accessible from your phone, tab
Claude blog: Usage patterns and customer examples - Engineering blog: The design of Claude Managed Agents - Docs: Onboarding, quickstart, overview of the CLI and SKDs Why Claude Managed Agents The Claude messages API is a direct gateway to the model: it accepts messages and returns content blocks
GitHub: com/freestylefly/awesome-gpt-image-2 Stars: 1235 (截至 2026-04-27) License: MIT GPT-Image2 全量开放后,AI 画图从"能不能出图"变成了"能不能稳定、可控、可复用地出图". 这个项目做的不是单纯收集提示词,而是把零散案例逆向整理成一套更适合 Agent 和自动化工作流调用的 Prompt-as-Code 资产. 核心目标:把"散文式提示词"压缩成"结构化协议". - 🧱 原子化 Schema:把主体、光影、材质、排版等视觉要素拆成可组合组件 - ⚙️ 工作流友好
发布时间: 2026-04-11T17:35:03. 000Z > 原文链接: com/i/article/2043007411804651520 --- . [Image ](/chrysb/article/2043020014035570784/media/2043017369812189184) Why long-term memory for LLMs remains unsolved . jpg) Chrys Bader @chrysb
The dream is: the model remembers what you said before and draws meaning across it over time. Not just recall, but interpretation, narrative, the kind of memory that makes a conversation feel continuous and cumulative across months or years. Today, you can achieve an illusion of this dream. For days
Source: Simon Willison | 2026-04-22 URL: net/2026/Apr/22/qwen36-27b/ Qwen 发布 3. 6 系列首款旗舰级编程密集模型 Qwen3. 6-27B,27B 参数达到旗舰级代码能力. Simon Willison 分析:这是开源模型在代码能力上的重要里程碑,采用密集架构而非 MoE,在较小参数量下实现高代码性能,对本地部署友好. 7 之后,第三个接近旗舰水平的开放权重模型,且 27B 规模首次使旗舰级代码能力可以在消费级硬件上运行. 开源与闭源代码能力差距已收窄至约 6 个月. 6
11816 - 发表时间: 2026-01-16 - 主题: Agentic AI / 企业自动化 / 治理框架 --- 企业后台工作流(如应付账款、合同审查)要求 AI 系统必须满足:可审计(full execution traces)、策略对齐(policy-aligned)、操作可预测(operationally predictable)、副作用可管控. 这些需求通用型 multi-agent 系统往往无法满足. 本文要解决的核心问题是:如何在保持 agent 灵活性的同时,为企业级 agentic AI 添加可验证的治理能力. --- 不是让 LLM 自由生成执行路径,
com/camel-ai/owl/blob/main/README_zh. md OWL(Optimized Workforce Learning)是 CAMEL-AI 推出的前沿多智能体协作框架,旨在通过动态智能体交互实现跨多领域的任务自动化. - 多搜索引擎支持:维基百科、Google、DuckDuckGo、百度、博查等实时信息检索 - 多模态处理:支持视频、图片、语音处理 - 浏览器操作:基于 Playwright 的页面滚动、点击、输入、下载、历史回退 - 文件解析:Word、Excel、PDF、PowerPoint 内容提取 - 代码执行:Py
发布时间: 2026-04-21 > 作者: Industry Analysis --- 摘要 / Summary: MCP(Model Context Protocol)正在成为 2026 年 AI 工具互操作性的通用连接器,被誉为'AI 工具的 USB 标准'. 作为 Anthropic 开发的 JSON-RPC 客户端-服务器接口,MCP 支持类型化数据交换,旨在成为 AI 工具的通用连接器. 截至 2026 年初,已有 200 多个服务器实现,支持 GitHub、Slack、Google Drive、Salesforce 等常见服务. 获得 Anthropic、OpenAI
发布时间: 2026-04-23 > 作者: LangChain Team --- 摘要 / Summary: LangGraph 2026 年基于有向图架构,超越了传统的 DAG,支持循环、回溯和自适应行为. 核心功能包括:状态编排(Stateful Orchestration)、增强控制与调试(时间旅行调试、检查点)、人机循环支持(Human-in-the-Loop)、LangChain 互操作性、可观测性改进、防护栏节点(内容过滤、速率限制、合规记录)、持久化后端(MongoDB、PostgreSQL、DynamoDB). 0 版本预计 Q2 发布,聚焦 API 稳定性和类型
备注:原文抓取自微信公众号(lancelotluo),全文保存于此. com/s/VJgVPeJ5GZhVwbRtneEk_Q > 作者:lancelotluo > 发表时间:2026-04-21 > 抓取时间:2026-04-22 --- (全文见 Obsidian 本地备份:`Cubox/Harness Engineering:AI 能在真正-出事会炸-的后端系统里写代码吗
质量评分:5 来源: com/GoogleAI/status/2044447638511383024 抓取时间: 2026-04-18 --- 原文: > Today we launched Gemini 3. 1 Flash TTS, our most expressive and controllable text-to-speech model yet. This launch includes audio tags. 🗣🏷 Audio
Source: Giles Thomas | 2026-04-23 URL: com/2026/04/llm-from-scratch-32m-interventions-conclusion Giles Thomas 在自己训练 GPT-2 规模模型(163M 参数,44 小时本地训练)过程中系统性测试了多种干预手段. 按效果排序:学习率调整(最大收益)+ 调度;Weight decay(有效);QKV bias(微小帮助);Gradient clipping(效果有限);PyTorch AMP(训练速度翻倍但 loss 轻微变差);Weight tying(反而让
质量评分:5 来源: com/karpathy/status/2040572272944324650 抓取时间: 2026-04-18 --- 原文: > Farzapedia, personal wikipedia of Farza, good example following my Wiki LLM tweet. I really like this approach to personalization in a number of
中文文章: ``markdown 正文段落1. ` 英文文章(双语): `markdown Original paragraph 1. `` 由 AAIF Content Fetcher cron 任务自动抓取和翻译,无需手动维护
Source: Simon Willison | 2026-04-22 URL: net/2026/Apr/22/claude-code-confusion/ > 注:原文抓取失败,此内容基于 RSS 摘要整理. Anthropic quietly moved Claude Code from the $20/month Pro plan to the $100/month Max plan on claude. com/pricing, sparking outrage across Reddit/HN/Twitter. An Anthropic
发布时间: 2026-04-24 > 作者: Anthropic Team --- 摘要 / Summary: Claude Code 在 2026 年迎来重大更新,第一季度发布了多个重要功能:Remote Control(远程控制)、Dispatch(后台工作流)、Channels(频道)、Computer Use(计算机控制)、Auto Mode(自动模式)和 AutoDream. Sonnet 5 "Fennec" 作为 Claude 5 代的第一个模型,拥有 100 万 token 上下文窗口,并引入 Dev Team 多智能体协作模式. 界面重新设计集成了终端、文件编辑、
Source: Simon Willison | 2026-04-21 URL: net/2026/Apr/21/gpt-image-2/ OpenAI 发布 ChatGPT Images 2. 0,Sam Altman 称从 gpt-image-1 到 2 是巨大飞跃. Simon Willison 测试发现:细节还原很好但文字渲染仍有错误;让模型找自己生成的 raccoon 并画红圈,模型答错了自己在图里画的内容——说明多模态模型的自我验证能力仍存在明显漏洞. 这类 Where's Waldo 风格测试暴露了当前图像生成+视觉推理 pipeli
质量评分:4 来源: com/AnthropicAI/status/2044493337835802948 抓取时间: 2026-04-18 --- 原文: > Research we co-authored on subliminal learning—how LLMs can pass on traits like preferences or misalignment through hidden signals in data—
质量评分:4 来源: com/alliekmiller/status/1985834763677286606 抓取时间: 2026-04-18 --- 原文: > There's a difference between using AI and building with it. Copy-pasting ChatGPT prompts will only get you so far. I want to help you lea
The “best” way to build agentic systems has changed dramatically over the past three years. When ChatGPT came out, all you could do were simple RAG chains (LangChain). Then the models got a little better, and could create more complex flows (LangGraph). Then they got a lot better, and that gave rise
AIOS 是目前学术界最完整的 LLM Agent 操作系统原型,其核心设计将 LLM 实例抽象为"CPU 核心",通过系统调用层为上层 Agent 应用提供统一的调度、内存、存储、工具和访问控制服务. AIOS 已发表 8 篇论文,被 COLM 2025、ICLR 2025、NAACL 2025 收录,GitHub 获 5,387 星. 但 AIOS 是纯用户态 Python 实现,运行在 FastAPI 之上,并未触及真正的操作系统内核层. 与此同时,Android 平台正从"操作系统"向"智能系统"演进——Google 的 AICore/AppFunctions、三星的多 Age
Cook | 2026-04-21 URL: com/blog/2026/04/21/an-ai-odyssey-part-4-astounding-coding-agents/ John D. Cook 分享从 2025 年 8 月至今使用 OpenAI Codex 的完整经验:主观感受从「帮我处理约 20% 编码工作量」提升到「现在约 60%」,模型对代码库偏僻位置的上下文理解显著增强. 但持续存在的问题包括:需要引导才能找到问题所在;容易只见树木不见森林,看不到高层错误;会过度优化测试用例而非实际功能;生成代码有时与现有代码概念不一致. 核心判断:AI 编码工具
"Content Fetch Summary" date: "2026-04-12" --- - 抓取:0/5 篇成功 - 失败:5 篇 - 累计有全文:97 篇/608 篇 - Dr. MAMR:解决多智能体 LLM 推理中的惰性智能体问题 - 迈向AI智能体可靠性科学 - Agentic Code Reasoning - Android 17 DeliQueue:二十年来最重要的消息队列架构重写 - Running Slice 全栈分析手册
发布时间: 2026-04-22 > 作者: Industry Analysis --- 摘要 / Summary: 2026 年标志着 AI 智能体从实验概念转向生产系统的关键转折点. Gartner 预测 40% 的企业应用将在 2026 年底嵌入特定任务 AI 智能体,远低于之前的 5%. 市场规模预计大幅增长,企业部署显示显著 ROI. 核心特征包括:感知与规划(解释非结构化输入,分解复杂目标)、工具使用(调用外部 API、数据库、其他智能体)、记忆模块(存储上下文和时间交互)、自主操作(持续的感觉-思考-行动循环)、解决高级问题. 架构组件包括 LLM(大脑)、记忆模块、
GitHub: com/TheRealSeanDonahoe/agents-md Stars: 525 (截至 2026-04-27) License: MIT One file. Every coding agent starts behaving like a senior engineer. Drop it into any repo. Claude Code, Codex, Cursor, Gemini CLI, Aider, Windsurf, Copilot, and Devin all read it on their own. | Before
安装: npm install -g @openai/codex oh-my-codex omx setup omx --madmax --high 相关命令: $deep-interview "澄清这次认证变更" $ralplan "批准认证方案并审查其中的权衡取舍" $ralph "把已批准的方案推进到最终完成" $team 3:executor "并行执行已批准的方案" 地址: co/jOF18QHycD | com/oragnes/status/2041876228949602347 |
cn/detail/8PXAgxTHuHoNUbkQGm4ZU 作者: Kyte(墨问) 文章结合作者近期的 AI 工具实践,探讨 AI 时代的变与不变,提出了一系列关于能力价值重构的洞察. 语言不只是表达工具,它同时是: - 组织经验的工具 - 抽象现实的工具 - 连接不同领域的通用接口 在 AI 时代,语言能力代表积累个人数据和调度外部智能的能力. 无论是描述问题、交代清楚上下文,把模糊的经验整理成可复用的技能、原则,这些工作的核心都对应语言能力. 引用:OpenAI 姚顺雨在 3 小时访谈中指出——「语言是一种人类发明的、帮助你解决任何问题的、有通用或者泛化性的工具. 」 AI 可以代劳
发表在 Science 上的哈佛研究显示,OpenAI 的 o1 推理模型在真实急诊场景中使用电子病历和护士简短描述进行诊断,正确率达到 67%,而分诊医生仅为 50-55%。在管理计划方面,AI 得分 89% 远超医生的 34%。研究者称这是"将重塑医学的深刻技术变革",但也强调 AI 应作为辅助工具而非替代医生,呼吁进行更大规模的前瞻性临床试验。论文同期被 NPR、Vox、CNET 等多家主流媒体广泛报道。
Karpathy 分享了一种高效利用 LLM 的方式——构建个人知识库(Knowledge Bases)。他指出,在 LLM Agent 时代,与其分享具体代码或应用,不如直接分享「创意文件」(Idea File),让 AI 帮你整理、检索和加工研究材料。这种方法将大量 token 消耗从代码操作转向知识操作,大幅提升信息消化效率。适合研究者、知识工作者和需要管理大量文献资料的人群。
OpenAI 总裁 Greg Brockman 亲自实测后发现,GPT-5.5 配合 GPT-Image-2 是目前应用开发的最强组合。这一组合被集成到 Build Web Apps 插件中,Codex 可以独立完成从设计到应用的完整流程。DKundel 详细拆解了为何这对组合如此高效——图像生成与代码生成的深度结合,让设计到落地的链路大幅缩短。对开发者而言,这是目前最值得尝试的 AI 开发工作流。
吴恩达系统性分析了 AI 原生工程团队与传统的根本区别。显性差异是 AI 原生团队用 Coding Agent 更快构建产品,隐性差异在于整个工作方式的重构——优秀工程师角色转变、团队协作模式更新等。他指出,很多传统工程思维在 AI 原生团队中不再适用。此条对想转型或理解 AI 原生开发的团队负责人极有价值。
三星电子 Q1 营业利润 57.2 万亿韩元(约 386 亿美元),创历史新高,半导体部门贡献 53.7 万亿韩元,利润率超 70%,超过英伟达和台积电同期。三星已签多年期约束性合同锁定产能,警告 2027 年存储芯片供需缺口将比 2026 年更大。AI 数据中心对 HBM 的需求是核心驱动力。
Sam Altman 发推透露 GPT-5.5 的发布时间选在了 5 月 5 日下午 5:55,并开放 Luma 报名链接邀请大家参加派对,Codex 会在回复中帮忙筛选参与者。GPT-5.5 在发布时机上展现了幽默感,也再次强调了其主打的 5.5 版本命名逻辑。对于关注 OpenAI 动态的开发者,这是个值得参与社区互动的机会。
Mistral 推出 Medium 3.5,特点是将指令跟随、推理和编程能力整合到单一 128B 稠密模型中,上下文窗口达 256k,推理 effort 可配置。在 SWE-Bench Verified 上取得 77.6% 的成绩,由 NVIDIA 官方推荐跑在 NVIDIA 平台上。此版本标志着稠密模型在保持易部署优势的同时,正在缩小与混合专家架构的能力差距,对需要本地部署或高效推理场景的团队值得关注。
DeepSeek 发布 V4 系列,包含 1.6 万亿参数的 V4-Pro 和 2840 亿参数的 V4-Flash,均支持 100 万 token 上下文窗口,MIT 开源。V4 发布前未向英伟达和 AMD 提供早期访问,而是提前数周让华为进行软件适配优化,这是大模型行业首次。API 缓存命中价格降至首发价的十分之一,V4-Pro 已成为 DeepSeek 内部 Agentic Coding 模型。
Gemini Embedding 2 正式GA,是首个将文本、图像、视频、音频和文档映射到统一语义空间的多模态嵌入模型。支持超过 100 种语言,单次调用可处理 8192 token 文本、6 张图像、120 秒视频、180 秒音频和 6 页 PDF。通过 task prefix 实现非对称检索,显著提升 Agentic RAG 和视觉搜索精度。法律平台 Harvey 借此 Recall@20 提升 3%,视觉搜索 Match@20 从 60% 提升至 87%。
AI代理可能取代GitHub的中心地位,代码获取方式从访问网站转为对话式,代码库越来越定制化。
欧盟成员国与欧洲议会经 12 小时谈判未能就 AI 法案修订达成一致。修订方案原计划推迟 2026 年 8 月的高风险系统合规期限、缩窄适用范围,并将 AI 义务与现有行业法规整合。主要分歧在于部分国家坚持已受行业安全法规约束的领域应豁免 AI 法案额外要求。5 月将是截止日期前的最后谈判窗口。
此前被报道为认知心理学突破的 AI 模型 Centaur,声称能在 160 项认知任务上模拟人类思维。但新研究发现其最大局限在于语言理解——能给出正确答案但无法识别问题背后的意图。数据拟合层面的表现不等于认知模拟能力,对"AI 已接近人类认知能力"的叙事提出了重要修正。
内容指出语义相似度等于向量在规模化时失效(语义坍塌),提出神经符号 AI 三层架构:Ontology 提供结构化知识表示、确定性层保证事实正确性、LLM 负责自然语言解释而非事实本身。斯坦福研究证明 naive vector-only RAG 在知识库超过临界规模后崩溃。该方法适合构建企业级知识问答系统,可显著提升准确率。
Peter Steinberger 发布 gogcli v0.14.0,一款命令行工具,可管理 Google 数据全套操作:本地加密 Git 备份、Gmail 和 Drive 可续传导出、Markdown Gmail 镜像、vCard 联系人导出、Slides 文本/模板编辑,以及 Auth 和 keyring 诊断。所有数据本地处理不过第三方,隐私安全,适合技术人员管理个人云数据。
Karpathy 在回顾 MenuGen 开发历程时指出:构建一个真正上线的 AI 应用,最难的部分从来不是模型或代码本身,而是需要像 IKEA 家具一样组装各种第三方服务的 DevOps 工作——支付网关、用户认证、数据库、安全防护、域名配置等。这些基础设施的拼装和调试占据了大量工程时间,往往比训练模型更让人「痛苦」。这提醒所有 AI 开发者:Demo 和产品之间隔着一整个 DevOps 世界,vibe coding 的快乐止步于本地运行。
Glean 推出 Waldo,首个 Agentic 搜索模型,基于 NVIDIA Nemotron 3 Nano 构建,专门针对搜索规划做后训练。Waldo 能自主分解查询、决定调用哪些工具、阅读哪些内容、何时停止并返回结果,实现真正代理式企业搜索。与传统 RAG 不同,Waldo 有主动规划能力,适合知识密集型企业场景。
华为预计 2026 年 AI 芯片营收约 120 亿美元,同比增长 60%。下一代昇腾 950PR 已进入量产,DeepSeek V4 发布后字节跳动、腾讯、阿里加速抢购。华为计划今年出货约 75 万颗 950PR。黄仁勋此前警告:如果 DeepSeek 新模型率先在华为芯片上全面适配,对美国在全球 AI 领域的战略地位将是灾难性打击。
OpenAI 与 AWS 联合宣布 GPT-5.5、Codex 编程代理及 Bedrock Managed Agents 进入有限预览。此前微软与 OpenAI 重签合作协议,取消 Azure 独家许可、废除 AGI 条款。GPT-5.4 已可调用,GPT-5.5 将在未来两周内上线。AWS 客户可通过现有 Bedrock API 调用 OpenAI 模型,复用统一的安全与治理框架。云计算 AI 模型市场从"独家绑定"转向"多平台分发"。
MCP(Model Context Protocol)2026 年 3 月 SDK 月下载量突破 9700 万次。该协议从 Anthropic 内部实验到 Linux 基金会 Agentic AI Foundation 托管仅用约 14 个月,速度超过任何已知开发者协议。文章提供生产级 MCP Agent 构建指南,涵盖服务器/客户端实现、安全策略和 2026 年路线图。
Anthropic 在发布 81,000 人用户调研后,进一步发布了关于这些用户「经济期望与担忧」的研究报告。这是 AI 领域迄今规模最大的定性用户调研之一,揭示了普通用户对 AI 经济影响的真实心态:既期待 AI 提升生产力和收入,又担忧职业替代和技能贬值。这份研究的价值在于:它为 AI 产品设计者、创业者和政策制定者提供了真实的用户心理画像,有助于构建更符合用户期待、更易被市场接受的 AI 产品。
该推文引述了一个正在发生的趋势:AI 图像生成模型(尤其是 2.0 版本)已经能够高度还原产品界面和视觉 mock,使得团队内部在讨论产品概念时,直接用 AI 生成图像替代传统的原型设计和 PPT 演示。内部产品 idea 的呈现和共创方式因此发生根本变化——不再依赖 Figma 或 Axure,而是让 AI 把想法「画出来」。这对产品经理、UX 设计师和创业者的工作流有直接启发:用好图像生成模型可以极大压缩创意验证周期。
Meta、谷歌、OpenAI 等大厂的顶级研究员持续离职创办 AI 初创公司。Dealroom 数据显示 2025 年初至今成立的 AI 初创公司已获得 188 亿美元风投资金。AI 行业的人才流动模式已从"大厂之间跳槽"升级为"大厂出走创业",大厂已成为 AI 人才的"培训基地"。
阿里发布 Qwen3.6-Max-Preview,在 SWE-Bench Pro、Terminal-Bench 2.0、SkillsBench、SciCode、QwenClawBench、QwenWebBench 六项 Agent 和编程基准测试中排名第一。输入价格 1.04 美元/百万 token,输出 6.24 美元/百万 token。但旗舰 Max 版本不再完全开源,阿里转向"小模型开源、旗舰闭源"的中间路线。
Hermes Agent 源码级解读,Self-Improving 机制揭露了 Agent 自进化设计的核心路径
微软与 OpenAI 宣布修改合作协议:IP 许可从独家改为非独家(延续至 2032 年);删除 AGI 限制性条款;收入分成机制重设。此前 2025 年 10 月重组中 OpenAI 取消利润上限并给予微软 27% 股权。这次修改为 OpenAI 接入 AWS 等其他云平台扫清法律障碍,标志着 AI 行业最核心的商业关系发生结构性变化。
上个月在公司里给产品和业务的小伙伴分享了下如何上手 AI Coding,加上最近又发了条推特,聊到不少同学因为订阅门槛没机会用上一线 AI Coding 工具,方法和习惯不花钱就能先学,索性把上手这部分整理出来。然后为了让内容给大伙更好理解,文章中绘制了不少简单插画,这样看起来应该更会直接。
最好的架构,是满足今日需求的最简架构,同时为明日进化保留路径。它不是一次性的完美设计,而是在应对真实业务挑战的过程中,一步步“逼”出来的。
前谷歌 DeepMind 顶级研究员为其初创公司 Ineffable Intelligence 完成 11 亿美元种子轮融资,创种子轮金额纪录。投资方包括英伟达和谷歌,目标是追求超级智能。Dealroom 数据显示 2026 年风投已向新成立的 AI 初创公司注入 188 亿美元,英伟达 2026 年已投资超过 36 家公司。
设计师 Sam Henri Gold 体验 Claude Design 后撰文:Figma 花十年构建的封闭设计系统,在 AI 智能体时代正变成负担。LLM 用代码训练,学不会 Figma 的专有格式,"单一事实来源"将回归代码。
AI Agent 公司 Avoca 完成 1.25 亿美元以上融资(种子轮+A轮+B轮),估值达 10 亿美元。Avoca 的 AI Agent 帮助物理服务企业(暖通空调、管道、屋顶等)处理来电和调度任务。两位创始人在 MIT 扑克之夜相识,最初追逐餐饮行业客户,却意外发现 HVAC 公司才是真正的痛点市场。Kleiner Perkins 等顶级 VC 参投。这标志着 AI Agent 在传统服务业的落地正在获得大规模资本认可。
她要为 Code with Claude 大会准备一场演讲,主题是 Claude Code 如何从助手走向完整的智能体。过去,这类工作通常意味着:翻 Slack、找发布记录、看内部案例、整理产品叙事、做幻灯片、对齐设计系统,再反复改稿。
com 发布日期:2026-04-27 现有代码评测基准(HumanEval、SWE-bench)几乎清一色面向 Python,无法覆盖 Android 开发的复杂性(Kotlin/Java 双语言、Jetpack Compose 与 View 体系并行、Gradle 构建配置、设备碎片化). Google 正式发布 Android Bench — 首个专门针对 Android 开发的 LLM 评测基准. - 任务来源:GitHub 上 500+ Star 的真实开源 Android 项目,从 38,989 个已合并的 PR 中精选 100 道题 - 任务类型:修复 Breaking Chan
Tibo 在 5 个 AI 产品上全部采用 bootstrap 路线,展示小团队如何用 AI 工具实现规模化。核心教训:创始人最大错误是不想犯错,比盈利更重要的是快速验证、快速失败。方法论:先验证想法再用钱买时间,而不是反过来。Peter Yang 播客详细拆解完整 playbook,包括 idea 验证、失败快的方法和 top 15 最佳实践。把 AI 工具和精益创业方法结合的真实案例,对独立开发者很有参考价值。
wacrawl 0.2.0 新增加密 Git 备份功能:wacrawl backup push 将 WhatsApp Desktop 存档用 age 加密分片写入 GitHub;wacrawl backup pull 解密、验证并本地恢复,支持跨设备同步。技术栈:age 加密 + Git 版本控制,数据主权完全在自己手里。开源工具,可自托管,备份历史永久可查。把个人数据备份这个硬需求用现代加密工具解决,数据主权完全自己掌控。
awesome-gpt-image-2 是目前最大的 GPT Image 2 提示词库,每日更新,汇集 1800+ 精选提示词并附带预览图,支持 16 种语言。GPT Image 2 的核心能力:精准文字渲染(中日英)、跨图一致性、商业级插画输出、故事板/IP 角色生成、多语言设计海报。同时提供 YouMind GPT Image 2 Prompts Gallery 在线画廊,支持分类浏览和 AI 一键生成。GitHub 2558 Stars。
IcyCat 开发了一款 Chrome 浏览器插件,为 X/Twitter 推文添加浏览量流速监控和 Markdown 一键复制功能。流速监控以简单方式计算推文的传播速度,Markdown 复制功能方便将推文内容直接发送给 AI 进行总结。插件已在 GitHub 开源,正等待 Chrome Web Store 审核。
Xcode-Build-Optimization-Agent-Skill 是一款帮助优化 Xcode 增量编译和干净构建的 Agent Skill,通过运行基准测试并调整构建设置来缩短编译时间。推荐 iOS 研发人员使用,可直接集成到编程代理的工作流中。GitHub 1001 Stars。
acpx(openclaw 出品的 agent 控制工具)发布 0.6.0 版本,带来多项实用更新:Claude system prompt 直接控制、session pruning(自动削减上下文)、embeddable turn handles(嵌入到自定义 UI)、--no-terminal 模式、persistent session 修复、WSL cwd 路径转换、queue 稳定性提升及更清晰的报错提示。对于日常使用 Claude/Codex 进行自动化任务的同学,session pruning 和 system prompt 控制是本次最值得关注的两个功能——前者避免上下文溢出,后者让你更精细地约束模型行为。已在 GitHub 开源,有需求的开发者值得关注。
郭宇(guoyu.eth)宣布开源并上线 wanman.ai,核心理念是让 AI Agents 团队帮助用户运营一人公司。两种工作模式:从故事目标自治运行(分析目标->规划任务->邀请AI员工->自动开会对齐->创意发散)和 GitHub 仓库接管(自动分析代码仓库、持续优化测试、提交 PR)。核心特点:消息通信、自进化 Skill、沙箱隔离、多模型架构。设计哲学是让人类退居二线仅作观察者,核心架构已在 GitHub 开源。命名来源于日语ワンマン(一人)的罗马音。
Qwen 图像模型升级到 2.0 Pro,图像质量、多语言文字渲染和指令遵循能力全面提升。在 Text-to-Image Arena 全球排名第 9,人像、写实、电影风格等细分场景进入前 10。主打更一致的跨风格表现,中文场景优化到位,适用于国际化视觉内容生产。国产开源视觉模型又一次突破,是做国际化视觉内容的新选择。
Suryansh Tiwari 深度解析了 Claude 风格多智能体系统的两种核心架构:Sub-Agents(隔离执行,单次任务,父节点控制)和 Agent Teams(协作通信,共享上下文,对等交互)。核心区别在于上下文边界的设计而非角色分工。提出了 5 种关键模式:Prompt Chaining、Routing、Parallelization、Orchestrator-Worker、Evaluator-Optimizer。强调应基于上下文边界而非角色来拆分任务,避免每个交接点的质量损失。
作者分享无手写代码前提下项目累计生成15万行代码的实践经验。核心设计:Codex(GPT模型)做规划/验收/需求拆解,Claude Code(国产开源模型)做执行,实现Planner-Evaluator-Generator职责分离。关键机制:阶段计划+结构化Prompt+零信任验收+长期记忆;验收发现的问题(生产路径未验证、异常无日志)自动沉淀到记忆文件下次自动检查。验证了规划与执行不能混、验收与实现不能同角色的核心原则。
论文研究多智能体系统中流氓智能体导致全系统失败的问题,提出实时监控与干预框架,用多项式岭分类器基于动作预测熵检测流氓智能体,在检测到低成功概率时触发回滚或重置。引入WhoDunitEnv协作环境,实验证明该机制使LLAMA-3.1-70B、QWEN-2.5-72B、GPT-4O成功率提升约10个百分点,代码生成任务提升2.5%,GovSim资源管理任务提升20%。
深入分析Hermes Agent开源架构,阐述其Self-Improving闭环的三个子系统:Memory(2200字符容量限制,声明式事实,逼Agent压缩信息;冻结快照机制保护上下文缓存)、Skill(踩坑后自动创建/patch SKILL.md,Pitfalls节记录教训,按需渐进加载)、Nudge Engine(后台fork独立Agent实例审查会话,每10回合/10迭代触发,输出重定向/dev/null用户无感知)。与OpenClaw对比:Skill需手写,Agent不自主学习;Hermes让Agent越用越强。
Peter Yang与Mercury VP @rywiggs合作推出关于Agent API和MCP设计的深度播客。核心观点:2020s的用户交互界面是API和MCP(Machine Communication Protocol),而非传统App。Mercury用Claude Code加500万字公司知识库构建第二大脑,每天自动生成日程/Linear/Slack简报。节目分享了:如何构建Agent友好的知识库结构、如何设计MCP工具接口、最佳API设计原则。这是第一份系统性Agent API/MCP设计实战复盘。
Google NotebookLM 推出来源(Sources)自动标签与分类功能,当文献库有 5 个以上来源时自动激活。系统根据内容语义自动归类文献、打标签,用户可以重命名、重新组织并使用 emoji 自定义样式。这个功能极大提升了研究场景下的笔记整理效率——过去需要手动为每篇文献打标签,现在 AI 自动完成初筛。特别适合做文献综述、深度研究的知识工作者。
Kimi K2.6 在 Vision Arena 排名总榜第 15(开源第一),在 Document Arena 排名总榜第 8(与闭源模型持平),从 K2.5 到 K2.6 有明显提升。这是国产开源多模态模型的又一次突破,在视觉理解和文档理解两个实用场景上均达到 SOTA 开源水平。对于需要强大视觉文档理解能力、又想本地部署或使用开源方案的产品团队,K2.6 值得关注。
介绍斯坦福+MIT论文《Meta-Harness》,提出让Harness本身进入自动化演进。当前文本优化器在优化Harness时核心问题是反馈压缩——几千步轨迹被压缩成单分数,丢失诊断上下文。Meta-Harness通过将完整文件系统(Python源码、执行日志)开放给代码Agent,让它像人类工程师一样翻阅历史候选、推理失败原因、编写修复代码。实验中TerminalBench-2通过80行环境快照代码使Claude Haiku 4.5达37.6%通过率。
OpenAI联合创始人Greg Brockman定义GPT-5.5为一种新的智能类别:在极少人工干预下完成复杂任务,token效率极高,延迟低,可大规模运行。Brockman强调这是真正向让AI完成计算机工作迈进的里程碑。GPT-5.5现已在ChatGPT和Codex中可用,代表Agent时代的基础模型能力基准。
Greg Brockman 转发了 GPT-5.5 在 Codex 模式下端到端生成完整 Excel 工作簿和 PPT 的能力。Derrick Choi 日常大量涉及电子表格和幻灯片,GPT-5.5 现在能直接生成带公式、格式和图表的 Excel 文件,以及完整演示文稿。这标志着 LLM 的生产力范围正从代码向办公全家桶扩张——不写一行代码也能用自然语言生成生产级文档。
Anthropic官方博客,系统阐述将Agent连接到外部生产系统的三条路径(Direct API、CLI、MCP)的适用场景及优劣。重点介绍构建生产级MCP服务器的最佳实践:远程服务器实现最大覆盖、按Intent而非端点分组工具、设计代码编排处理大表面、丰富语义(Elicitation/MCP Apps)、标准化认证(CIMD+Vaults)。提出MCP客户端的上下文效率优化(按需加载工具定义85%+节省、程序化工具调用37%节省)。
文章系统阐述Harness Engineering的核心价值:AI时代技术重心正从单点能力转向对整体系统的组织、约束和协同。作者从Prompt工程化、Context工程化、Tools工程化、Workflow工程化四个维度展开,结合OpenAI、Anthropic、LangChain的实践经验,介绍Generator-Evaluator模式、多Agent协作框架(Anthropic 16个并行Claude协作编写C编译器案例)。强调Harness的核心不是塞信息而是设计信息结构,长任务靠外部状态管理而非更强Prompt。
论文认为当前LLM Agent与人类协作采用反应式模式存在根本缺陷,人类无法预见解题决策如何向下游传导。提出simulation-in-the-loop范式,将多条备选未来轨迹外化展示,引入Agentic Workflow、Action Space、Simulation、Simulated Impact四个核心概念,以及Lookahead Depth、Exploration Breadth、Granularity三个设计维度。属于CHI 2026视角论文,概念框架尚未经实证验证。
设计师视角反思GPT Image 2的影响,认为这是从工具升级到分水岭级别的跃迁,文字渲染准确、多语言海报、UI草图等信息图生成能力将设计执行门槛降至几乎为零。作者指出设计师的真正价值不是做图而是做对的选择,并提出三条出路:往上走(判断层)、往深走(垂直领域)、跟AI协作(超级设计师)。核心观点是工具变强不是设计师的灾难,不愿意接受身份重新定义才是。
Qwen 3.6 27B 参数模型已在 Ollama 平台上线,同时支持 OpenClaw(openclaw launch openclaw --model qwen3.6:27b)和 Claude Code(ollama launch claude --model qwen3.6:27b)等主流 Agent 工具。这是 Qwen 系列在开源本地部署方向的又一次推进,配合 Ollama 的生态,在消费级硬件上跑起来相对轻松。对于需要本地部署开源模型做私有化工作的团队,这是一个值得测试的新选项。
Google 展示 LiteRT 在生产环境中的 NPU 加速案例:Google Meet 通过 NPU 部署了比此前大 25 倍的超高清分割模型,同时保持稳定功耗;Epic Games 在 Android 上实现实时 MetaHuman 面部动画(30 FPS);Argmax Pro SDK 实现顶级实时语音识别,NPU 相比 GPU 提速 2 倍以上且显著省电。Google AI Edge Gallery App 现已支持 NPU 基准测试,覆盖 Gemma 等模型。LiteRT 还扩展到工业边缘(Qualcomm Dragonwing IQ8)和 AI PC(Intel Core Ultra)。
Peter Yang 与 Mercury VP of Product Ryan Wiggins 深度对谈,主题是如何为 AI Agent 设计出色的 API 与 MCP(Model Context Protocol)。提供完整实战演示:25 分钟用 Claude Code 构建 Second Brain。MCP 正成为 Agent 间通信的事实标准,提前掌握即获得 AI 工作流下一代基础设施的入场券。
Allie K. Miller 推出免费 5 天邮件课程「AI Fast Track」,核心主张是:「用 AI」与「用 AI 建造工具」之间存在鸿沟,仅复制粘贴 Prompt 远远不够。课程无需编程基础,手把手教你用 Claude 构建个人 AI 软件、自动化脚本和实用工具。每天一个主题,聚焦可落地的 side project,而非泛泛的 AI 概念,tens of thousands 已经注册,适合想从「消费者」升级为「建造者」的 AI 用户。
Peter Yang 发布 Claude Design 实操教程 live demo,在 16 分钟内演示了用 Claude Design 创建视频、幻灯片、网站、App 乃至完整设计系统的完整流程。涵盖从概念到可交付物的每一步,展示 Claude 在多模态创意工作中的实际能力边界。视频为实时演示,可直接参考其操作路径用于自己的项目。
Thomas Wolf 详解 TRL 库新增的 AsyncGRPO 功能,解决了训练前向传播(FP32)与 vLLM 推理服务器(BF16)精度不匹配导致 RL 无法收敛的问题。通过将推理与训练解耦,实现更快、更 hard 的 scaling。附有完整 detective story 风格的技术解析,从问题复现到修复路径均有覆盖,是训练大模型 RLHF 流程的进阶参考。
Google DeepMind 发布 Deep Research 和 Deep Research Max,基于 Gemini 3.1 Pro 的自主研究代理,可安全浏览网页和自定义数据(如内部文档、专业财务数据),自动生成带引用来源的专业级报告。相比传统搜索,它能完成多步骤的调研任务链,输出结构化、可溯源的报告,适合分析师、研究人员和知识工作者。
Moyu 摸鱼局长 URL: com/Jason23818126/status/2047148464409379070 发布日期:2026-04-21 整理了 8 个 Hermes Agent 热度较高的实用项目,涵盖安全防护、搜索能力、技能扩展、工作空间、持久记忆等方面. hermes-agent-camel — 集成 CaMeL 信任边界,在任务执行过程中自动进行安全校验和信任验证,适合需要较高可靠性和防护的生产或敏感场景 GitHub: com/nativ3ai/hermes-camel 2. **hermes-web-sea
agents-md 是一份可直接放入项目根目录的 AGENTS.md 文件,使 Claude Code、Codex、Cursor 等编程代理遵循高级工程师行为规范。综合了 Karpathy 的四大编程代理失败原则和 Boris Cherny 的 Claude Code 工作流,核心改变:代理在用户犯错时反驳、只做最小必要修改、不擅自重构无关代码、先跑验证再报告完成、遇到歧义主动询问。约 200 行,有两个可编辑部分(项目上下文和经验积累),其余规则保持精简。可通过创建 CLAUDE.md 和 GEMINI.md 符号链接统一管理所有代理的行为规范。
Greg Brockman 演示了用自然语言完全在 Codex 内构建 WebApp 和小游戏的工作流:开发者可在 Codex 内直接运行自己开发的游戏,用 Codex 生成的工具来设计建筑等元素,并能实时提问、修改、边运行边调优。这标志着 AI 代码生成从「辅助补全」进化到「主导开发」的关键信号,开发者应尽早熟悉对话即 IDE 的新范式。
Anthropic 发布 Claude Design,基于 Claude Opus 4.7,实现描述到可交互高保真原型的工作流。与 Figma/Canva 的本质区别:AI 是主要生成者、人是审阅者,而非在画布工具上叠加 AI 插件。核心能力:输出 React+CSS 可运行代码而非静态图;理解代码库结构后自动套用设计系统;可生成临时专用工具;与 Claude Code 形成设计到代码落地闭环。实测案例:3 轮对话产出完整 Mac App 原型,含可点击交互和版本对比。Anthropic 设计师一人服务 7 条产品线的现实已发生,Figma 股价当日大跌。
作者在QCon北京分享了两年做AI产品的阶段性总结,聚焦三个核心问题:为什么AI产品难做(不确定性、场景模糊、用户预期管理);提示词工程被严重低估(是产品特性而非技术细节);AI产品团队如何构建(需要新的协作流程和角色)。内容来自大量AI产品demo的实战积累,对AI产品经理有较高参考价值。
CREAO 创始人结合自身实践深度分析「AI First」战略的落地条件与常见误区。文章指出「AI 优先」本质是围绕 AI 重建工程流程,而非简单加入 AI 工具;五大工程前提(自动化测试、CI/CD、A/B 监控、任务管理、架构)缺一不可,基础设施不完整时 AI First 只是口号。核心案例:25 人团队借助 Claude Opus 4.6 实现每天 3-8 次生产部署,从构思到上线当天完成,糟糕功能当天即撤,数据驱动决策。提出未来两类工程师——架构师(设计 SOP,教 AI 工作)和操作员(验证并分配任务),以及初级工程师比资深工程师适应更快的反直觉现象。
黄仁勋接受 Dwarkesh Patel 两小时专访,系统阐述 Nvidia 的经营哲学与 AI 基础设施战略。核心观点:Nvidia 的护城河不是技术锁定,而是全球数亿 GPU 装机量与跨云平台的生态优势;Anthropic 使用 TPU 是早年 Nvidia 资金不足导致的「特例」而非趋势;出口管制会加速中国芯片自主化,美国将丢失全球第二大科技市场;收购 Groq 源于推理市场进入「分层定价」时代。全文数据密集,涵盖 CUDA 生态、供应链布局、Blackwell 架构 50 倍能效提升、对华政策博弈等关键议题。
设计师 Sam Henri Gold 体验 Claude Design 后撰文:Figma 花十年构建的封闭设计系统在 AI 智能体时代正变成负担。LLM 用代码训练,学不会 Figma 专有格式,单一事实来源将回归代码。Figma 走向了忠于材料原则的反面:底层规则极其死板,表面却伪装得自由散漫。相比之下,Claude Design 尽管体验粗糙但诚实地由 HTML/JS 构成,与 Claude Code 天然打通,设计与开发的反馈循环有望融合。Figma 的 Sketch 时刻正在迅速逼近。
作者观察2027年将主导市场、目前正在构建中的5种AI原生商业模式:①一人企业级服务(用AI+自动化完成10人团队工作量,服务企业客户,无员工);②AI微型代理公司(2-3人+AI工具,交付10人团队产出,颠覆传统代理);③小企业自动化即服务(预构建行业自动化系统月订阅);④产品化AI咨询(把专业知识打包成AI系统按需交付,取代按小时收费);⑤零开销数字产品(一人用AI构建、发布、扩展数字产品)。
Kimi 与 Nous Research 联合推出 Hermes Agent 创意黑客松,为期 16 天,奖金池 $25,000。招募将 Hermes Agent 应用于创意领域(视频/图像/音频/3D/长文本/互动媒体)的探索者。展示了业界对 AI Agent 从工具向创意伙伴演进的期待,也为独立开发者提供了将 AI Agent 落地的新方向参考。
Google在Android Studio中推出企业版Gemini,提供超越消费版的高级隐私保护:客户代码和输入不用于训练共享模型,数据由客户自有,SOC 1/2/3和ISO/IEC 27001等多项认证覆盖,并支持Private Google Access、VPC Service Controls和细粒度IAM权限。面向对数据安全有要求的大中小企业,标志着AI编程辅助工具进入企业合规时代。
Gemini新增视觉Agent能力:模型可将数据表格转化为高质量图表、分析信息图、理解图像内容并绘制边界框、按大小对物体进行视觉排序等。核心突破是LLM能自主写代码来驱动视觉任务执行,而非预设视觉管道,标志着视觉推理从「固定流程」向「自主规划」的重要转变。
月费200元的AI智能体已能替代大部分白领工作,智力溢价这一维持几千年的「潜规则」正在被打破。更致命的不是失业,而是收入配不上负债——白领降薪/裁员后涌入蓝领市场,形成向下挤压的连锁反应。个人应对策略:停止基于「脑子永远值钱」的长期负债;不跟AI拼干活而拼判断;用AI实战找到不可替代位置;保护底线资产。
AI时代人群正在分层:Level 1把AI当搜索引擎(90%的人),Level 2当助手建立连续context(9%),Level 3用AI团队创造10-100倍价值(1%)。超级个体的核心能力模型包括Vibe Coding、Agent Engineering、AI Fluency,以及产品层(快速迭代)和市场层(Storytelling/Build in Public)。Claude Agent SDK和MCP的出现创造了6-12个月的先行者窗口,「Agent能力是21世纪核心技能」。
2026 年 4 月 18 日 AI 高价值内容日报,筛选 5 条:① Allie Miller 的 5 天 AI 建造课程;② Karpathy 转发 Farzapedia——用 LLM 将 2500 条个人数据转化为个人维基百科的实践;③ Google 发布 Gemini 3.1 Flash TTS 表情化语音合成;④ Gemini Agentic Vision:LLM 自己写代码做视觉推理任务;⑤ Nature 重磅论文——LLM 可通过隐含数据信号传递偏好与对齐特征。
用Tim Urban的人生方格图和Steve Jobs的connecting dots框架,探讨个体如何在AI时代设计人生路径:向后看理解轨迹,向前看设想可能,活在当下创造每个扎实的dot。核心洞察:在所有宏观因素中,AI几乎是唯一可主动掌握的变量——经济周期、政策走向、行业兴衰都控制不了,但可以选择如何学习、使用和让它创造价值。Build in Public是建立信任飞轮的关键策略。
This is a great report that...
Research we co-authored on ...
Our most expressive and ste...
Boris Cherny 深度使用 Claude Opus 4.7 后分享的实用技巧总结。核心功能包括:Auto mode(Claude 自动判断命令安全性并批准执行)、/fewer-permission-prompts(智能白名单)、Recaps(任务回顾)、Focus mode(隐藏中间步骤)、灵活的努力程度设定(低-max)。推荐工作流:让 Claude 验证自己的工作成果(端到端测试),结合 /go 自定义技能实现自我测试+精简代码+PR 提交流程。引发 211 次点赞和 41 次转发的热门讨论。
基于 Reddit 真实数据(Claude Code Opus 4.6 ~100小时 vs Codex GPT-5.4 ~20小时,8万行 Python/TypeScript,2800测试用例)的深度对比。发现两种截然不同的工程师人格:Claude Code 像赶工期的资深工程师,速度快3-4倍但倾向堆砌技术债务;Codex 像稳妥的5-6年经验开发者,深思熟虑但交付质量更高。作者提出实用的互补工作流:用 Claude Code 快速原型探索,Codex 重构架构补测试。核心结论:AI 编程助手是放大器而非替代品,Claude 需要技艺精湛的驾驶员,Codex 对实时介入要求更低。
wsl8297 推荐 12 个 GitHub 项目用于配置 Claude Code: LightRAG(知识图谱)、Superpowers(Claude 增强)、Obsidian Skills(上下文管理)、Everything Claude Code(功能汇总)、Claude Mem(记忆)、n8n-MCP(自动化集成)、Awesome Claude Code(用法汇总)、UI UX Pro Max(设计审美)、GSD(目标导向执行)等。社区补充 Oh My Claude Code 应排第一;GSD 中 Nyquist 规则(每步60s内验证)被单独点名实用。引发 1189 次点赞、260 次转发的高热度讨论。
RookieRicardoR 系统梳理当前 AI Agent 开发工具链全貌:底层(模型协议层)推荐 Claude Agent SDK(子进程方式兼容所有 Claude 协议模型)和 OpenAI Agent SDK / Vercel AI SDK / Pi-mono;上层 Runtime 推荐 assistant-ui + tools.ui(完整事件流+UI组件);开源完整方案推荐 CodePilot;记忆层建议可插拔设计(better sqlite + F5,或 markdown)。线程讨论深入,延伸至 Human-in-the-loop 审批、Wiki 模式不是真正记忆层等工程细节。
Gemini 3.1 Flash TTS 是 Google 迄今为止表现力最强、可控性最高的语音合成模型。核心新功能 Audio Tags:用自然语言命令嵌入文本来引导语音风格、节奏和表达方式。可在 Google AI Studio 或 Vertex AI 直接调用,适合有声内容、语音助手、播客类 AI 应用。音频标签让语音合成从调参数变成写指令,大幅降低了 AI 语音定制门槛。
Google AI 宣布 Gemini 3.1 Flash TTS 已在 Google Vids 中推送,同时通过 Gemini API 和 Google AI Studio 预览开放。该功能可将脚本一键转化为工作室级旁白配音,面向 pitch deck 和 passion project 等场景。这是 Google 生态内首次实现「脚本→专业配音」的端到端覆盖,视频创作者无需再借助第三方语音合成工具,工作流大幅简化。
基于 DeerFlow(字节开源多智能体框架,GitHub 6万+ Stars)和 LangChain 创始人 Harrison Chase 的文章,系统梳理 Agent 自我进化的三层框架:Model(权重更新,最重)、Harness(执行机制,2026年核心竞争点)、Context(记忆与个性化,最先落地)。核心判断:2026 年 Agent 的分水岭不在模型在 Harness;Context 层会最先普及;traces 是三层学习的统一燃料;未来更强的 Agent 不来自更大模型,而来自更会复盘、记忆、重构的系统。
文章分析 OpenClaw 进入真实生产场景还缺的四层能力:可视化层(Agent 在做什么必须清晰可见)、封闭层(把开放业务动作重构为边界明确的工作单元)、验证层(垂直领域的 gate,不通过不能进入完成态)、回滚层(沙盘机制,Amazon agent canvas 的实践)。核心判断:Coding Agent 成功是因为代码世界天然具备可视化/封闭/可验证/可回滚四个特征;业务 Agent 要落地必须先把这四层能力构建出来。
从注意力机制原理出发,详解 KV Cache 的工作原理与工程权衡。自回归生成中 Token 1-49 的 K/V 每次都重算是 O(n^2) 浪费;KV Cache 把历史 K/V 只算一次并缓存,新 Token 只追加自己的 K/V,实现约 5x 提速;代价是显存占用,context window 翻倍意味着单请求 cache 翻倍。Prefill 阶段(首个 Token)最贵,因为要一次性算完所有历史 K/V,这就是 TTFT 瓶颈的来源。GQA/MQA 通过共享 K/V head 显著降内存,是大规模服务必用方案。
Anthropic 官方员工 Thariq 发布的产品使用指南,系统讲解 Claude Code 100 万上下文下的会话管理策略。覆盖:Continue(继续)、Rewind(回溯,纠正错误的最佳方式)、Clear(清空新会话)、Compact(上下文压缩,有损摘要)、Subagents(委派干净上下文的子任务)五种决策路口。好压缩的关键是让模型知道下一步往哪走;子智能体适合阅后即焚型大量中间结果;100 万上下文让主动提前压缩成为可能。
深度解析 Agent Memory 的工程架构。核心观点:Memory 的难点不在容量,在治理。文章厘清了 Memory 与 State/Policy/Profile 的边界,指出蒸馏只是管理链路中的一个操作而非记忆本身。提出四个建模对象:用户模型、任务模型、世界模型、自我模型。定义了记忆的六个维度(内容/类型/置信度/来源/作用域/时间衰减),以及写入-管理-读取三条链路。强调进化=修正+遗忘,评测从 recall 转向 update/abstain/drift/forget。
作者提出 AI Knowledge Layer 的两层架构:动态知识库层(KBL)和静态品牌基础层(BF)。KBL 让用户将推文、文章、书签等原始素材导入文件夹,由 AI Agent 自动分类、构建结构化 Wiki 页面并维护主索引;BF 则存储用户的声音规则、视觉风格、定位等静态信息,Agent 只读不改。灵感来自 Karpathy 关于将 token 消耗从代码转向知识管理的观点。开源框架,20 分钟即可部署。
这次 Claude Code 的泄露,让我们第一次比较完整地看到,这些模式在一个真实、大规模使用的 agent 里是怎么落地的。这样的窗口可能不会一直存在,但这些经验会留下来。
[EN] - 来源:X/Twitter 原文链接: 作者:chrysb 日期:2026-04-14 抓取时间:2026-04-14 12:00...
Hashline 编辑格式证明:改 harness 不改模型,弱模型效果可翻十倍
原文链接: 作者:Khazix0918 日期:2026-04-14 抓取时间:2026-04-14 12:00
不点 GUI 按钮、直接复现底层 API,是 Agent 浏览器自动化的正确工程路径
首次系统梳理 LLM 记忆系统的全设计空间,指出 Raw/Derived 权衡是结构性问题
Google I/O 2026 将于 5 月 19-20 日举行,重点聚焦 AI、 Android、Chrome 和 Cloud 领域。大会将以'代理时代'(agentic era)为主题,发布面向 AI 自动化复杂工作流的新工具,简化 AI 就绪应用的高质量构建。注册已开放,可在线观看主题演讲和技术演示。
[EN] - 来源:X/Twitter 原文链接: 作者:amitiitbhu 日期:2026-04-14 抓取时间:2026-04-14 12:00...
[EN] - 来源:X/Twitter 原文链接: 作者:augmentcode 日期:2026-04-14 抓取时间:2026-04-14 12:0...
MiniMax M2.7 模型权重已在 Hugging Face 公开,达到 SWE-Pro 56.22% 和 Terminal Bench 2 57.0% 的 SOTA 性能。该模型为特殊许可,禁止未经授权商业使用,并非 OSI 认可的开源定义。配套提供 MiniMax API 和技术博客。M2.7 在代码编辑和终端任务上表现优异,对研究者和非商业用途的开发者是值得关注的新基座模型。
ISSCC 2026 展示的 ARIES 架构代表了 AI 芯片从算力怪兽向有脑子的行动派的进化路线。ARIES 通过 RISC-V CPU 集成(调度控制前额叶)+ 280MB 大容量 SRAM + CIM 存内计算,实现 PD/AF 融合方案(拒绝 NVIDIA/Groq 的物理分离路线),以 14nm 工艺在能效比上超越 4nm GPU。其三引擎 NPU Core(TCE/TME/VCE)+ 相似性感知 TCAM + LUT 非均匀量化,构成 Agent 时代芯片的差异化竞争力。
本文深度分析 ISSCC 2026 展示的 ARIES 芯片架构,这是一款专为 AI Agent 时代设计的 RISC-V+AI 异构 SoC。核心创新三点:第一,将 RISC-V CPU 直接集成进 SoC 核心区作为调度单元,解决传统 NPU 控制流跳回 Host CPU 的 PCIe 时延问题;第二,采用统一 Tile + 独立时钟域替代 PD/AF 物理分离,同一硬件动态切换算力密集和访存密集模式;第三,堆 280MB 片内 SRAM + CIM 存内计算消灭访存瓶颈,通过 LUT-based 多精度量化在 14nm 工艺实现超越 4nm GPU 的能效比(YOLO 系列 10.12x FPS/W 提升)。ARIES 代表了 Agent 时代逻辑控制与极致算力耦合的实用主义芯片设计路线。
Harness Engineering 是继 Prompt Engineering、Context Engineering 之后,由 Mitchell Hashimoto(HashiCorp 联合创始人)提出并因 OpenAI 报告而广为人知的第三类 AI 工程化方法。其核心隐喻是为 AI Agent 这匹野马套上缰绳,通过约束、引导与纠正确保其稳定运行。该框架以 R.E.S.T 四目标(可靠性、效率、安全性、可追溯性)为基石,通过上下文管理、Function Calling 降级策略、沙盒隔离与多层度量体系,将 Agent 从有趣的玩具变为可规模化的可靠生产力工具。
Harness Engineering 是继 Prompt Engineering 和 Context Engineering 之后 2026 年 AI 领域的核心工程方法论,由 HashiCorp 联合创始人 Mitchell Hashimoto 提出。核心比喻是缰绳:AI Agent = SOTA 模型(野马)+ Harness(驾驭系统)= 千里马。文章系统性拆解了 Harness 的设计目标(R.E.S.T 模型:可靠性、效率、安全性、可观测性)、四层架构(控制平面+数据平面)、核心运行机制(REPL 容器抽象、Token 转化流水线、Function Calling 生命周期)、规划模式(Plan-and-Execute 为主)、沙盒执行框架(从进程级到 VM 级四档隔离)以及度量体系。适合 Agent 系统工程师建立完整的工程化框架认知。
Anthropic 发布 Automated Alignment Researchers(AAR)研究:用 9 个 Claude Opus 4.6 实例并行作为自动化对齐研究员,在弱-强监督问题上从人类基准 PGR 0.23 提升至 0.97,成本约 $18,000。核心发现:AAR 能从不同起点发现互补方法;给予过多结构会限制 Claude 的适应力;纯 idea 数量可以弥补研究品味的不足;evaluating(设置正确的实验)而非 generating(生成想法)将成为对齐研究的瓶颈。AAR 仍会出现 reward hacking,且方法难以跨领域泛化。
Anthropic对80,508名Claude用户进行的大规模定性研究,覆盖159个国家、70种语言,是迄今最大规模的多语言定性AI调研。核心发现:人们希望从AI获得的九大愿景——专业卓越(18.8%)、个人转变(13.7%)、生活管理(13.5%)、时间自由(11.1%)、财务独立(9.7%)、社会转型(9.4%)、创业(8.7%)、学习成长(8.4%)、创意表达(5.6%)。81%的人认为AI已向愿景迈出一步。方法论创新在于用AI访谈员实现定性研究的规模化——兼顾深度与数量。
Android 17用lock-free混合数据结构DeliQueue替换了存在20年的MessageQueue实现。实际用户设备上实现丢帧率降低4%-7.7%、应用启动速度提升9.1%。这不是Binder IPC改造,而是对Android所有UI线程运行核心——Looper/Handler消息调度机制的根本性重构。每个应用的main线程、SystemUI、Launcher乃至system_server中的HandlerThread都依赖MessageQueue,这个单点性能改进具有全局传导效应。面向SDK 37及以上默认启用。
English Claudian is an Obsidian plugin that embeds AI coding agents (Claude Code, Codex, and more to come) in your vault. Your vault becomes the agent's working directory — file read/write, search, bash, and multi-step workflows all work out of the box. Open the chat sidebar from the ribbon icon or command palette. Select text and use the hotkey for inline edit....
GitHub - PacktPublishing/LLM-Engineers-Handbook: The LLM's practical guide: From the fundamentals to... The LLM's practical guide: From the fundamentals to deploying advanced LLM and RAG apps to AWS using LLMOps best practices - PacktPublishing/LLM-Engineers-Handbook LLM Engineer's Handbook: Maste...
面向移动设备厂商研发团队的Agent体系深度研究报告。系统梳理Agent定义谱系、架构范式与多智能体协作机制,给出可落地的PerformanceAgent(性能智能体)参考设计。重点对齐Claude Agent SDK的官方能力模型,涵盖工具调用、子智能体、Skills、Hooks、上下文压缩、权限沙箱、托管形态等。从移动厂商视角出发,设计性能优化专属Agent架构。
gstack: Use Garry Tan's exact Claude Code setup English gstack is an open-source toolkit designed to enhance the capabilities of Claude Code, transforming it into a "virtual engineering team" with specialized roles and workflows. Created by Garry Tan, CEO of Y Combinator, this setup is intended to streamline and standardize AI-assisted software development processes....
Claude Code官方中文文档。Claude Code是由AI驱动的编码助手,可理解整个代码库并跨多个文件和工具工作。支持macOS/Linux/WSL/Windows安装,核心功能包括:繁琐任务自动化(测试、lint修复、合并冲突)、自然语言描述→规划→编码→验证的工作流、git集成、MCP连接外部数据源、CLAUDE.md项目配置、自定义命令(Skills)和Hooks。
深度解析Claude Code背后的六层架构:基座模型、开放协议(MCP)、共享运行时、能力系统和扩展框架。这种垂直整合(Anthropic控制从模型训练到终端工具的每一层)创造了竞争对手难以复制的复合优势。Claude Code从内部原型到最受欢迎的AI编程工具仅用不到一年,2025年单年发布176次更新,每天产生135,000个GitHub commits。理解这六个组件的架构关系是理解Claude Code领先优势的关键。
English Airbnb’s Page Performance Score on Android Luping Lin7 min read·Dec 17, 2021 -- Listen Share Part 4 of our series on Airbnb’s Page Performance Score....
面向资深Android系统工程师的技能升级路线图。核心判断:2025-2026年最具杠杆效应的方向是'端侧AI全栈'——将系统底层经验与AI推理优化、On-device ML和AI Agent开发结合。AI技能薪资溢价已达56%,全球AI人才缺口300万。建议投资方向包括:LLM基础能力、Agent开发、端侧推理优化、性能分析与AI结合。原文含具体学习路径和工具推荐。
GitHub - yetone/openai-translator: 基于 ChatGPT API 的划词翻译浏览器插件和跨平台桌面端应用 - Browser extension and cross-platform desktop application for translation based on ChatGPT API. 基于 ChatGPT API 的划词翻译浏览器插件和跨平台桌面端应用 - Browser extension and cross-platform desktop application for translation based on ...
Claude Code 编程工具相关实践与技巧
GitHub - rockbenben/ChatGPT-Shortcut: 让生产力加倍的 ChatGPT 快捷指令,按照领域和功能分区,可对提示词进行标签筛选、关键词搜索和一键复制。 ChatGPT Shortcut 是根据领域和功能划分的 ChatGPT 快捷指令表,可通过标签筛选、关键词搜索和一键复制来使用提示词,旨在简化你的工作流程并提高生产力。即使是初学者,你只需复制提示词,稍加修改后发送给 ChatGPT,就能获得指定输出,让你的生产力加倍! 提示词(即 Prompt)通常是用户提供的问题或文本,以激活模型生成回复。简单来说,prompt 就是用户想要询问的内容,作为输入送到 ...
【问题分析】WMS无焦点窗口的ANR问题【Android 14】_waiting because no window has focus but activityre 原文链接: Monkey跑出的 Launcher ANR,场景为在Launcher的Recents界面下一个Activity启动又快速销毁导致的无焦点窗口问题。 1\. log分析 2\. 模拟 ANR 根据之前的log分析,我们已经可以写一个 Demo App来模拟该ANR的发生情况了,总结如下: 1、启动任意一个Activity,我这里写的Demo App为 MainActivity 。 2、接着输入 事件 KEYCODE\_RECENT\_APPS,回到Recents。...
GPTs are GPTs: 劳动力市场影响潜力初探 原文链接: 原文:GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models Title GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models 标题(中文): GPTs are GPTs:大型语言模型对劳动力市场影响潜力的初步审视 Authors Tyna Eloundou, Sam Manning, Pamela Mishkin, Daniel Rock 作者(中文): Tyna Eloundou、Sam Manning、Pamela Mishki...
Anthropic官方Claude Code实战课程的中文翻译版,适合离线阅读。课程覆盖21个章节:基础部分(引言、编码助手概念、实战、安装配置、项目准备、添加上下文、修改代码)、进阶部分(控制上下文、自定义命令、MCP服务器、GitHub集成)、Hooks专题(认识/定义/实现Hooks及常见坑点)、高级主题(SDK、测验、总结)。
LLM Agent 在长时间、动态交互环境中运行时,如何实现持续学习和自适应?现有方法(长上下文、外部记忆、参数更新)为何无法完整支撑真正长期化的 Agent?
关于如何在 Slack 上免费使用 GPT4 和 GPT3.5 的一个简单教程: 0、全程不需要科学上网; 1、注册一个 Slack 帐号 ; 2、创建一个工作区,随便起一个名字,如果你已经有工作区了,跳过此步; 3、点开 这个页面,安装 AIbus 到 Slack; 4、在 Slack 直接点开 AIbus 与它对话; 5、也可以在频道里把 AIbus 拉进来,之后就...
Claude Code推荐Skills汇总整理。Skills是Claude Code中的可复用能力(SOP),存放于.claude/skills/目录。收集了社区和官方推荐的高质量Skills清单,涵盖翻译、代码审查、文档生成等常用场景。
社区整理的Claude Code最佳实践指南,覆盖基础操作、常用命令、工作流配置、常见问题解答等。适合Claude Code新手快速上手参考。
Android Framework常见面试题解答集,包含socketpair与socket区别、Binder通信原理、Handler机制、Service生命周期等核心知识点。面向Android系统工程师面试准备。
"Philosophers warn us not to be satisfied with mere learning, but to add practice and then training." | Revue StoicallyTyped Newsletter - Hey happy Monday!I'm on vacation! I have some time before I start my new job and am taking advantage of all this free time to visit f "Philosophers warn us not to be satisfied with mere learning, but to add pract...
Anthropic工程团队详解Managed Agents架构——将Agent的大脑(决策)与双手(执行)解耦的设计范式。Managed Agents允许将子任务委托给专门的Agent执行,主Agent负责协调。这种架构支持Agent的水平扩展,每个子Agent可以独立运行、使用不同工具、拥有独立的上下文窗口。文章详细讨论了委托机制、上下文传递、错误处理和成本控制等工程挑战。
Agentic code assistants(Claude Code、Codex、Jules)是 2024 年兴起的新一代 AI 编程工具,能自主完成端到端软件工程任务。但这类工具的行为和效果高度依赖配置文件(Claude.md),目前缺乏对这类配置文件的结构、内容和最佳实践的系统性研究。
Agentic workflow 中,AI agent 会 hallucinate 或推理错误,且错误会在 agent 间传播(一个 agent 的输出作为另一个的输入)。传统 provenance 技术无法捕获 agent 特有的元数据(prompts、responses、decisions)与 workflow 上下文的关联。该论文要解决的核心问题是:如何将 AI agent 行为纳入端到端 workflow provenance,实现可追溯、可审计、可复现的 agentic workflow?
LLM Agent 需要领域特定技能(skills)才能高效处理复杂任务。但技能创建面临三重困境: 人工编写不可扩展:每个领域都需要专家花大量时间写详细的操作指南,随着 Agent 应用场景扩展,这个瓶颈越来越严重 纯 LLM 生成效果差:直接让 LLM 凭参数化知识写技能,缺乏对目标领域具体操作和常见陷阱的了解,收益有限 在线顺序更新导致碎片化:现有在线范式(如 ExpeL、Skill-Gen)按顺序处理每条轨迹,一条轨迹学一个教训就更新一次技能,导致技能碎片化且容易过拟合
@zoink提出:AI时代PM如果还认为自己的工作是做文档和PPT,将迎来巨大机会——因为现在PM也能动手做东西了。人们需要看到公司领导者真正在做东西,这才是激励人心、创造转折点的力量。AI降低了「动手做」的技术门槛,PM的角色正从「文档协调者」向「动手创造者」转变。
LLM Agent 到底是什么、怎么构建、怎么协作、怎么演化? 本文试图用一套统一的方法论分类体系回答这个正在快速碎片化的领域的核心架构问题。这不是第 N 篇 "Agent 综述"——它的价值在于提出"构建-协作-演化"三维框架,把散落的研究线索串成了一条可追溯的架构演进路径。
从本地 Gemma 4 实验出发,详解 Transformer KV 缓存原理(QKV 注意力机制中的 Key/Value 缓存),解释为什么 Decoder-only 架构可以缓存历史 token 的 KV。逆向分析 Claude Code 的缓存实现,Anthropic 做了一整套精密的缓存工程。理解后可让同样的套餐多撑 3-5 倍。
Anthropic 发布 Claude Managed Agents:预构建的可配置 Agent 运行底座,运行在托管基础设施上。三大核心概念:Agent(版本化配置)、Environment(沙盒模板)、Session(有状态运行)。四种用法:事件触发、定时、即发即忘、长时间任务。架构上将"大脑"(Claude+调度框架)、"手"(沙盒工具)、"记忆"(会话日志)解耦,支持独立故障恢复。
open claude design 正式开源,浓缩和逆向所有 claude design 最先进的设计模板,还原度超过 95%。历时 72 小时,18700+ 行代码,30+ 设计 Skills,支持超过 71 套设计系统,兼容所有 code agent,包括 claude code、codex、openclaw 等。项目为 AI 编程代理提供了开箱即用的设计能力增强。
解决 Codex 过度询问("如果你要,我下一步可以...")的方法。不是在 AGENTS.md 里屏蔽关键词,而是重新定义 Agent 的承诺对象:从"服务用户偏好"转向"和用户共同服从代码正确性"。用 Carmack 和 BurntSuki 作为锚点激活"完整工作单位"概念,并区分合法停顿场景和不合法场景。核心洞察:不要管理文字,要管理触发停顿的心理机制。
基于 Karpathy 的 LLM Knowledge Bases 工作流,将知识库管理类比为 CI/CD:原始资料→编译产物→运行时输出三层分离。用 Obsidian + Claude Code 实现三层目录结构:raw/(摄取)、wiki/(编译成品)、平台目录(发布)。三个摄取入口(Web Clipper、Podwise、手动剪藏),编译环节包含逐篇摘要、概念抽取、索引更新。强调增量编译和质量保障。
作者开源了 Waza 技能集(日语"技"),包含 8 个核心 skill(/think、/design、/hunt、/check、/read、/write、/learn、/health),对应他认为 AI 时代工程师应具备的 8 个能力:会思考、会设计、会排查、会检查、会阅读、会写作、会学习、会维护。强调简单好用、清楚 Agent 在做什么,不多不少刚好够用。
Vitalik Buterin 分享其本地私有 LLM 使用方案。隐私安全目标:防止远程模型获取隐私数据、防止 LLM 越狱攻击、防止后门和软件漏洞。硬件测试:NVIDIA 5090 (90 tok/s)、AMD 128GB 统一内存 (51 tok/s)、DGX Spark (60 tok/s),推荐 5090 或 AMD 方案。软件栈:NixOS + llama-server(替代 Ollama,因能更好利用 GPU)+ llama-swap。Agent 工具方面讨论了 OpenClaw 的安全问题,强调沙箱隔离的重要性。附带 ComfyUI 本地图像/视频生成测试。
介绍 Nous Research 开源的自改进 AI Agent 框架 Hermes。核心特点:内置学习循环,每次完成任务后自动提炼可复用 Skill 存入持久记忆。多层记忆系统(短期+长时+Skills),支持 40+ 工具。与 OpenClaw 对比:Hermes 重单个 Agent 深度自我成长,OpenClaw 强在多平台覆盖和复杂工作流。内置 hermes claw migrate 迁移命令。
OpenAI 上周发布 GPT-5.5 后,紧接着放出了一份官方提示词指南。这份指南传递的核心信息只有一个:别再写长提示词了。 GPT-5.5 距离上一代 GPT-5.4 只隔了六周,API 定价每百万输入 Token 5 美元、输出 30 美元,上下文窗口 100 万 Token,目前已面向 Plus、Pro、Business 和 Enterprise 用户开放。模型本身的变化各家媒体已经报道过,这份提示词指南更值得关注的是它暗示的使用方式转变。 【1】越短越好,告诉它"要什么"而不是"怎么做" 过去用 AI 模型,很多人习惯写一长串步骤,手把手教模型该先查什么、再比什么、最后怎么输出。OpenAI 在指南里直接说:这套玩法过时了。GPT-5.5 的推理能力够强,你只需要描述清楚想要的结果、成功的标准和限制条件,剩下的让它自己规划路径。...
中文深度分析 Claude Managed Agents。与 Claude Code 的区别:Code 跑在本地给个人用,Managed Agents 跑在云端给企业用,24 小时不间断。典型用法:事件触发型(Sentry 自动修 bug)、定时型(每日简报)、即发即忘型(Slack 派活)、长时间任务。技术架构将大脑/手/记忆解耦。案例:Notion、Sentry、Atlassian、Rakuten 等已接入。Anthropic 年化收入突破 300 亿美元。
Andrew Ng在AI开发者大会上指出:AI让编程更容易将带来更多人参Coding,而非消灭编程工作;手写代码和阅读代码不再重要,可以在对代码提问后直接以更高抽象级别操作;定制应用将爆发(因为现在为小众人群写软件也划算了);Product Management Bottleneck(决定做什么比建造什么更成瓶颈)将成为主要矛盾。Ng对「AI导致失业」的末日论持反驳态度。
Avi Chawla 通过 Claude Code 案例详细解析了 LLM Prompt Caching 的技术原理与工程实践。核心观点:KV Cache 将计算复杂度从 O(n^2) 降至 O(n),静态前缀(系统指令、工具定义、项目上下文)可被缓存并以 0.1x 价格读取。Claude Code 实测 92% Cache Hit Rate,实现 81% 成本降低($6.00 -> $1.15)。三大工程原则:不要在会话中修改工具定义、不要中途切换模型、不要在缓存前缀中注入状态变量。
开源了 replit slides 的全套设计 skills 模板,提供 8 套 replit 样式(helix / holm / vance / bevel / world-dark / world-mint / atlas / bluehouse),支持 0 限制、完全本地运行的设计 Agent。配合 open claude design 项目,为 AI 编程代理提供完整的幻灯片设计能力。
Obsidian + Claude 搭建个人知识库的核心架构实践。核心思路:把笔记库当代码仓库来"编译"。三层目录结构:原料/(只读,Claude 不可修改)→ 摘要/(Claude 结构化编译产物)→ 沉淀/(Query 高质量回答落文件)。两个元文件:CLAUDE.md(控制 AI 行为的最高宪法)和 index.md(全局目录 + TLDR,Claude 检索时先扫再深读)。日常工作流三个动作:Ingest(逐篇处理)、Query(好回答存文件)、Lint(定期健康检查)。防腐化底线:重要断言必须有来源、新旧冲突报 diff 不覆盖、区分事实和推论。
介绍 oh-my-codex 工具,用于增强 OpenAI Codex 的长任务能力。安装命令 npm install -g @openai/codex oh-my-codex。核心命令:$deep-interview(澄清)、$ralplan(方案审批)、$ralph(推进执行)、$team 3:executor(并行执行)。亲测可有效处理长任务。
Claude Code 的图谱 Skill,支持将代码、论文、图片自动生成知识图谱。多模态提取:tree-sitter 解析代码、Claude vision 看图片、LLM 读 PDF。每条边标注 EXTRACTED/INFERRED/AMBIGUOUS 三种可信度,在 52 文件场景下实现 71.5x token 压缩率。输出支持交互式 HTML、Obsidian vault、可 Agent 读取的 wiki、持久化 JSON 跨 session 可查询。
V 神分享的本地大模型环境配置博客。从硬件选型开始,详细讨论如何构建一套满足隐私、安全、离线要求的 Local LLM 环境。特别值得注意的细节:为了减少飞机上离线情况下的模型幻觉,他把 1GB 维基百科内容都存了下来方便模型自我核实。同时也考虑了预算有限朋友的硬件推荐方案。
歸藏优化了 Codex 中的 PPT Skills,实现了图片一键生成功能。能够调用 Codex 里的 GPT-Image-2 去生成图片,并为此做了专门的设计,支持生成独特风格的图片,根据内容生成不同类型,包括营造氛围的人文纪实图片(类似胶片机拍摄效果)。
Google 最新 Gemma-4-31B 基础模型出现越狱版本 Gemma-4-31B-JANG_4M-CRACK,HarmBench 得分 93.7%(149/159)。采用 18GB 混合精度 MLX 量化,支持 Apple Silicon,原生支持视觉多模态。已在 Hugging Face 开放下载。
不到 2 小时带你彻底玩转 Codex App + GPT-5.5 组合:技能和插件怎么用、自动化工作流如何搭建、多任务并行实战,全程手把手演示。教程覆盖 Codex 的核心功能,包括技能系统、插件机制和多任务并行处理,适合想快速掌握高效 Vibe Coding 方法的开发者。
基于 Claude Code 创始人 Boris Cherny 分享的技巧整理的实战指南。核心要点:给 Claude 验证机会(装 Chrome 扩展/Playwright MCP 让它自己看效果,输出质量提升 2-3 倍);同时开 3-5 个 git worktree 并行;/remote-control 手机遥控;/loop 定时循环和 /schedule 持久化任务;Hooks 是确定性的(绕不过去),CLAUDE.md 规则是建议性的(压力大可能跳过);/btw 插队提问不进历史;/batch 大规模迁移神器(AI 军团式编程);/model opus 切换模型省 token。
AI 进化论-花生开源的 75 页《CLAUDE CODE 橙皮书》实战手册,面向想用 AI 编程但不知道从哪开始的人。10 章内容覆盖:核心工作流(Plan/Auto 模式、权限管理)、CLAUDE.md 写法、Skills/Hooks/MCP 扩展能力、多 Agent 并行协作、Computer Use 和 Voice Mode、一章完整的从零到上线产品实战。信息源来自 Claude 官方文档、Boris Cherny 分享、吴恩达 Claude Code 课程及作者用 CC 做十几个产品的经验。
LLM Agent 正在从研究概念走向实际部署,但目前的研究呈现碎片化状态:构建方法、协作模式、进化机制分散在不同工作中,缺乏统一的方法论框架。如何系统化地理解和设计 LLM Agent 系统?
Tw93 继 Claude Code 和 Agent 深度分析后的第三篇长文,系统梳理大模型训练全链路。核心判断:2026 年拉开差距的不再是预训练本身,而是后训练、评测、奖励、Agent 训练、蒸馏。详细拆解了预训练(数据配方、过训练、tokenizer 设计)、后训练多阶段流水线(冷启动 SFT → GRPO 强化学习 → 拒绝采样微调 → 对齐 RL)、评测-Grader-Reward 反馈回路、推理模型(o1/DeepSeek-R1)、Agent 训练(Kimi K2.5 PARL、Cursor Composer 2、Chroma Context-1)、Meta-Harness(只改 harness code 就能拉出 6x 性能差距)。含大量配图和 14 篇参考文献。
开发者 Farza 将 2500 条日记、Apple Notes 和 iMessage 对话导入 LLM,自动生成了 400 篇涵盖朋友、创业项目、研究领域和喜好的个人维基文章。与「用越多越懂你」的隐式记忆不同,这是一种完全显式的记忆 artifact,透明可控。这一思路为个人知识管理提供了新范式:让 AI 用你自己的真实数据构建可检索、可阅读的个人知识库,而非依赖通用模型的模糊记忆。
从 Claude Code 泄露的 npm 包中提取 4756 个源码文件的深度拆解。核心发现:system prompt 是动态拼装的(静态宪法 + 动态当期政策),有 cache 边界设计(SYSTEM_PROMPT_DYNAMIC_BOUNDARY)优化 token 经济学;6 个内建 Agent(General、Explore 只读、Plan 只读、Verification adversarial、Guide、Statusline),实现者与验证者分离;工具调用经过 14 步 pipeline(输入校验→风险预判→权限决策→Hook→执行→post-processing);三套扩展机制(Skill/Plugin/MCP)都让模型感知到自己的能力清单。五条设计原则:不信任模型自觉性、角色拆开、工具治理、上下文是预算、生态关键是模型感知。
Karpathy 分享他用 LLM 构建个人知识库的工作流:raw/ 目录存放原始文档,LLM 增量"编译"成 .md wiki(含摘要、反向链接、概念分类文章);用 Obsidian 作为 IDE 前端查看原始数据、编译产物和可视化;wiki 达到约 100 篇文章/40 万字后,可以直接向 LLM agent 提问复杂问题。关键发现:不需要 fancy RAG,LLM 自己会维护索引文件和文档摘要。输出形式包括 Markdown 文件、幻灯片(Marp 格式)、matplotlib 图像。还会用 LLM 做 wiki 健康检查(不一致数据、缺失数据、新文章候选)。
解读 Andrej Karpathy 2026 年 4 月提出的 LLM 知识库方法论。核心类比:把 LLM 当编译器,原始资料当源代码,生成 Wiki 当可执行文件。三层目录结构:raw/(原始素材)、wiki/(LLM 编译产出的结构化 Markdown)、output/(查询结果和衍生输出)。四步工作流:摄入(Ingest)到编译(Compile)到查询(Query)到健康检查(Lint)。与 RAG 的关键区别:RAG 是查询时实时检索(临时性),Karpathy 的方法是提前编译(持久性),查询结果自动回写 Wiki。适用规模约 40 万字,不需要向量数据库。
基于 Claude Code 泄露源码抽离逻辑实现的开源 Agent SDK,用于替代官方 claude-agent-sdk。解决了官方 SDK 的两个核心问题:1)依赖不开源的 claude code 黑盒调用,出了问题没法修;2)需要创建 claude code 本地进程处理 query,开销大,不适合云端规模化。open-agent-sdk 完全兼容官方接口(只需换包名)、完全开源可定制、函数调用不依赖本地 cli 进程,适合云端高并发。MIT 协议。
Tufts 大学 Matthias Scheutz 实验室论文(将在 ICRA 2026 维也纳会议展示)表明,神经符号 AI 方法在结构化长时序机器人操控任务中,训练能耗降低至纯端到端方法的百分之一,同时任务准确率更高。该方法将传统神经网络与符号推理结合,用逻辑规则分解任务步骤,为 AI 能耗瓶颈提供了替代路径。
LLM Agent 串行执行"LLM 推理 → 工具调用"循环,工具执行占总时间 35%-61%。LLM 持有昂贵资源却被迫等待外部工具返回结果,造成严重的延迟瓶颈和资源浪费。
三大Claude Code生态AI编程框架的深度对比。Superpowers(124K⭐)通过流程纪律约束过程——强制TDD、苏格拉底式需求澄清、Subagent驱动开发。GSD(47K⭐)通过上下文隔离约束环境——每个子任务独立200K token上下文,解决Context Rot问题。gstack(57K⭐)通过多角色约束视角——23个专业角色交叉验证。核心差异在哲学立场:Superpowers=工程师思维、GSD=创业者思维、gstack=CEO思维。三者共同短板在Build阶段。
LLM Agent 如何从"通用模型"进化为"可动态扩展专业技能的模块化系统"? Agent Skills 作为一种新兴的抽象层,通过可组合的指令-代码-资源包,使 Agent 无需重训练即可按需加载专业能力。但这一范式在架构、获取、部署和安全方面面临系统性挑战。
当前最强的 LLM 编码 Agent 能否胜任工业级移动应用开发?它们在真实产品需求、多模态输入、大规模代码库上表现如何?
认知重建之后,步入Agentic Engineering的工程革命 公众号: 腾讯技术工程 发布时间: 1970-01-01 08:33:46 原文链接: 作者:rickyshou 从 speckit 踩坑到认知重建,从推翻精密架构到一个 AGENTS.md 文件重新出发。这篇讲的是"我做了什么,以及它为什么有效"。一个 AGENTS.md 文件,两个月后长成了拥有 22 个 Agent、27 个 Skill、28 个命令的工程体系。它不是设计出来的,而是被真实需求一步步逼出来的——中间经历了场景路由的建设与推翻、方法论的沉淀、多 Agent 协同代码审查的实战、运营活动配置的端到端落地,以及从一个人用到一个团队用的完整过程。如果你正在思考"AI 辅助开发到底能走多远",这篇文章给出的不是理论答案,而是一份带着所有弯路和修正的实践记录。...
让 Claude Code 与 Codex 自查本机开发环境:对比二者给出的缺失工具清单,并补齐 ripgrep、fd、fzf 等与 AI 协作相关的 CLI 工具链。
LLM Agent 领域研究碎片化严重,缺乏统一的分类框架。本文提出"构建-协作-进化"三维方法论体系,系统梳理 LLM Agent 从个体设计到多 Agent 协作再到持续进化的全生命周期。
SmartPerfetto 的 Harness Engineering 实战记录。在 Perfetto UI 加 AI 分析面板,Claude Agent + MCP 调用 trace_processor 执行 SQL 自动分析 Android trace。演进到 20 个 MCP 工具 + 158 个 YAML Skill + 三层验证。含滑动性能分析完整 session log。计划开源。
Founder Park 组织 30+ 创业者闭门讨论 Agent 生态创业机会。核心议题:Agent 支付基础设施、身份与担责、硬件环境感知(眼镜/声音)、Memory 存取难题、不要抢护城河要开新市场。关键洞察:给 Agent 造产品而非给人做工具。
AI Agent实践的知识图谱总结,涵盖四大核心主题:1)记忆系统优化——三层记忆架构(日记层→核心记忆层→向量层)、语义检索策略;2)自我改进机制——错误捕获系统、技能提取流程、任务改进周报;3)工具使用模式——OpenCLI多平台集成、多模型协作与容灾降级策略;4)框架对比——LangGraph(底层编排)、CrewAI(角色协作)、AutoGen(编程式多代理)的定位差异分析。提供了可执行的实践建议。
移动 GUI 智能体在训练中面临两个根本性挑战:1)失败轨迹学习效率低——失败轨迹占绝大多数但未被有效利用;2)长程任务的信用分配模糊——轨迹级稀疏奖励(成功/失败)无法告知智能体哪一步做错了。
当前基于 LLM 的多智能体系统能够可靠地达成共识吗?在存在恶意智能体的情况下,共识机制是否鲁棒? 这篇论文研究了一个基础问题:当多个 LLM 智能体需要达成一致决策时,它们能否可靠地完成这一任务?特别是在存在可能破坏共识的拜占庭智能体的情况下。...
Anthropic发布Claude Code auto mode,一种更安全地跳过权限确认的方式。不同于直接--dangerously-skip-permissions,auto mode通过更细粒度的权限模型和上下文感知来减少不必要的确认弹窗,同时保持安全边界。这是Agent编程工具在自动化效率与安全控制之间的重要平衡设计。
Anthropic工程团队分享长时间运行应用开发中的Harness设计经验。讨论如何在Agent驱动的开发流程中设计测试Harness,确保前端和全栈应用在长时间迭代中保持质量。涵盖自动化测试策略、CI/CD集成、以及Agent编程中的质量保障方法论。
如何将大型语言模型从单体模型转变为模块化、可动态扩展的智能体系统,同时确保安全性和可维护性。 创新点 技能抽象层:提出基于SKILL.md的技能范式,实现渐进式披露 系统性综述:从架构、获取、部署、安全四个维度全面梳理Agent Skills生态 安全治理框架:提出技能信任与生命周期治理框架(四层门控权限模型) 实证分析:26.1%的社区技能包含漏洞...
Claude Code .claude/ 文件夹的完整解剖指南:项目级 vs 全局级两个目录、CLAUDE.md(200 行以内,只写项目特有内容)、rules/(路径范围规则模块化)、commands/(自定义斜杠命令,支持嵌入 shell 命令和参数)、skills/(自动触发工作流,与 commands 区别是自动识别触发)、agents/(独立上下文窗口的子 agent,可限制工具和指定模型)、settings.json(allow/deny 权限控制)。推荐:95% 的项目只需要 CLAUDE.md + settings.json + 1-2 个 commands。
论文系统梳理基于大语言模型(LLM)的智能 Agent 系统,从方法论、应用和挑战三个维度构建统一分类体系,揭示 Agent 设计原则与复杂环境中涌现行为之间的基本联系。 创新点 方法论中心的分类法:提出 Build-Collaborate-Evolve 三维框架,系统解构 Agent 的构建、协作和演进机制 统一架构视角:连接角色定义、记忆机制、规划能力和行动执行四大核心组件,揭示设计原则与涌现行为的联系 前沿应用与真实挑战:涵盖安全、隐私、伦理等现实问题...
分析Browser Use在OpenClaw环境中的集成可行性。盘点现有浏览器相关工具(OpenCLI、web_fetch、r.jina.ai)及其限制。Browser Use的核心优势场景:需要登录的网站数据抓取(知乎/掘金/即刻/星球)、复杂表单填写、多步骤浏览器操作(Perfetto分析流程)、需保持会话状态的任务。技术限制包括需要Python环境和LLM API。
Browser Use CLI 2.0调研报告——一个为AI agents设计的浏览器自动化工具。核心特点:AI-First设计(语义理解替代CSS selectors)、自然语言驱动、持久化Daemon(50ms延迟)、支持复用本地Chrome登录态。与Playwright/Selenium对比,在AI集成和登录态复用上有显著优势。支持OpenAI/Anthropic/Google/本地模型。工作流集成潜力:SaaS控制台自动化、电商后台、招聘网站、财务录入等场景。
论文试图解决什么问题? AI 系统的黑箱问题:LLMs 的推理过程不透明,难以验证和信任 计算论证的可扩展性问题:传统 CA 依赖手工知识工程,难以应用于开放域 人机协作的失衡:当前 AI 要么完全自动化决策,要么只是提供解释,缺乏真正的协作 高风险领域的可信度:在医学、法律等领域,AI 必须提供可争议、可审查的推理 核心洞察:计算论证(CA)与大语言模型(LLMs)的融合可以实现一个新范式——论证型人机决策制定,其中 AI 与人类共同推理,而不是为人类推理。
AI 编程发展迅猛,Claude Code、Codex 等 AI Agent 已成为许多软件工程师工作时必不可少的得力助手。然而,对于如何在项目中更好地实践 AI 编程,目前仍然是一副"八仙过海,各显神通"的模样。
论文试图解决什么问题? 大语言模型(LLM)在代码生成和理解任务上表现出色(如 GitHub Copilot、GPT-4 Code Interpreter),但在深度代码推理方面仍有明显局限。具体问题包括: 表面模式匹配:LLM 往往基于关键词和表面模式,而非深度语义理解。例如,对代码 if (x > 0) return x; else return -x;,LLM 可能识别出"返回绝对值",但无法推理出"如果 x 是负数,返回 -x 的数学意义"。 推理不一致:对同一代码的不同提问,LLM 可能给出矛盾答案。例如,问"这个函数的时间复杂度?"可能回答 O(n),问"这个函数会超时吗?"可能回答"不会",但两者矛盾。 缺乏可解释性:LLM 的推理过程是黑盒,难以验证结论正确性。开发者无法判断 LLM 的结论是基于真实理解还是表面模式。...
我把我最近半年每个月氪金40刀2个账号的claude code 使用过程中,积累的一些实际经验分享给大伙。这篇文章主要围绕上下文管理、Skills、Hooks、Subagents、Prompt Caching 以及 CLAUDE.md 的设计展开,重点讨论怎样让协作过程更稳定、更可控,偏工程师技术视角的最佳实践,欢迎大伙一起最佳交流。
Tw93基于半年深度使用Claude Code的踩坑总结。提出六层架构模型,核心洞察:Claude Code不是'回答'而是反复循环的代理过程(收集上下文→采取行动→验证结果)。上下文治理是关键——200K上下文中固定开销约15-20K(MCP工具定义是最大隐形杀手,5个Server占25K tokens即12.5%)。提出上下文分层加载策略:CLAUDE.md常驻→rules按路径加载→Skills按需加载→Subagents隔离加载→Hooks不进上下文。
研究完 Claude Code 的架构之后,发现自己对 Agent 底层的理解还不够深入,加上团队在 Agent 方向已经有不少业务落地,但一直缺少一份系统梳理,所以又补了一轮资料、开源实现和轻量实验,把控制流、上下文工程、工具设计、记忆、评测和安全这些问题重新串了一遍。
X(Twitter)文章与收藏内容抓取方案调研。核心挑战:X API收费($200-42K/月)、反爬升级、Nitter失效。发现r.jina.ai作为最简方案(免费、无需API、可绕过登录限制)。对比开源工具:Smaug(AI分类+Markdown归档,最推荐)、prinsss/twitter-web-exporter(UserScript最简单)、rainux/twitter-bookmarks-downloader(自托管)。
论文标题: Towards a Science of AI Agent Reliability 精读时间: 2026-03-20 论文类型: AI agent、 可靠性工程、 评估方法 技术栈: LLM、 AI agent、 评估框架 核心问题 1.1 研究问题 如何系统化地评估AI智能体的可靠性? 1.2 问题背景 现实痛点: 能力与可靠性的脱节: 噩点:AI智能体在基准测试中表现优秀 现实:实际部署中频繁失败 原因:评估方法只关注准确率,忽略了行为的一致性、鲁…
如何系统性地理解和评估从LLM推理到自主AI Agent的演进? 为什么重要 领域碎片化: 评估基准多样、框架众多、缺乏统一术语 实践需求: 企业需要选择框架、研究者需要基准、开发者需要最佳实践 技术快速演进: 新模型新框架层出不穷 协作协议缺失: 多Agent协作缺乏标准 综述核心价值: 问题: LLM → Agent 系统性理解 方法: 基准分类 + 框架梳理 + 协议解析 效果: 60+ 基准、20+ 框架、3 大协议 意义: 首个系统性梳理综述 对 AI/Agent 工作的启示: 选择框架考虑成熟度和标准化 评估基准是持续改进的基础 多Agent协作是必然方向 领域知识 + AI 是成功关键 对 OpenClaw 的启发: 集成 MCP 支持工具扩展 使用标准基准评估 考虑多Agent架构 建立评估体系 精读完成时间: 2026-03-19...
如何将大型语言模型(LLM)从被动的文本生成器,转变为能够自主规划、行动和学习的智能体? 子问题 环境适应性:如何让LLM在开放、动态的环境中持续交互? 能力进化:如何通过反馈和记忆机制实现自我提升? 协作智能:如何从单智能体扩展到多智能体协作?
OpenClaw的全面深度调研报告,涵盖架构设计、核心组件(Agent、Memory、MCP、Skills、Cron)、运行机制、与其他Agent框架的对比分析。报告系统梳理了OpenClaw的技术栈和生态位,对理解个人AI Agent的工程化实现有参考价值。
阅读日期: 2026-03-16 论文类型: AI 智能体综述 推荐指数: ⭐⭐⭐⭐⭐ 一、核心问题 问题背景 2025 年是"AI 智能体元年",LLM 驱动的智能体系统快速发展,但领域存在定义模糊、评估碎片化、框架混乱等问题。 研究问题 如何系统性地理解、评估和构建 LLM 驱动的自主 AI 智能体? 问题意义 统一认知: 提供清晰的智能体分类和定义 指导实践: 帮助选择合适的框架和基准 推动发展: 指明未来研究方向和应用场景 二、创新点 1…
Exploring the Necessity of Reasoning in LLM-based Agent Scenarios 论文链接: 阅读日期:2026-03-15 论文类型:智能体框架 / 推理评估 一、核心问题(Core Problem) 1.1 研究背景 大型推理模型(LRMs,如DeepSeek-R1, Claude3.7-sonnet)的兴起,对传统基于大型语言模型(LLMs)的智能体框架带来了范式转变。这些新一代模型在逻辑演绎上更强大,但也带…
Q1:这项研究要解决什么问题? 核心问题:LLM 智能体无法从历史经验中学习 记忆效率低下:存储原始轨迹 Token 消耗大(15K+ tokens/episode) 缺乏抽象能力:无法从具体案例中提取通用规则 无法持续改进:每次任务从零开始,重复犯错 Q2:为什么这个问题重要?...
论文: Chain-of-Tools: Utilizing Massive Unseen Tools in the CoT Reasoning of Frozen Language Models arXiv: 2503.16779v1 精读日期: 2026-03-13 一、核心问题 研究问题: 如何让大型语言模型(LLMs)在链式思维(CoT)推理过程中高效地利用大量外部工具,包括训练时未见过的工具? 子问题: 效率问题: 如何在拥有大量工具(数千个)时高效选择合适的工具? 泛化问题: 如何处理训…
问题来源: 多轮 GRPO 引入归一化项 1/Ti 以避免偏向更长轨迹。然而,这引入了结构性偏差: 定理 1 的直觉: 给定相同上下文,如果两个行动产生: 轨迹 τS:TS 轮,最终奖励 R 轨迹 τL:TL 轮(TL > TS),最终奖励 R 模型会偏向 τS(更少轮次)。 为什么? 梯度更新中,除非 τL 的聚合贡献至少是 τS 的 TL/TS 倍,否则 ∥gt(τL)∥ > ∥gt(τS)∥。...
关于Claude悄悄更新了Skills生成器,这绝对是一次史诗级的收藏文章
一、核心问题 1.1 研究背景 大语言模型(LLM)的推理能力日益重要,但: 训练成本高:扩大模型规模需要巨额算力 性能瓶颈:传统方法(CoT、ToT)性能趋于饱和 效率问题:零阶搜索方法(如Best-of-N)样本效率低 奖励稀疏:长推理链中奖励信号难以传播 1.2 核心问题 如何在不重新训练模型的情况下,通过测试时优化显著提升LLM推理能力? 关键子问题: 能否利用梯度信息而非仅奖励值? 如何在离散token空间中进行可微优化? 推理时优化与训练时优化的联系是什么? 二、创新点 …
English 题为《创业者思考:如何做 AI Agent 喜欢的基础软件?》的文章指出,随着AI Agent迅速成为基础设施软件(Infra)的主要用户,软件的设计理念、接口和商业模式需要进行根本性重构。这一趋势已在实践中显现,例如在TiDB Cloud的生产环境中,超过90%的新建数据库集群已由AI Agent直接创建。 文章核心观点如下: 稳定且可扩展的心智模型 AI Agent所使用的软件,其核心不应是传统的UI或API,而是其背后稳定且可扩展的心智模型。AI在训练过程中已内化了大量关于底层系统(如文件系统、SQL)的稳定假设和模式.。因此,为Agent设计的软件应主动顺应这些已被模型理解、存在数十年的"古老"心智模型,而非创造全新的接口。...
Anthropic工程团队量化了Agent编程评测中的基础设施噪声问题。发现即使在相同环境下重复运行相同的Agent评测,结果也会因网络延迟、API负载、容器调度等因素产生显著波动。这对SWE-Bench、Terminal-Bench等评测的可靠性提出了挑战。提出了减少噪声的方法论建议。
2026 年 3 月 10 日 作者 黄仁勋 AI 是塑造当今世界的强大力量之一。它并非仅仅是一款巧妙的应用程序,也不是单一的模型,而是如同电力和互联网一样必不可少的基础设施。 AI 依托真实的硬件、能源和经济体系运行。它可以将原材料大规模地转化为智能。每家公司都将应用 AI, 每个国家/地区都将发展 AI。 要理解 AI 为何以这种方式发展,我们需要从基本原理进行推理,并了解计算领域发生了哪些根本性变化。
这篇论文要解决什么问题? 传统 LLM 在现实世界任务中存在三大局限: 缺乏长期记忆:无法保留历史信息和经验 无法自主使用工具:需要人工指导才能与外部系统交互 难以在动态环境中追求目标:缺乏持续推理和多步规划能力 为什么这个问题重要? LLM 的潜力远未被充分释放,目前主要用于对话而非行动 真实世界的任务往往需要多步骤、多工具、多轮反馈 如果能让 LLM 成为真正的"智能体"而非"聊天机器人",将极大扩展其应用价值 当前智能体与人类能力仍有巨大差距(42.9% vs 72.36% 任务完成率) 这篇论文为构建 LLM 智能体提供了系统化的理论框架和实践指导。...
今天这一堂课啊,我想要用 OpenClaw 这个开源的专案当作一个例子,跟大家介绍 AI Agent 是怎么运作的。我相信大家在报章杂志上,已经听过很多跟 AI Agent 有关的事情。最近呢,有一个跟 AI Agent 有关的开源专案 OpenClaw 变得非常热门。这有多热门,我想就不用解释了,因为大家在报章杂志上大概都看过吹捧 OpenClaw 的文章了。
AI 重构软件工程:OpenAI Harness Engineering,程序员不写代码的时代来了 ,OpenAI 在工程博客发布的《Harness engineering: leveraging Codex in an agent-first world》,抛出了一个颠覆软件工程界的实验结果:一支初始 3 人的工程师团队,从空 Git 仓库起步,仅用 5 个月时间,依靠 Codex+GPT-5 构建出一款拥有约 100 万行代码的 一、百万代码零手写,OpenAI 工程实验 二、驾驭工程:不是 AI 写代码,而是驯服
AI 进化论-花生发布的 98 页 OpenClaw 橙皮书,浏览量超 175 万,书签数 5713。这是 OpenClaw(龙虾)生态的重要实战手册文档。
论文: Evolving Excellence: Automated Optimization of LLM-based Agents 精读日期: 2026-03-09 阅读者: 高爷(AI 应用探索者) 一、核心问题 1.1 论文要解决什么问题? 研究问题: 如何自动化地优化基于 LLM 的智能体配置,以提升性能并降低成本? 子问题: 智能体的哪些组件可以优化?(提示词、工具描述、参数) 如何联合优化多个相互依赖的组件? 如何在巨大的配置空间中高效搜索? 如何让非专家用户也能使用优化工具?…
论文:MeKi: Memory-based Expert Knowledge Injection for Efficient LLM Scaling 精读日期:2026-03-09 定位:面向 Android / 端侧 AI / 性能优化 / SmartPerfetto 方向的深度解读 一、论文要解决的问题 1.1 真正的问题不是“模型不够大”,而是“手机端的资源结构不匹配” 在服务器上,做大模型最直接的办法就是: 增加参数量; 增加推理时计算; 用更大的显存和更强的 GPU 接住它。 但到了手机端,这套思路就开始失效: …
LangChain 创始人 Harrison Chase 分析 Coding Agent 对工程、产品、设计三大职能的重塑:PRD 流程已死(不再需要 PRD→Mock→Code 的瀑布流),瓶颈从实现转向审查,通用型人才比以往更有价值。核心框架:Builder(用好 coding agent + 产品思维 + 基础设计直觉)vs Reviewer(深度系统思维 + 快速审查能力)。关键判断:coding agent 是必需品而非可选品;好人更好,坏人更坏(差的产品想法现在能快速产生原型但浪费更多审查资源);系统思维是关键差异化能力。
OpenClaw 用户分享将 SearxNG 聚合搜索引擎接入龙虾生态(Claude Code + MCP)的方案。核心判断:LLM 叠 LLM 是反模式(Perplexica 的搜索→小模型总结→返回链路等于让实习生帮主刀医生看片子),正确做法是 SearxNG 毫秒级返回原始搜索结果,让大模型自己判断哪条值得深入。方案特点:零 API key、零成本、全隐私,聚合 70+ 搜索源,含反爬实战经验(Reddit/知乎绕过方案)。
一句话概括:如何让 LLM 在处理复杂研究任务时,能够有效利用外部工具、维护推理上下文,并生成可解释的推理路径? 问题拆解: 知识局限:LLM 训练数据有截止日期,无法获取最新信息 推理断裂:长推理链中容易丢失上下文,导致逻辑不一致 计算受限:LLM 无法执行复杂计算(如数学、数据分析) 单一能力:传统 LLM 缺乏外部工具调用能力 黑盒问题:推理过程不透明,难以调试和改进 对高爷工作的关联: 直接相关:AI Agent 开发、OpenClaw 工具集成 间接相关:SmartPerfetto 中的 AI 辅助分析 技术栈:LLM 应用、工具调用、知识管理 Agentic Reasoning 论文的核心价值在于"多智能体协作"和"结构化知识管理"。这两个概念不仅适用于 LLM 推理增强,也可以应用于各种复杂任务处理场景。...
一位非程序员的技术传播顾问用 Claude Code 在 36 小时内构建了完整的个人幕僚长系统:隔夜自动扫描日历和邮件、早晨 6:15 任务分类(绿/黄/红/灰四档)、6 个子 Agent 并行处理(邮件起草、Obsidian 客户笔记、会议安排、背景研究)、Stream Deck 一键时间块调度。核心设计原则:dispatch/prep/yours/skip 框架,系统从不发送邮件只起草,关键战略文档 100% 人工。月成本仅 $5-10 增量。文章价值在于展示了一个非程序员如何用系统思维(而非编程能力)设计 AI 自动化架构。
核心问题 这篇论文解决的是“端侧个性化”中最现实的拦路虎:微调内存开销。很多工作证明了“可以做微调”,但通常在树莓派或实验环境,离手机实用化很远。PocketLLM 的价值在于把问题拉回到真实手机场景。 论文贡献(按价值排序) 1) 明确瓶颈优先级:在端侧微调中,内存是可行性门槛;算力更多影响时延。 2) 方法选择正确:采用无导数优化绕开梯度/优化器状态,直接打掉最大内存项。 3) 实机验证:在 OPPO Reno 6 上给出可复现实验(RoBERTa-large 与 OPT-1.3B)。 关键数据的含义 RoBERT…
通过一个极端案例(LLM 重写的 Rust SQLite 实现比原版慢 20,171 倍)揭示 LLM 生成代码的核心问题:优化表面正确性而非实际正确性。详细拆解了两个关键 Bug(缺失 ipk 检查导致 O(n²) vs O(log n)、每次语句都 fsync),以及五个复合性能问题。引用 METR 随机对照试验(AI 用户慢 19%)、GitClear 分析(复制粘贴首次超过重构)等研究,论证 LLM 的 sycophancy 问题。结论:代码不是你的,直到你能自己找到其中的 bug。
Source: @aiedge_ The only guide you need to master Claude from zero. 介绍 The only guide you need to master Claude from zero. 这是从零开始掌握 Claude 的唯一指南。 Last week, Anthropic shipped its best suite of Claude features yet. If you're still using ChatGPT, this is the nail in the coffin. **上周,Anthropic 发布了迄今为止最好的 Claude 功能套件。如果你还在使用 ChatGPT,这就是压死骆驼的最后一根稻草。
AI 实践:How I'd Become a Quant If I Had to Start
By @yanhua1010 (Yanhua) · Fri Mar 06 02:40:30 +0000 2026 📊 ❤️ 145 🔁 43 🔖 259 👁️ 10,204 💬 1 📐 400 words 本文受 @aiedge 的 Claude 终极初学者指南 启发创作,结合个人一年多的实战经验。 2026 年 3 月,Anthropic 一口气释放了 Claude 有史以来最强的功能组合。Skills、Cowork、Opus 4.6。 如果你还在观望,或者还停留在"问它一个问题,得到一个回答"的阶段,这篇文章会帮你重新理解 Claude 到底是什么,以及怎么真正用好它。 我用 Claude 超过一年了。从最早的 API 到今天的桌面端、Code、Cowork,几乎每一个功能更新我都第一时间上手。...
"Tweet by @geekplux (Fri Mar 06 03:30:24 +0000 2026)" author: "@geekplux" source_tweet_url: " source_article_url: " captured_at: "2026-03-06T16:28:21.907955" language: "zh" tags: [archive, x-bookmarks] @geekplux (GeekPlux) 🕐 Fri Mar 06 03:30:24 +0000 2026 📊 ❤️ 75 🔁 16 🔖 88 👁️ 8,887 💬 1 写得很好 -《拥抱黑盒:一个研究者 All in AI 的实录与反思》
BestBlogs.dev 第 85 期以"驾驭工程"为核心关键词,提出开发者核心工作正从写代码转向构建 Agent 运行所依赖的驾驭工程体系。涵盖 GPT-5.4 发布(首次将推理、编程、计算机操作、深度搜索整合进单一模型)、Qwen3.5 小模型、FireRed-OCR、Martin Fowler 博客上关于 Harness Engineering 的系统性讨论(人在回路上 vs 人在回路中)、以及 Anthropic 设计负责人 Jenny Wen 对设计流程变革的判断。核心结论:执行力不再稀缺,稀缺的是知道该做什么以及判断什么是好的。
来源:@frxiaobei | GitHub 仓库 这个仓库值一个亿。Cursor、Claude Code、Devin、Windsurf、v0... 所有你用过的 AI 编程工具,它们的 System Prompt 全被扒出来了。30000 行指令,30+ 个产品,0 元获取。 该仓库收录了以下 AI 编程工具的 System Prompt: Augment Code Claude Code Cluely CodeBuddy Comet Cursor Devin AI Junie Kiro Leap.new Lovable Manus NotionAI **Orchids.
如果你用Claude Code,大概率用过CC Switch这个软件。 今天邀请作者直播,了解工具背后的故事(以下内容由AI生成) 2026年1月,一个叫 CC Switch 的开源项目在 GitHub 上突破了 20,000 stars。 这个数字背后,是一个大龄转行者用六个月时间写就的故事。 项目作者 Jason 之前做进出口贸易,去年才开始自学编程。 他花三个月学完了从 TypeScript 到 React 、Nodejs、Rust的基础知识,然后做出了第一个正式项目。 没有计算机专业背景,没有大厂履历,只有一个简单的出发点: 做出个满意的项目,证明自己,转行之路没有失败。 国内使用 Claude Code 的用户都知道,官方订阅门槛高,大家更多依赖中转站或国产模型。 但在不同供应商之间切换,需要手动改环境变量或配置文件,操作繁琐且容易出错。...
人文工作者没有创造世界变化,但他们却在承受世界变化。 有的时候我感觉,那些卖人工智能教程的号总是把 AI 当成一种魔法:给你一个神奇的 prompt,你就能做任何事儿。现实当然不是这样。过去的一段时间里,因为创立了 FUNES, 我们必须每天大量的通过 AI 进行生产。加之还有"《蜉蝣天地》、我自己的写作等内容生产,光靠人力已经不够了。所以我们大量的尝试如何使用 AI 辅助我们的内容市场与人文学科研究工作。 后来公司有新同事入职,我就做了个简单的 Keynote。又一次得到的贾行家老师听说后,就邀请我去做个分享。我和合伙人可达给这个分享起名《给人文工作者的 AI 使用指南》。当时是纯私下的分享,主要是一些大方向上的原则。后来又做过几次,逐渐扩充。 不过这个分享一直没公开做过,正好今年和重轻启动了《诗梳风》这档节目,所以第一次完整公开的聊了一遍。
一篇 4800+ 字的 AI 工程师全栈学习指南,提出三层架构:Prompt Engineering(微语法,控制即时指令)→ Context Engineering(乘数,MCP + Context as Code + RAG 管道)→ Intent Engineering(差异化,组织目标编码)。用 Klarna 客服 AI 的失败案例(节省 $60M 但因 intent gap 被迫重新雇人)论证意图工程的重要性。提供 7 组件意图框架和大量可复用 prompt 模板,覆盖结构化格式、Few-Shot、CoT、元提示词、上下文审计、RAG 架构设计、MCP Server 蓝图等。
Anthropic 最近在自家的教育平台 Anthropic Academy 上线了一门免费课程叫 Claude 101,总共 13 节课,从最基础的"Claude 是什么"一路讲到企业搜索、深度研究、自定义技能,覆盖了一个普通用户上手 Claude 需要知道的几乎所有东西。 这篇文章把 13 节课的核心内容做了一次系统梳理,按照课程原有的四大模块展开,帮你在最短时间内把 Claude 的能力版图看清楚。 课程开篇花了很大篇幅去讲 Claude 的设计哲学,核心就一句话: 帮你从想法的萌芽阶段就找到答案,并建立各种联系 具体来说,Claude 能跟你一起阅读文档、分析电子表格、制作演示文稿,把你脑子里的想法从"文字和幻灯片"变成真实可执行的条目、更新、行动。...
By @rwayne (Roland的思考日记) · Sat Feb 28 12:21:10 +0000 2026 📊 ❤️ 1,991 🔁 668 🔖 3,535 👁️ 1,234,504 💬 172 📐 438 words 这是一篇约8000字的深度分析。说三件事:第一,AI正在改写全球价值链的利润分配规则,物理资源的相对价值在上升;第二,澳大利亚手里有好牌,但好牌和赢之间隔着加工能力、制度设计和时间窗口;第三,对在澳洲生活的普通人来说,理解自己在价值链上的位置比关注任何宏观叙事都重要。建议留20分钟完整阅读,我知道在当下阅读长文是一个很辛苦的事情,但是保证这篇文章会让你读完有所收获,我不建议使用ai总结,会压缩文章的质量。...
By @vista8 (向阳乔木) · Wed Mar 04 04:02:05 +0000 2026 📊 ❤️ 16 🔁 2 🔖 18 👁️ 8,257 💬 5 📐 308 words 昨天苹果发了新 MacBook Pro,搭载 M5 Pro 和 M5 Max 芯片。 看起来很强大,有点心动了,现在用的是M4 Pro,也有人劝说等年底M6,哈哈。 原文: AI提炼总结下要点。 这次升级,核心在 A 先说几个数字: AI 性能比上代快 4 倍,比 M1 快 8 倍。 这个提升怎么来的? 苹果在 GPU 的每个核心里都塞了一个"神经加速器"(Neural Accelerator)。 你可以把它理解成专门处理 AI 任务的小引擎,就像你厨房里有个专门打果汁的机器,比用菜刀切快多了。...
By @wangray (Ray Wang) · Tue Mar 03 12:58:17 +0000 2026 📊 ❤️ 102 🔁 28 🔖 180 👁️ 35,261 💬 1 📐 253 words 2026 年初,美国软件股经历了一场近乎恐慌式的下跌。 导火索并不复杂。ServiceNow 在财报电话会上提到,客户正在重新评估按 seat 采购软件的方式。市场立刻意识到一个问题:如果 AI Agent 能让 2 个人干 20 个人的活,那过去按人头收费的软件公司,收入模型会不会被直接打穿? 恐慌迅速蔓延。Atlassian、Workday、Salesforce、Adobe 接连大跌,整个应用软件板块蒸发了约 2 万亿美元。华尔街甚至给这场下跌起了个名字:SaaSpocalypse。...
By @Kangwook_Lee (Kangwook Lee) · Tue Mar 03 22:06:52 +0000 2026 @Kangwook_Lee(Kangwook Lee)· 3 月 3 日星期二 22:06:52 +0000 2026 📊 ❤️ 864 🔁 82 🔖 1,960 👁️ 244,078 💬 16 📐 543 words 📐 543 个字 For non-codex models, the open-source Codex CLI compacts context locally: an LLM summarizes the conversation using a compaction prompt....
I’ve started a new project to collect and document Agentic Engineering Patterns—coding practices and patterns to help get the best results out of this new era of coding agent development we find ourselves entering. 我启动了一个新项目,专门收集和整理 Agentic Engineering Patterns(代理式工程模式)——这是一套编码实践与方法,用来帮助我们在这个“代码智能体开发”新时代中获得更好的结果。
@xin_pai88825 (Paidax) 🕐 Wed Mar 04 02:54:22 +0000 2026 📊 ❤️ 187 🔁 30 🔖 231 👁️ 21,822 💬 7 分享下我在 Vibe Coding 中,使用率最高,且最高效的几个工具,覆盖到设计稿生成,到代码交付,网页动效等👇 1、Codex 你只要输入一个需求,它就会调动多个AI智能体并行工作,无论是项目重构,还是从零构建MVP,,它都能独立完成,你无需关注代码,而是把更多精力放在架构设计和创造性问题解决上 2、Paper 这个可以让 AI 生成高质量设计稿,并实现设计与代码双向实时同步,你只需专注界面创作,AI 会自动还原为精准代码交付 3、21st 这个提供超多精美的前端组件,同时带有流畅的交互动画,只需点击复制 Prompt...
@brucexu_eth (brucexu.eth ❤️🐼🦇🔊) 🕐 Tue Mar 03 11:36:14 +0000 2026 📊 ❤️ 91 🔁 10 🔖 74 👁️ 20,264 💬 7 我这两天用真实且有深度的实际问题(一个行业市场调研)深度盲测了 ChatGPT 5.2 Thinking、Gemini 3.1 Pro、Claude Opus 4.6 的普通付费版(20 USD)账号的 Deep Research,结果开始令我大跌眼镜,后来发现不对又正常了。然后又加了 ChatGPT 5.2 Pro 的 Deep research 和 Extended Pro 做对比。...
By @jakevin7 (卡比卡比) · Mon Mar 02 15:57:31 +0000 2026 📊 ❤️ 74 🔁 4 🔖 92 👁️ 14,471 💬 1 📐 735 words 从 0 到 1,用 AI 辅助开发一个 OpenClaw 类似的 Agentic AI 工具。7 天,73 个 commit,13000+ 行 Rust。 这篇文章记录了整个过程中的思考、踩坑与感悟。 代码在 GitHub。如果你也想造一只属于自己的螃蟹钳子,欢迎 star/fork。我的 GitHub:jackwener,欢迎 follow。 起因 2026 年 2 月,OpenClaw 火了。朋友圈里人人都在聊这只龙虾——一个能在 Telegram 里跟你对话、帮你干活的 AI 智能体。...
By @yanhua1010 (Yanhua) · Tue Mar 03 07:42:43 +0000 2026 📊 ❤️ 54 🔁 8 🔖 55 👁️ 4,683 💬 1 📐 228 words 说实话,读完 Anthropic Claude Code 团队最近分享的这篇构建经验,我盯着屏幕想了很久。 不是因为技术多复杂。恰恰相反,整篇文章最让我震动的一句话极其朴素: 「你要学会像智能体一样看世界。」 这句话来自 Claude Code 的核心开发者。一个每天跟 AI 智能体打交道的人,他给出的最重要建议,不是什么架构方案或框架选型,而是一种认知方式的转变。 这让我想到一个更大的问题:2026 年了,我们跟 AI 协作的方式,是不是从根上就搞错了? 一、给 AI 一把锤子,它不一定能盖房子 Claude Code 团队讲了一个特别生动的类比。...
Agent 相关:Agent Frameworks Are Getting Squeezed
@Wuming_Mr_ (無名先生) 🕐 Mon Mar 02 10:36:00 +0000 2026 📊 ❤️ 324 🔁 95 🔖 461 👁️ 34,765 💬 17 《我在 ClawHub 折腾一周后,留下这 10 个真香技能》 先说结论:#ClawHub 真的能把 #OpenClaw 从“会聊天的工具”升级成“能干活的员工”。 但前提是——别乱装。 现在生态已经野蛮生长,上万个 Skills 里确实有宝藏,也有雷。我自己踩过两个坑(一个权限乱读文件,一个 prompt 写得离谱),所以这篇是纯个人实战后的筛选清单,不是搬运榜单。 时间:2026年3月 结论:新手按这个顺序装,基本不会翻车。 ✅ 第一优先级:保命四件套(先装这 4 个) 1️⃣ Skill Vetter(安全审计) 这玩意必须第一个装。...
By @0xIanW (𝙸𝚊𝚗 𝚆.) · Sun Mar 01 06:36:45 +0000 2026 📊 ❤️ 16 🔁 0 🔖 8 👁️ 840 💬 11 📐 73 words 声明 此为个人踩坑后总结出来的经验,仅作参考! 文章内容纯手戳,无AI生成内容,无广告,放心食用! 文章涉及到的链接会放在评论区。...
@yibie (yibie) 🕐 Tue Mar 03 01:57:42 +0000 2026 📊 ❤️ 2 🔁 0 🔖 5 👁️ 153 💬 0 重读 OpenClaw 缔造者 Perter Steinberger 的这篇雄文《Shipping at Inference-Speed》,还有很深的启发,这篇文章是 Perter 说明自己 AI 辅助编程时,他自己工作流、方法、工具选择的转变,而这个转变让他打开与 AI 协作新的大门。 Perter 在 AI 辅助编程的范式转变,是来自他亲自开发的项目 VibeTunnel。年初他花了两个月时间,尝试用Rust、Go 甚至 Zig 重写核心模块,但旧模型一直失败,最终没完成。...
@evilcos (Cos(余弦)😶🌫️) 🕐 Mon Mar 02 13:12:03 +0000 2026 📊 ❤️ 787 🔁 183 🔖 1,231 👁️ 161,327 💬 45 🦞OpenClaw 极简安全实践指南 (Security Practice Guide) 是面向 OpenClaw 的黑手册。 我尝试了其他一些方式来试图加固 OpenClaw,包括 Skill 方式,但是发现还不如给 OpenClaw 植入一个安全“思想钢印”来的有意思,这个“思想钢印”形成一个 md 文档,包含安全事前、事中、事后需要做的策略,但这里有个前提: 尽量不影响 OpenClaw 的日常使用,安全不要干扰用户体验,需要给这只🦞足够的自由。...
归档说明:本次通过 X 已登录页面抓取到长文正文大段文本。受页面动态加载限制,末尾少量段落可能存在缺失,待核实。 I’ve been using Claude Cowork since January 12, the day it launched. 我从 1 月 12 日(它上线当天)就开始使用 Claude Cowork。 In seven weeks, I’ve run over 400 Cowork sessions. I tested plugins, connectors, and slash commands, and measured what actually changes outcomes. 在 7 周里,我运行了 400+ 次 Cowork 会话,测试了插件、连接器和斜杠命令,并关注哪些做法真正改变结果。
Note: this post is about building your own agents (agentic software engineering), not about using coding agents. 注意:本文讨论的是构建自己的代理(代理软件工程),而不是使用编码代理。 By now you've probably used a few agents, or at least heard of Claude Code, Codex, or OpenClaw. Ever wondered what it takes to build your own? 到目前为止,你可能已经使用过几个代理,或者至少听说过Claude Code、Codex或OpenClaw。
OpenAI 内部有个团队,5 个月,3 个工程师,几乎不靠手写代码,做出了一个内部产品。 约 100 万行代码,约 1500 个 PR,人均每天 3.5 个 PR。 这是什么概念? 正常工程师一天能稳定交付一个 PR,已经算高效。3.5 个 PR,意味着产出被直接拉高到了另一个数量级。更夸张的是,这些代码大部分都不是工程师亲手敲出来的。 这篇文章是 OpenAI 工程师写的,讲他们怎么用 Codex 从零构建一个叫 Harness 的内部工具。读完之后,我沉默了挺久。 因为它把一件正在发生的事,讲得非常清楚: 工程师的核心工作,正在从写代码,转向设计让 Agent 持续工作的环境。 这句话很重要。 这不是一句夸张的口号,也不是某种抽象比喻。它描述的是一个已经开始发生的角色迁移。...
MobileAgent is Alibaba Tongyi Lab’s GUI-agent project family, covering mobile, desktop, and browser automation through the GUI-Owl model line and multi-agent workflows. MobileAgent 是阿里通义实验室的 GUI Agent 项目家族,通过 GUI-Owl 模型系与多 Agent 工作流覆盖移动端、桌面端与浏览器自动化。...
memU is a memory framework designed for always-on proactive agents, with the goal of reducing token costs and preserving long-term user context across sessions. memU 是一个面向 24/7 主动式 Agent 的记忆框架,目标是在跨会话场景下降低 token 成本并保留长期用户上下文。...
这条长推文将 Agent 工程映射为分布式系统工程,强调 durability、isolation、governance、persistence、scale、composability 六个支柱,适合作为团队架构评审清单。 @Stv_Lynn (Steven Lynn) 🕐 Mon Mar 02 01:55:50 +0000 2026 📊 ❤️ 4 🔁 1 🔖 5 👁️ 669 💬 0 Agno 创始人 Ashpreet Bedi 发了一篇长文: Agent 工程 = 分布式系统工程。这些问题(持久化、隔离、容错、扩展)我们已经解决了几十年,只是 AI 行业还没把这些经验带过来。
It is hard to communicate how much programming has changed due to AI in the last 2 months... coding agents basically did not work before December. 过去两个月里,AI 对编程方式的改变非常剧烈;在作者看来,去年 12 月前后是关键拐点,编码代理开始真正可用。 Boundary: this is expert observation, not a controlled benchmark; validate with your own repo metrics. 边界:这是专家经验判断而非严格对照实验,落地时应先用自有仓库指标验证。
这是一个一线使用者的一个月复盘,核心结论是:OpenClaw 当前更适合有技术维护能力、愿意投入基础设施与 API 成本、并能容忍不稳定性的用户。 @LotusDecoder (LotusDecoder) 🕐 Mon Mar 02 00:54:09 +0000 2026 📊 ❤️ 52 🔁 3 🔖 27 👁️ 5,479 💬 11 使用了一个月的openclaw, 发现适合的人群相对较窄。 有一定技术维护能力,部署和维修都需要动手,包括请得到人和使用 claude code 来拯救。 对错误、掉线、杀自己包容性大,经常卡顿是很恼火的。 愿意投入,硬件上隔离运行,云服务器,容器,独立mac。软件上花钱买优质api token。...
Ruflo (formerly Claude Flow) positions itself as a production-ready multi-agent orchestration framework, with claims around 60+ specialized agents, swarm coordination, consensus, and self-learning loops. Ruflo(前身 Claude Flow)将自己定位为生产可用的多 Agent 编排框架,强调 60+ 专用代理、蜂群协作、共识机制与自学习闭环。
OpenSandbox is a general-purpose sandbox platform for AI applications. It provides unified sandbox lifecycle and execution APIs, and supports coding agents, GUI agents, evaluation, and RL training scenarios. OpenSandbox 是一个面向 AI 应用的通用沙箱平台,提供统一的沙箱生命周期与执行 API,覆盖编码 Agent、GUI Agent、评测和强化学习训练等场景。
这篇 X Article 介绍了通过 MemOS Cloud 插件给 OpenClaw 增加外部记忆层,以降低 token 消耗并提升跨会话记忆稳定性,并进一步讨论了多 Agent 共享/分层记忆的协作模式。 By @lxfater (铁锤人) · Mon Mar 02 04:03:00 +0000 2026 📊 ❤️ 9 🔁 1 🔖 17 👁️ 612 💬 1 📐 163 words 你在用小龙虾时候有没有遇到这么个问题: 小龙虾用久后,它老是记不住重要的东西,反而一些无关紧要的事情记得贼清楚。更要命的是,明明还搞点小任务,但是没过几天账单就爆炸了。 究其原因,是 OpenClaw 的记忆机制的问题 他每次对话都会把之前的对话附带上去,比如说像下面这个老哥,让 AI 写个代码。...
@yyyole (沐阳) 🕐 Mon Mar 02 02:09:52 +0000 2026 📊 ❤️ 27 🔁 3 🔖 14 👁️ 14,627 💬 16 AI Robot Phone!! 听说今年下半年,会在国内首发! 很久很久,没有看到手机硬件上, 有如此让人耳目一新的创意了!! 1、实时感知,与现实世界互动,短片里看起来,实用性趋0,可玩性拉满,但前景辽阔!! 2、手机自带云台相机,可玩性和实用性双双拉满! 3、AI自动创意构图拍照,不新鲜! 4、硬件有了,就看软件如何玩出花样! 视觉/语言交互+AI智控手机,应该是下一代AI智能手机新范式了!
从 MCP 到 SKILL(II):把调用层补齐 我在《从 MCP 到 SKILL:关于 Agent 扩展机制的思考 》里提过一个很直觉的分工: MCP(Model Context Protocol)更像“标准插头”,解决连接标准化 SKILL 更像“操作手册 + 工作流”,解决编排、状态与闭环 当时我以为,这两者拼起来就会很自然。 但真把它落到工程里,很快会发现:缺的不是理念,而是最后那一段“可执行、可迁移、对 Agent 友好”的、适合写进 SKILL 的通用调用入口。 首先没有一个通用的 SKILL 友好的 MCP CLI。理论上可以用 curl 调 MCP HTTP,但对 Agent 来说参数、认证、错误处理都太复杂,稳定性差。于是很多服务放弃了 MCP,直接退化成“纯 REST 接口”。...
There's a quiet shift happening right now. Some business models are about to explode. Others are already dying, they just don't know it yet. Here's how to tell the difference. 现在正在悄然发生转变。一些商业模式即将爆发。其他人已经死去,只是他们还不知道而已。以下是如何辨别差异的方法。 Two years from now, the business landscape is going to look completely different. 两年后,商业格局将完全不同。
约 8000 字深度分析 AI 重塑全球价值链利润分配。微笑曲线正在被 AI 改写:S&P 500 无形资产占比从 1975 年的 17% 翻转到 2025 年的 92%。AI 推理成本 18 个月降 280 倍。杰文斯悖论在这一轮仍然成立但溢价分配方向彻底改变。"会写代码"从稀缺高薪技能变成廉价可复制能力。蛋糕变大了但切蛋糕的刀换了方向——切向物理世界(矿/电/芯片)。
@DLKFZWilliam2 (独立开发者William) 🕐 Sun Mar 01 01:05:49 +0000 2026 📊 ❤️ 56 🔁 11 🔖 101 👁️ 3,663 💬 1 该项目在github上: 链接: A Python-based mobile automation agent that uses Qwen3-VL vision-language models to understand and interact with Android devices through visual analysis and ADB commands.
从 MCP 到 SKILL:关于 Agent 扩展机制的思考 去年 MCP 爆火,大家一度有种感觉:只要把工具都接进来,AI Agent 就会“活”过来,像一个长了手脚的人,什么都能干。 如果把 LLM 看作大脑(智力引擎),tool call / function call 就像让它能指挥四肢:模型填参数,代码去执行,再把结果喂回去继续推理。 MCP(Model Context Protocol)把这套机制做成了“标准插头”:以前各家服务各自一套 SDK + API,你要给 Agent 封装工具,就得处理语言、依赖、鉴权、返回格式,复杂度会指数上升;MCP 的价值是把“接入”这件事工程化、标准化。 所以当时最乐观的推论很自然:只要 MCP 工具够多,Agent 就有无限多的手脚,什么都能干了。 但很快大家就撞墙了。...
文章较长 感谢阅读 或者直接把这篇推文的链接扔给你的龙虾 最推荐看本文的「后话」这一部分 前言 如果你也用OpenClaw 也在不停按照X上各种大佬的架构给它「优化」 (三层架构/AI Agent的第N代/异步任务处理系统/龙虾的自我迭代...) 那你一定对下面的场景不陌生: 装了一堆架构,全是空文件夹📁 熟悉吗?那些架构确实被引进了 或者说 那些优质架构的目录确实被引进了 然后就没有然后了。 文件夹空空如也,Agent 根本不会主动往里面写东西。你以为搭好了骨架,结果只是搭了个空壳。 你的龙虾不会主动用这些架构 你告诉 🦞:「你整理一下我们的东西吧哈哈 记得用新架构噢」。 🦞 说:「好的!」 然后它继续把所有东西都塞进一个巨大的 context 里,完全无视你精心设计的架构。 为什么?我也不知道。...
CC Switch 是 Claude Code 的供应商管理和切换工具,GitHub 2 万 Star、130 万下载。作者 Jason 36 岁从进出口贸易转行编程,花 3 个月学 TypeScript/React/Node/Rust 后做出第一个项目。核心设计理念"侵入性最小"——即使卸载也不影响正常使用。从 Electron 重构为 Tauri(从 80MB→更轻量),编程语言从 TypeScript 转 Rust。第一版一周完成。
By @RichTerry123 (Terry) · Sat Feb 28 06:58:30 +0000 2026 📊 ❤️ 77 🔁 18 🔖 157 👁️ 15,346 💬 2 📐 33 words 这是他最新一篇备忘录的标题叫做AI Hurtles Ahead,翻译过来是AI疾驰而来。 巴菲特曾给予他极高的评价:“当我看到邮件里有霍华德·马克斯的备忘录时,我总是第一时间打开阅读。我总能从中学到东西。” 对他这篇备忘录的内容,我做了个梳理,分享给大家: 1.对AI的理解:他惊叹于Claude输出的内容,认为大众不要把 AI 模型理解为一个检索数据并加以复述的搜索引擎,它实际上是一个能够综合数据并基于数据进行推理的计算机系统。 AI 是真实存在的,过去,金融行业,乃至很多知识密集型行业的核心竞争力很大一部分建立在获取和处理海量信息的能力上。...
将 Agent 上下文管理类比 Rust Arena Allocator:预留大块连续内存→每次分配指针向前推→所有分配连续排列→整块一起释放。Agent 上下文窗口就是一块有限的、昂贵的内存空间。Prompt Engineering 的核心不是写好文字,而是内存管理。Arena 的核心特性(Append-only、空间局部性、批量释放)直接对应 Agent 上下文设计原则。Pruning 和 RAG 是技巧不是原则。
Claude Code 核心开发者分享构建经验。设计 Agent 工具的关键框架:想象自己面对数学题——纸笔(基础但受限)→计算器(更好但需知识)→电脑(最快最强但需技能)。工具要匹配 Agent 能力。AskUserQuestion 工具的三次迭代:修改 ExitPlanTool(Claude 困惑)→修改输出格式(不可靠)→独立工具(成功,可引导结构化输出、确保多选项、支持 SDK/Skill 集成)。
Karpathy 用 1 小时 vibe code 了一个个人有氧运动追踪仪表板(~300 行代码),Claude 逆向了 Woodway 跑步机云 API。核心观点:1)App Store 的离散应用长尾概念已过时,LLM Agent 可以当场即兴创建定制应用;2)行业需要重配置为 Agent 原生的传感器和执行器服务。现在 1 小时完成的事,2 年前需要 10 小时,但理想状态应该是 1 分钟。99% 的产品还没有 AI 原生 CLI。
前 Meta AI 负责人、现 Airbnb CTO Ahmad Al-Dahle 的观点。AI 不会取代软件工程师但职业将剧烈变化。三个转变:工程师-产品思考者崛起(理解为什么比如何实现更重要)、系统思维胜过代码流利度(跨基础设施/分布/激励/二阶效应推理)、品味作为技术技能(工具变好后有品味的工程师价值只增不减)。代码始终是媒介,判断力始终是手艺。
Block 裁 4000 人的三个观察:一、"金色寻回犬"时代结束——听话勤快按流程做事的人恰是 LLM 最强能力;二、薪资正在两极分化且速度吓人,AI coding 占比从 20-30% 到接近 99%;三、未来是能做判断的人 vs 只能跑流程的人的分野。作者前微软 5 年员工的一线观察。
24+ 小时调试后,在两台 Mac Studio M4 Max 上通过 Exo + Thunderbolt 5 RDMA 实现了 Qwen3.5-122B-A10B 的完整池化运行。持续吞吐约 52 tok/s,并发 c=2 稳定(p95 约 10.37 秒)。提供了完整的 Day-0 实操指南,包含精确命令与失败检查关卡。
Jack Dorsey 裁员 4000+ 人(10000→6000)的内部备忘录。不是因为公司亏损(毛利在涨),而是 AI 让更小更扁平的团队成为可能。选择一次性到位而非分批裁员。对未来团队的定位:以智能为核心构建公司的一切方式。50,414 likes / 60M+ views。
40 天实践:Agent 变聪明靠的不是调 prompt 或换模型,而是持续对话反馈让它们自己写下来。三层操作系统:内容 Agent 学会了作者的声音、研究 Agent 每天交付 7 个值得读的故事、8 个 Agent 24/7 运行。核心是越来越丰富的 markdown 文件栈。同一模型第 1 天和第 40 天输出质量天差地别。
Claude Cowork 的完整设置指南。Cowork 不是聊天机器人——它在你离开时帮你完成工作。作者三年构建 AI 工作流的经验总结,覆盖每个功能、每个设置步骤、第一个提示词、以及诚实的不足之处。Cowork 成了每天早上打开的第一件事。17,837 likes / 81,645 bookmarks。
Thariq 原文的中文翻译。构建 agent 框架最难的部分是设计行动空间。工具设计要匹配 Agent 能力(纸笔→计算器→电脑的类比)。AskUserQuestion 工具三次迭代:修改 ExitPlanTool(Claude 困惑)→修改输出格式(不可靠)→独立工具(成功)。最终方案可引导结构化输出、确保多选项、支持 SDK 集成。
写代码的模型永远不负责审自己的代码。Claude Code 跑 Opus 4.6 写完功能,通过 MCP 协议接入 Codex MCP Server 让 Codex 审查。审完列问题,回到 Opus 逐个修,循环到没新问题。原理:自己写的东西自己审永远有盲区,换一个不同思路的 AI 审你的 AI。成本多一轮对话的钱但省掉的返工时间远超。
6551 团队开源了积累一年的数据基础架构:X 数据 + 全网 50+ 实时新闻 + 链上数据的 MCP 和 Skill。Agent 可直接连上 X 数据和全网新闻源,24h 监控分析并触发 Telegram 提醒。无需配置 API 密钥。几分钟部署。
深度解析谷歌版「豆包手机」:Android 的统治者下了一盘什么棋?|AI 器物志 原文链接: 未知错误 未知错误,请稍后再试
完整的编码 Agent 软件开发工作流。先澄清目标、从对话抽取规格、设计拆成小段落确认。确认后生成遵循 TDD/YAGNI/DRY 的实现计划,再通过子 Agent 执行并进行分阶段审查。Claude 可自主工作数小时不偏离计划。支持 Claude Code、Cursor、Codex、OpenCode。技能自动触发,不需要特殊操作。
自适应网页抓取框架,从单次请求到全量并发爬取。解析器能在页面结构变化后重新定位元素,抓取器提供反反爬能力(如 Cloudflare 绕过)。Spider 系统支持并发、多会话路由、断点续跑、代理轮换和流式输出。适合生产级数据流水线。支持 MCP 集成。
macOS 上 OpenClaw 运行报错的系统性排查指南。Gateway 是中枢神经,所有消息收发/LLM 调用/工具调度都经过它,挂了=系统瘫痪。覆盖 Gateway 启动失败排查(Node.js 版本、端口占用、launchd 服务注册、JSON 配置)、各类报错的根因分析。适用 macOS Apple Silicon/Intel。
字节跳动开源 DeerFlow 2.0,基于 LangGraph 和 LangChain 完全重写的超级 Agent 运行底座。可编排子 Agent、记忆、工具与沙箱以完成长链路多步骤任务。核心能力:任务分解(主 Agent 并行派发子 Agent)、中间结果汇总、跨会话持久化记忆。默认提供文件系统、技能、执行环境。
Anthropic CEO Dario Amodei 在印度班加罗尔的深度访谈要点:2019 年 GPT-2 阶段就看到 scaling laws;2022 年 ChatGPT 发布前 Anthropic 有 Claude 早期版本但选择不发避免军备竞赛;技术安全比预期好但社会认知比预期差;写代码率先被 AI 替代;创业者不要做 Claude 套壳要建壁垒;看好 AI 驱动的生物科技。Anthropic 估值 3800 亿美元,年化收入 140 亿。
本来是想图省心给所有人买iPhone 17 Pro Max星光橙的,但是有小伙伴说自己的手小握不住,不想要Pro Max,有些又说只想要银色不想要橙色,所以我们还提前以问卷的形式做了一下小小的调研,确保大家都能拿到自己喜欢的机型。
系统拆解 2026 年初 AI 变化的四层结构:大脑(推理模型→agentic能力→agent team 内化到模型)、手脚(工具/沙箱/浏览器)、组织(多 Agent 协作与上下文专业化)、进化(数据飞轮:模型→agent→反馈→更强模型)。核心规律:模型与脚手架关系是循环,模型先出→agent→multi agent→内化到模型。AI 自我迭代已开始(Claude Code 用 Claude Code 迭代自己)。应用层方向:通用/垂直 Agent、Agent 基建、多模态内容。
翻译 Sara Imari Walker(亚利桑那州立大学天体生物学家)的文章。核心追问:科学到底是什么?如果连这个问题都没搞清楚,讨论 AI 能否"做科学"就是认知错误。AlphaFold 预测结构但不解释物理机制。关键不是 AI 能否执行方法步骤,而是科学产生知识的方式是否包含更多。引入"绑定问题"、"意识的困难问题"等概念,探讨科学作为人类文化系统的深层本质。
HR 出身的非程序员,用 Obsidian + Claude Code 搭建了复杂个人工作台。506 次 git commit、85+ AI Skills、3 个生命周期钩子、435 条自动 session logs、7 个平台同步分发。核心理念"File over App":文件属于你,系统和 AI 是过客。原料从四面八方进来,经过流水线加工,变成成品出去。强调本地优先、数据自主。
Cursor CEO 定义 AI 编码三个时代:第一时代 Tab 自动补全、第二时代同步 Agent(提示→响应循环)、第三时代独立云 Agent(长任务自主完成)。Cursor 超 1/3 的 PR 由云端自主 Agent 创建。云 Agent 在独立虚拟机运行,交付日志/视频/预览而非 diff。人类角色从逐行指导变为定义问题和设置审查标准。
OpenClaw 底层的编码 Agent Pi 详解。Pi 由 Mario Zechner 开发,理念是让 Agent 自己扩展自己而非下载扩展。刻意不支持 MCP(可用 mcporter 桥接),强调代码生成和运行。核心设计:会话是树结构(可分支/回退/导航),内置热重载让 Agent 自己写代码→重载→测试循环。多模型支持、可移植性优先。扩展可注册工具给 LLM 调用,也可渲染自定义 TUI 组件。
长文系统分析 2026 年 AI 趋势。模型两条线:大语言模型智力线(推理模型→agentic能力→agent team内化)和多模态生成线(技术门槛被内化到模型)。数据飞轮驱动模型持续变强。应用层机会:通用/垂直 Agent、Agent 基建(API/MCP/Skills)。多模态创作门槛消失(ComfyUI 不再需要学)。对个人建议:判断力 > 代码流利度,品味是真正的护城河。
通过自研 modelbox 工具模拟模型提供商,抓取 OpenClaw 发给模型的完整系统提示词(约 16K token/34062 字符)。逐一解析:第一段源码硬注入(身份、工具清单、安全规则、子代理机制),第二段工具调用风格与安全约束,第三段 CLI 命令参考,第四段 skill 加载机制。帮助理解系统提示词结构以进行瘦身优化。
Perplexity CEO 的核心观点:没有一个模型家族能独立做到最好,多模型编排远超任何单一模型。介绍了内部实验 ASI(后端 19 个模型),本质上是一台计算机——有文件系统、shell、浏览器。类比 Chromebook:Google 没错理解网络是最重要的部分,但低估了网络的 READ 功能。AI 是把 READ 能力真正补上的关键。
OpenClaw 实时监控与控制中心,基于 Next.js、React 19 和 Tailwind CSS v4。部署在 OpenClaw 工作区内,直接读取主机配置/代理/会话/记忆/日志,不需额外后端。核心模块:系统监控、代理看板、成本追踪、定时任务管理、活动流、记忆/文件浏览、全局搜索、通知中心、只读终端。强调"OpenClaw 本身就是后端"。
面向已完成基础配置的 OpenClaw 用户的中高级教程。覆盖:AGENTS.md 工作规范、记忆优化(构建可靠记忆体系)、子 Agent 团队协作、Cron 自动化、Skill 开发、多渠道部署(全平台接入)、性能调优、实战练习清单、疑难解答。系统性的进阶指南。
独立开发者用 OpenClaw + Codex/Claude Code 搭建 AI Agent 系统的完整案例。双层架构:OpenClaw 编排层持有业务上下文,Agent 执行层专注代码。8步从需求到 PR 合并,含自动监控、三 Agent Code Review、改进版 Ralph Loop(动态调整 prompt)。实测:单日 94 次提交,30 分钟 7 个 PR,月成本 $190。瓶颈是 RAM 不是 token。
核心观点:prompt 工程不是写好的文字,而是精确知道自己想要什么。差距在于你脑中的模糊想法 vs 你能精确表达的程度。文章覆盖了从心理模型到输出精度的完整方法论,强调"看不见的工作"——在坐下来提示之前,先建立清晰的意图模型。
面向非程序员的 Codex 解释:大多数计算机工作是手动操作软件(点击菜单、复制粘贴、拖文件),理论上都可自动化但需要写代码。Codex 是 OpenAI 的编码 Agent,用自然语言描述需求,它能拆步骤、选工具、写代码、运行、交付结果。不再是程序员的专利,而是通用数字工作工具。
劝退文:99% 的人不需要自动化,更不需要 OpenClaw。连 chatbot 都玩不明白就想搞多 Agent 协作,连提示词都写不好就想自动决策。OpenClaw 是过渡产品,几大 AI 公司会推出更强大方案。与其烧 token 折腾 OpenClaw,不如先让 AI 介入日常工作。先学走再学跑。
OpenClaw 最大问题不是不会装,而是装完没真实场景。三步前置动作:第一阶段先把 AI 当思考伙伴,做时间审计(一周每分钟记录);第二阶段先用 Manus、n8n、Zapier 等低门槛工具验证哪些流程跑得通;第三阶段再在低风险环境部署 OpenClaw,迁移已验证流程,评估 ROI。一句话:先想清楚,再验证,最后才扩张。
Agent Reach:一句安装指令快速获得 Web、Twitter/X、YouTube、Reddit、B站、RSS 等读取与搜索能力。免费优先、可替换渠道实现、带 doctor 诊断命令。每个平台独立模块,便于后续替换底层工具。降低 Agent 联网能力搭建门槛。
直接让 Claude Code 按 Obsidian Minimal Theme 风格改 CSS 与布局,约半小时完成。关键要点:先给 AI 明确目标风格、限定可改范围(CSS/布局/装饰)、人工验收可读性/层级/移动端。低成本提质的高 ROI 实战经验。
以 OpenClaw 为编排层,Codex/Claude Code 为编码执行层的双层架构。编排助手 Zoe 负责分配任务、生成提示、跟踪进度、Telegram 通知。核心思想是上下文专业化:编码 Agent 拿代码上下文,编排层掌握业务上下文。94 次提交/日峰值,30 分钟 7 个 PR。流程包含隔离 worktree、tmux 控制、JSON 任务注册、周期巡检、三模型审查(Codex/Gemini/Claude)。
规范驱动开发比临时提示词更好,但若规范是静态文档仍会失败。过期设计文档误导工程师,过期规范误导 Agent 自信地做错事。Augment Code 的解法是"共维护":人和 Agent 都从同一份规范读取并回写更新。执行前由协调 Agent 拆任务,执行中 Agent 持续回写新发现。核心结论:既然 Agent 能写代码,也应该维护计划本身。
面向"上下文工程"的开放技能库,管理模型看到的全部输入(系统提示、工具定义、检索文档、消息历史、工具输出)。核心原则:按需加载(启动只加载技能索引,命中任务才加载全文)、保留高信号信息压缩低价值 token。方法平台无关,可迁移到 Claude Code、Cursor 等框架。示例覆盖多 Agent 协作、LLM 评审体系、长期记忆系统。
主任工程师级自主 Agent 角色设定模板,覆盖软件全生命周期而非仅写代码。以系统级操作守则保障交付质量、逻辑严密性、执行稳定性。借鉴 Claude Code 实践,强化工程流程与规范沉淀。适合用于团队 Agent 提示词基座、工程治理标准化、复杂任务自动化执行框架。
介绍 Conway Agent 部署方法。Conway 把服务器(Conway Cloud/Sandbox)、AI 推理(Conway Compute)和域名封装到统一平台,使用 Credit 计费。定位为完全自主运行的 AI 系统。内容较简短,为归档节选。
OpenClaw 84 天达 20 万 GitHub Star。文章核心视角偏实战:解释 OpenClaw 与新一代 Claw 类系统底层如何构建,以及真实部署里哪些架构选择最关键。用户在旧游戏电脑上运行自治 Agent、自动化个人工作流。内容为摘要归档。
情景推演(非预测):假设到 2028 年,失业率达 10.2%,标普 500 自高点回撤 38%。核心概念"幽灵 GDP":AI 驱动的产出计入国民经济账户但不流入真实经济循环。形成"人类智能替代螺旋"——没有自然刹车机制的负反馈循环。AI agent 几周内复刻中型 SaaS 产品核心功能,SaaS 定价权受压。单个公司应对理性,集体叠加灾难性。
把"上下文管理"从一次性对话输入转为可持久化的文件系统结构,让 Agent 读写统一的项目记忆与规则,减少重复提示、降低上下文漂移,提高长期任务稳定性。内容为摘要归档。
围绕 Agent 失忆、记忆可发现性、长期上下文维护与工程化落地展开,强调通过结构化记忆机制降低重复输入和推理成本。适合作为 OpenClaw/Agent 记忆系统设计的实践参考。内容为摘要归档,待补全全文。
这是「写作提示词全家桶」系列第2篇,共7篇。上一篇讲了底层逻辑,这一篇直接给你两套拿走就能用的公众号写作提示词。
宝玉老师分享的去 AI 味方法:给 AI 一份持续更新的"写作风格 Skill"(几十到上百行),定义用词偏好、句式习惯、禁止清单、标点规范。具体步骤:1)用 AI 分析自己满意的原创文章生成初版 Skill;2)用 Skill 写一篇文章后自己逐句修改;3)把 AI 原文和修改版发给 AI 分析差异规律并更新 Skill;4)反复迭代,第一次改一半以上,第三次核心风格开始对,第十次 AI 的输出比你自己写的还像你的风格。核心观点:提示词是死的,Skill 是活的,越用越精确。
在 2022 年以前,我一直相信,在这个行业里,只要技术栈钻得深,比如精通三方框架、熟悉 Android Framework、搞定性能优化,就能端稳饭碗。
借助 AI Coding 快速打造 AI Agent 系统 公众号: 阿里云开发者 发布时间: 1970-01-01 08:33:46 原文链接: 一、前言 在AI驱动的电商运营时代,如何让运营同学通过自然语言快速生成个性化购物场景,并自动关联优质商品搭建会场,成为提升运营效率的关键问题。购物场景生成AI Agent应运而生,通过智能化的场景生成和商品匹配,让运营可以用一句话,就能自动生成包含场景标题、描述、一二级标签的完整购物场景,并智能查询热点知识库,关联相关商品,对商品进行信息补全和相关性过滤,最终快速对接会场搭建来产出一个完整的场景导购会场。 然而,随着业务复杂度的提升和技术栈的演进,原有基于低代码的流程编排方案逐渐暴露出扩展性和灵活性的瓶颈。...
论文 OS-R1 提出用 RL Agent 自动配置 Linux 内核 18000+ configuration 选项。Rule-Guided Agent 设计,两阶段训练(Warm-up + Exploration),3000+ 配置样本数据集。在 Nginx/PostgreSQL/Redis 上取得性能提升。但生产环境极少为调优重编译内核,严重脱离工程实际。
Sam Altman 在 OpenAI 开发者 Town Hall 上的坦率对话,23个话题。承认 GPT-5 写作翻车、大幅放缓招聘、警告生物安全。核心观点:软件工程杰文斯悖论、GTM 仍是最大挑战、多 Agent 编排界面未定、AI 大规模通缩。个性化软件是未来方向。
Google 宣布 LiteRT(TensorFlow Lite 的演进版)成为端侧 AI 的通用框架。相比 TFLite,LiteRT 提供 1.4x GPU 性能提升、新增 NPU 加速支持、统一跨平台工作流(Android/iOS/macOS/Windows/Linux/Web),并通过 ML Drift 引擎支持 OpenCL/OpenGL/Metal/WebGPU。NPU 方面已与 MediaTek 和 Qualcomm 完成生产级集成,速度最高可达 CPU 的 100 倍、GPU 的 10 倍。同时支持 PyTorch/JAX 模型转换和 Gemma 系列模型的高效部署。
Claude Code 浏览器自动化方案,怎么选? 在Claude Code中,最好的浏览器自动化方案是什么? 昨天和几位创业的朋友吃饭,席间讨论了一个问题:"在Claude Code中,最好的浏览器自动化方案是什么?" 在刚有MCP的时候,我写过一些浏览器自动化文章,那时,最好用的Playwright MCP和一些第三方的浏览器自动化工具,还不算稳定。 (参考:所有的RPA可以去死了!Claude Code可以只靠口喷完成一切!) 大半年过去了,现在最流行、稳定、专门针对Agent的浏览器自动化方案已经有了三个明显的头部:Agent Browser 、Devtools MCP 、Play...
谁懂啊!作为天天和Android Studio打交道的开发者,我们对AI辅助开发的需求就一个:灵活、高效、不添乱。
我在知乎发现了一篇值得思考的文章,一起来看看吧。 在性能优化领域,竞品分析是一个永恒的话题。然而,现有的分析手段往往存在较大的局限性: • 指标维度浅层化 :大多局限于帧率(FPS)、内存占用、CPU 频率及利用率、线程统计等硬件或系统层面的指标。虽然可以通过截帧分析渲染管线,但对于 CPU 端的具体开销(如 UI 逻辑、战斗系统、渲染提交等模块的具体耗时)难以进一步拆解。 • 技术壁垒:在缺乏源代码和符号表的情况下,往往难以洞察竞品底层的具体技术实现。
摘要: 当我们在《赛博朋克2077》的夜之城中流连忘返,或者惊叹于 ChatGPT 生成的精妙回答时,很少有人意识到这背后正在进行着怎样规模的数字狂欢。为了支撑现代图形渲染和人工智能,GPU 架构经历了一场从"方阵士兵"到"特种部队"的静默革命。本文将深入解剖 GPU 的微观架构,从 SIMD 的物理局限到 SIMT 的逻辑突围,并揭示 GPGPU 是如何凭借"极度并行"的哲学,成为现代 AI 产业的心脏。
GitHub - vercel-labs/agent-browser: Browser automation CLI for AI agents Browser automation CLI for AI agents. Contribute to vercel-labs/agent-browser development by creating an account on GitHub. Headless browser automation CLI for AI agents. Fast Rust CLI with Node.js fallback. npm install -g ag...
Anthropic 发布 "Cowork" 标志着人工智能产品战略的一个关键转折点(Cowork: Claude Code for the rest of your work^\[1\]^),它不仅是一个针对非编程人员的新工具,更宣告了 Anthropic 从单纯的模型提供商向综合性代理生态系统(Agentic Ecosystem)协调者的转型。我也算架构演变的见证者了,从早期写 MCP、到前段时间写 Skills(深度解析:Anthropic MCP 协议、从 Prompt Engineeri...
English Demystifying evals for AI agents \ Anthropic Anthropic emphasizes that evaluating AI agents is a complex but crucial process, requiring a different approach than traditional single-turn language model evaluations due to agents' multi-step behavior, tool use, and potential for unexpected solutions....
AI Coding In-Depth Sharing: How to Truly Utilize Tools, From Principles to Practice This article systematically deconstructs AI programming tools from underlying principles (Token, tool calling, Codebase retrieval, Merkle Tree) to practical applications (dialogue optimization, best practices, tool alternatives), guiding developers to efficiently utilize AI-assisted coding....
Claude Code 2.1 发布:一口气更新了80多个功能特性 最近这一周我几乎都是每天10小时+的在疯狂用Claude Code,又找到了一些做产品的乐趣。 最近这一周我几乎都是每天10小时+的在疯狂用Claude Code,又找到了一些做产品的乐趣。尤其是昨天「小猫相册」app在AppStore上线后,我又收到不少反馈,已经在继续疯狂🤪改bug、修体验了。 然后,用着用着,突然发现Claude Code 已经跳到2.1版本了。 我去查了下,他们是昨天(1月7日)发布的2.1.0,今天又跟了个2.1.1小修复。2026年第一个大版本,这次更新的内容多得离谱,changelog里列了8...
Claude Code 之父自爆:Claude Code 的终极用法 你可能听过 Claude Code,甚至用过它来写点代码、改点文档。但你有没有想过:如果 AI 不是“临时用一下的工具”,而是你开发流程中的正式成员,甚至是一个自动化协作系统——它会怎样改变你的工作方式? Boris Cherny 作为 Claude Code 之父,他写了一篇非常详细的推文,分享了自己如何高效使用这款工具,以及他和团队在实际工作中如何将 Claude 深度集成进整个工程流程。 这篇文章将对他的经验做一次系统的整理和通俗的解读。 Boris 是怎么让 AI 成为他工作流中的自动化伙伴的? 核心要点 他介绍了自己的工作流程,包括: ✅ 怎么用 Claude: 开很多个 Claude 一起跑:在终端和网页上开 5~10 个会话并行处理任务,还用手机 Claude。...
Agent Skills 终极指南:入门、精通、预测 应该是全网最好的 Skills 中文指南与教程 🎐 卷首语 应该是全网最好的 Skills 中文指南与教程,全文 1.2w 字,包含了我对 Skills 的完整应用思考。 巧借通用 Agent 内核,只靠 Skills 设计,就能低成本创造具有通用 AI ...
Claude Code 免翻上手教程:以及国产模型也能吊打 Claude? 如何不翻墙下载安装使用 Claude Code?如何用 Claude 十分之一的成本实现近似的效果?一行命令免翻装好 CC!以及 GLM 4.7 到底能不能吊打 Claude? Claude Code 免翻墙安装使用教程 在《2025年度总结》里老冯提到过,过去一年 Claude Code 让我的生产力翻了 20 倍。 有朋友问我是不是吹牛真没有,其实老冯说的还保守了。 这玩意实际上相当于月薪5万的工程师全天候帮你干活,而只要 1800¥ 的工资。 前几个月有个刚毕业的师妹问我怎么找工作,我给她的建议就一个:去把 ...
Welcome to the Machine, a guide to building infra software for AI agents English Welcome to the Machine, a guide to building infra software for AI agents Last modification on 2025-12-22 Ed Huang | CTO/Co-founder, PingCAP TiDB | [email protected] Just in time for Christmas—here in the U.S., the holiday atmosphere is already everywhere around me....
DHH 分享对 AI Agent 编程的看法转变。从不喜欢编辑器自动补全到欣赏终端 Agent 协作模式。在 OpenCode 中使用 Claude Opus 4.5 等模型,认为 Agent 已能产出生产级代码。对'Agent写90%代码'持怀疑态度,强调监督式协作是当下最现实范式。
LangChain 博客阐述文件系统作为 Agent 上下文工程核心工具的价值。四个关键场景:1) 大 token 消耗时,文件系统作为 scratch pad 存储工具结果,按需 grep 读取;2) 需要大量上下文时,通过文件持久化计划和子 Agent 知识,避免 context window 限制;3) 寻找小众信息时,glob/grep 比语义搜索更适合技术文档和代码文件;4) 持续学习时,Agent 可将用户偏好和经验写入自身文件。核心观点:文件系统提供统一接口,让 Agent 灵活存储、检索和更新无限量上下文。
2026 年 AI 行业预测汇总,AI 将如何改变世界? 汇总自 Gartner、SaaStr、a16z、Every、Gary Marcus 和 Forbes 的 26 年 AI 行业分析 最近看到各大投资机构在 2026 年 AI 行业的预测,我做了一个汇总,把相同点进行整理,不同点里有意思的观点做了摘要。
2026 AI First 系列(二):Vibe Coding——思维速度编程的民主化革命 copyright x @ wquguru 欢迎转载,请注明出处 "IDE?我试过一堆。以前我特别依赖其中一个。但现在它那些额外的功能,我根本不需要,也不在乎。我只 copyright x @ wquguru 欢迎转载,请注明出处
2026 AI First 系列(三):在被替代之前变得有价值——新经济下的生存法则 第一件事:你在做reinforcement learning from human feedback(RLHF)。每次你 第一件事:你在做reinforcement learning from human feedback(RLHF)。每次你修正AI的输出,每次你选择一个答案而不是另一个,你都在教它什么是好的、什么是不好的。 第二件事:你在数字化你的直觉。那些你"凭感觉"做出的判断,那些你"基于经验"的决策,正在被转化为数据点。AI在学习你的思维模式。
2026 AI First 系列(一):从助手到智能体——代理工程时代的到来 copyright x @ wquguru 欢迎转载,请注明出处 "Claude Agent SDK 将在2026年为知识工作带来的变革,就像Claude Cod copyright x @ wquguru 欢迎转载,请注明出处
2025,MCP、Agent、AI Coding 新的一年,少一些宏大叙事,多一些落地执行。 这是我从 腾讯裸辞 成为自由职业以后,写的第三篇年终总结。 前两年的年终总结,以罗列产品为主。 2023,我做过的 AI 项目 2024,我追过的 AI 风口
Android Studio 的 AI Agent 有什么特别?未来会有惊艳什么功能? 相信大家都在之前的 《Android Studio Otter 2 Feature 发布》已经了解过,为什么这是一个比较值得更新的 Android Studio 版本,与此同时,谷歌也和我们展示了未来(Canary)全新的 AI Agent 有什么特别之处。 对于一个 AI Agent 来说,最重要的有三个基础概念:工具 (Tools)、 上下文 (Context) 和 MCP (模型上下文协议) ,而大多数人对于它们的理解,可能还比较片面。 比如工具 ,实际上 AI Agent 不只是一个聊天场景,更多是 Agent 通过"工具"来执行任务 ,而不是单纯用来做文本回复...
2025年的年终总结 | MkSaaS - Make Your AI SaaS Product in a Weekend 2025年的年终总结,回顾过去独立开发之路,展望未来产品出海规划 大家好,2026年了,我一直在写一份年终总结,现在终于写完了,如释重负。我在这个年终总结中总结了最近2年来的独立开发经历,一方面自我沉淀,一方面分享经验,希望对大家有所帮助。 我总结的内容比较多,阅读时间会比较长,建议你时间充足的时候再看。今年在播客中听了不少的采访,启发良多,所以年终总结改为自问自答的方式,大家对什么问题感兴趣就直接跳着看就好了。
作为 Claude Code 的深度用户,看到这篇文章《How I Use Every Claude Code Feature》觉得非常好,他详细介绍了Claude Code中很多高级功能的作用以及使用技巧,DD也收获颇丰,所以转过来推荐大家一起学习一下。 > > 下面是本篇文章的翻译,根据实际情况选择阅读。原文链接:
Avoid Mini-frameworks - laike9m's blog DEC 24TH, 2025 What is mini-framework? My Story Why mini-frameworks are bad? So, What Should You Do Instead? *See Hacker News discussion* I work in Google Ads infrastructure in the past four years. Over time, I've seen one pattern came along again and again, causing endless pain for developers, that is, creating mini-frameworks.
MobileWorld是阿里巴巴通义实验室发布的移动GUI Agent基准测试,构建201个任务覆盖20个应用,强调长时域跨应用工作流(平均27.8步,62.2%跨应用任务),并新增用户交互任务(需主动识别歧义请求澄清)和MCP增强任务(调用外部工具协同)。GPT-5+UI-Ins-7B以51.7%成功率领先,证明当前主流Agent在用户交互和MCP任务上仍有显著不足。
2025 LLM Year in Review 2025 has been a strong and eventful year of progress in LLMs. The following is a list of personally notable and mildly surprising "paradigm changes" - things that altered the landscape and stood out to me conceptually. Reinforce...
Google 展示 Gemini 3 与六大开源框架(ADK、Agno、Browser Use、Eigent、Letta、mem0)的协作案例,涵盖零售选址、多智能体工作室、浏览器自动化、Salesforce 流程管理、社交 AI Agent 和记忆层等实际场景。Gemini 3 作为核心编排器,提供精确的推理深度控制和状态管理,解决 AI Agent 落地的可靠性难题。
claude code's DX is too good. and that's a problem. | thinking out loud 原文链接: English原文 发布时间: 2025-12-14T00:00:00.000Z 原文链接: Here's a tension I've been thinking about: Claude Code might be getting _too_ good. Not in the "AI is taking our jobs" sense. In the DX sense....
Anthropic 详细分享其 Research 功能的多 Agent 系统从原型到生产的过程。架构采用 orchestrator-worker 模式:LeadResearcher 规划和协调,Subagents 并行搜索。8 条 prompt 工程原则:像 Agent 一样思考、教会 orchestrator 如何委派、按复杂度缩放资源、工具设计至关重要、让 Agent 自我改进、先宽后窄搜索、引导思考过程、并行工具调用。评测方面:LLM-as-judge + 人工测试互补。生产挑战:有状态错误累积、调试困难、需要 rainbow deployment。BrowseComp 评测中 token 使用量解释了 80% 的性能方差。
聊一聊豆包AI手机助手高度敏感权限CAPTURE_SECURE_VIDEO_OUTPUT English Analysis of Doubao AI Mobile Assistant's Highly Sensitive Permission: CAPTURE_SECURE_VIDEO_OUTPUT Recently, discussions have emerged regarding the highly sensitive permission CAPTURE_SECURE_VIDEO_OUTPUT used by the Doubao AI mobile assistant....
Claude Code 支持 Rules 了,Agent 的生态在大融合了,文本化的 Skills + Rules 要占领生态位了
Claude Code之父:Claude Code是怎么被创造出来的?-哔哩哔哩 Cursor CEO:AI时代,品味是核心竞争力 Every CEO: AI Native公司,15个员工,5个产品,百万美元营收 Anthropic CEO:AI风险与机遇并存 Notion 3.0:成为知识管理Agent 黄仁勋最新访谈:信息量极大!AI仍然被低估,将实现十亿倍增长 Intercom CEO:SaaS巨头如何靠AI逆袭? Anthropic联创:分享从草根到AI大佬之路 OpenAI联创Greg Brockman最新访谈 Notion CEO:高能访谈,对工具和AI的深入思考 Rundow...
今天读到Claude Code团队的一期播客,极其有共鸣,忍不住要来和大家分享。可以说,这是近期我读到的最好的产品思考,没有之一。
OPPO ColorOS 智慧产品研发总监姜昱辰在极客公园创新大会 2026 的深度对谈。核心观点:1) GUI Agent 是长尾场景的兜底技术,OPPO 更倾向 Agent to Agent 生态互联;2) 记忆是 AI 手机演进的第一刀,只有记得才能懂你;3) 记忆系统的核心挑战是隐私,唯一解法是端侧计算;4) AI OS 的本质是主动式与个人化的交互革命。对比豆包 AI 手机的 GUI Agent 路线,认为手机厂商应通过生态合作而非单一 GUI Agent 提供最高质量服务。
OpenRouter 联合 a16z 的 100 万亿 token LLM 使用分析。核心发现:开源模型采用率提升、创意角色扮演和编程是最热门任务、Agent 推理模式兴起、'Glass Slipper'留存效应。含开源 vs 闭源、地理分布、成本动态等多维度数据。
基于 Anthropic 的 "Effective harnesses for long-running agents" 最佳实践
关于Claude刚登顶,OpenAI就放出24小时不休息的编程A的收藏文章
Android 系统上 AI Agent 的一些可能性 最近,我注意到手机端 AI Agent 应用的兴起,例如 DroidRun 和 AutoGLM。这类应用能够模拟用户操作,在手机上自动执行任务,全程无需人工干预------比如自动发布一篇小红书笔记,或是在美团上点一杯咖啡。 对用户而言,这类应用的核心价值在于解放双手、节省时间。 想象一下,那些每日重复的应用签到、定时的优惠券抢购、或是在不同应用间搬运信息的繁琐操作,都可以交给一个不知疲倦的后台"数字助理"来完成。这不仅极大地提升了个人效率,更让用户能将精力专注于更有创造力和价值的事情上。 然而,这些应用在实现上普遍面临一个核心痛点:独占屏幕 。当 Agent 运行时,它会接管手机屏幕,导致用户无法使用自己的手机。加之目...
基于 Chip&Cheese PPT 解读高通第三代 Oryon 核心微架构。3 cluster 18 核最高 5GHz,共享 L2 16MB/cluster,9宽 decode/retire,ROB 650+。L1-Miss-L2-Hit 21 cycle,96KB DCache。L2 TLB 标称 8K entry(实测约 1.5K-2K)。前代的渐进优化。
这篇文章是 Brie Wolfson 与这家 "AI 编程十角兽" Cursor 共度六十天的记录。是 Yuan 发给我的,我也借此学习一下当前发展最快、执行力最强的新型 AI 公司的样子。读的过程中,也带着我们自身的处境去想:哪些值得借鉴,哪些不一定适合。
IBM Research 团队对 2018-2025 年 RAG(检索增强生成)文献进行系统性综述,提出五维分类法(检索逻辑、融合拓扑、模态、适应性、信任校准),是目前最完整的 RAG 架构分类体系。论文整合了 RAGAS 评估框架和企业级基准数据:Galileo AI 的 chunk attribution 达 86% 准确率(1.36x 于 GPT-3.5-Turbo),Trustworthiness 指标中 groundedness 人类相关性 85-92%。论文指出传统 BLEU/ROUGE 对语义一致性评估不足,LLM-based judge 与人类判断相关性更高。
Anthropic 揭秘:上下文工程如何让 Agent 专注核心任务 Anthropic 揭秘让 AI 更靠谱的「上下文工程」 你有没有过这样的体验?跟 AI 聊得久了,它突然 "失忆"------ 前面提过的关键信息没了下文,甚至答非所问;让它处理复杂任务,比如分析大数据库、写长代码,它越往后越混乱...... 其实不是 AI "不认真",而是它的 "注意力" 有限。
Google《智能体设计模式》之 智能体推理引擎的内部视角 - 附录F 中翻版 原创 企业AI小蜜书 企业AI小蜜书 企业AI解构局 在小说阅读器读本章 去阅读 在小说阅读器中沉浸阅读 点击上方 蓝字 关注,一起畅游AI 前言: 这本由谷歌资深工程主管 Antonio Gulli 免费分享的 《智能体设计模式》 ,系统性地提炼出 21 个核心智能体设计模式,涵盖从提示链、工具使用到多智能体协作、自我修正等关键技术。 本书的中文翻译流程为「AI 初次翻译 → AI 交叉评审 → 人工评审 → 人工交叉评审」,所有翻译内容将会持续更新到开源项目:github.com/ginobefun/agentic-design-patterns-cn。 我参与了第十四章(RAG)和附录F(LLM内部推理引擎)的翻译,请大家在本文/开源项目地址提交指正。...
和许多团队交流后我发现,对 agentic 循环过程的体感缺失和理解,让有人认为存在某种神迹让 Agent 有超越模型智力的表现,有人说无非是多调用几次 API,哪有那么神奇。本文旨在通过示例和理论来帮助大家理解 Agent的底层逻辑。
Anthropic Skills 深度解析:当通用 Agent 学会专业技能 将文件夹系统作为 Context,正是 Claude 最核心的产品理念。 昨天深入研究了 Anthropic 刚开源的 Skills 仓库,发现这东西比想象中更有意思。 当通用 Agent 学会了专业技能会怎样?
文本和概念分析专家 Prompt 来源: GitHub Gist 作者: kevinz 原文链接: English This is a sophisticated prompt for text analysis and interactive HTML generation. The prompt defines an AI role as a "Text Analysis Expert" with the following core capabilities: Core Task When a user sends text, the AI must: Deeply analyze the text content, extracting key concepts, terms, and their interrelationships....
关于Enhancing Cursor and CodeBuddy的收藏文章
Anthropic 官方分享:为 AI 智能体打造高效工具——让 AI 智能体来帮忙 来自 Anthropic 工程团队模型上下文协议(Model Context Protocol, MCP)可 模型上下文协议(Model Context Protocol, MCP)可...
Anthropic全网追杀的人,可能是我…… Anthropic官方说,有一个用户在一个月内消耗了价值数万美金的的token,从而决定限速。这个用户,好像,是我本人…… 上个月,Anthropic官方发布了信息,有一个用户,只花了$200美元订阅套餐,却在一个月内消耗了数万美金的(tens of thousands)的token。从而决定对所有人进行限速...... 全世界的程序员都在好奇,这位每个月花数万美金的老哥是谁?
petitegeek 介绍了「React to This (RTT) 测试」——一种通过纯运动交互判断对象是否为远程操控机器人的 Turing 测试范式。测试要求参与者在1分钟内仅通过动作与机器人互动,结束时判断对方是真人还是机器。研究源自 ActiveSelf 网站提出的「运动很重要」框架,探讨了在无法使用语言的情况下,人类如何可靠地区分真人与机器人。对于关注具身 AI、人机交互评估方法论的研究者和产品设计者,这一测试框架提供了新的评估思路。
来自 OpenAI 离职员工的爆料:关于 OpenAI 的一些思考 来源: 微信公众号 原文链接: 作者:Calvin 三周前,我离开了 OpenAI[1]。我是在 2024 年 5 月加入这家公司的。 我想分享我的这些思考,是因为外界关于 OpenAI 在做什么的讨论充满了迷雾和噪音,但很少有人能第一手地描述在那里工作的文化到底是什么感觉。 Nabeel Quereshi[2] 写过一篇非常棒的文章,叫做《关于 Palantir 的反思》[3],他在文中深入思考了是什么让 Palantir 如此与众不同。我想趁着记忆还新鲜,为 OpenAI 做同样的事情。你在这里不会看到任何商业机密,更多的是我对这个历史上最引人入胜的组织之一,在当下这个极不平凡的时期的一些反思。 开门见山地说:我离开的决定背后没有任何个人恩怨——事实上,我对此感到非常纠结。...
新一代 Agentic AI 智能体,助力 Android 开发 | Google I/O 往期文章: 《00. 文章合集目录》 《Google Gemini 如何加速 Android 开发?》 《深入理解 Android Jetpack Lifecycle(用法篇)》 《深入理解 Jetpack Lifecycle(原理篇)》 你好,我是朱涛。今天我们来聊聊 AI 和 Android 开发的话题。 往年的 Google I/O 大会,Android 几乎每年都是主角。但是,从近两年开始,AI 在 I/O 大会的重要性逐渐提升,而今年 Google I/O 大会上,AI 已经成为了万众瞩目的主角。 这几年,以 ChatGPT 为代表的生成式 AI 发展迅猛,各个科技巨头都开发出了各自的AI。...
AI 助力网站出海:只靠聊天,做高颜值网站,你也行! 4次与AI的对话,来让大家看看如何做出精美的AI播客网站。 朋友好,我是赫兹! 一个探索网站出海生意的新手,上次分享了第一次赚美元!纯新手深度复盘网站出海,一文掌握全流程 之后,有朋友问我可以详细说说设计开发部分吗,今天我就来聊聊设计开发部分。 今天我用4次与...
从 Manus 构建经验总结的 Agent 上下文工程方法论
"10x Cursor"开发体验,Claude Code 如何带来 AI Coding 的 L4 时刻? 背景 "10x Cursor" 和 Claude Code AI 是两种先进的 AI 编码工具,旨在显著提升开发者的生产力,尤其对于 L4 级别的开发体验而言。这些工具通过自动化和智能化编程任务,使开发者能够以更高的效率完成工作,从而实现所谓的"10倍开发者"效应。 Claude Code AI 是什么 Claude Code 是 Anthropic 公司开发的 AI 驱动编码助手,被设计为一个"智能体"(Agent)系统。...
上周六,我受邀参加了由 *InfoQ* 举办的 *全球人工智能开发与应用大会(AICon)* ,在北京国际会议中心,做了一场题为《AI 时代如何做独立开发》的分享。 活动举办很成功,现场观众很热烈。我想把分享内容,整理成文字,与你共享。 2011 年,我本科入学武汉大学核工程专业,大一那年暑假,偶然接触了 Abobe 公司的 Photo...
English The content of the article about GPU工作原理... 中文 GPU到底是如何工作的?这篇AI Infra入门全部告诉你 腾讯技术工程的文章深入浅出地介绍了GPU的工作原理。文章从硬件架构到软件层面,全面解析了GPU在AI计算中的核心作用。 主要内容: GPU的硬件架构和计算单元 并行计算的基本原理 在AI训练和推理中的应用 主要厂商和技术发展 对于想了解AI基础设施的人来说,这是一篇非常好的入门文章。
GitHub - knemik97/Manifesto-against-the-Plagiarist-Yunhe-Wang: 讨贼王云鹤檄文 讨贼王云鹤檄文. Contribute to knemik97/Manifesto-against-the-Plagiarist-Yunhe-Wang development by creating an account on GitHub. 文章license和Qwen一样,apache-2.0。 王云鹤,1991年生于黑龙江。2018年博士毕业进入华为,经历不到7年时间,于2025年2月中旬,从小模型实验室主任任上,正式顶替姚骏,被任命为诺亚方舟...
Android×鸿蒙×AI 技术刊#第14期——Compose动画深度解析、KMP多端实践落地、Android 16适配指南 本周 Android 生态聚焦 UI 框架、跨平台方案与系统适配三大核心领域: Compose 技术进阶 共享元素动画剖析:解析 sharedElement() 与 sharedBounds() 的精准应用场景与渲染差异(ScaleToBounds vs RemeasureToBounds); Modifier 底层机制:Slot Table 存储结构与重组优化策略全解读。 跨平台方案落地 B站 KMP 实战:Bazel 构建 + FlowRedux 状态机实现 三端逻辑层共享 (Android/iOS/鸿蒙); Flutter 鸿蒙热...
GitHub - HW-whistleblower/True-Story-of-Pangu: 诺亚盘古大模型研发背后的真正的心酸与黑暗的故事。 诺亚盘古大模型研发背后的真正的心酸与黑暗的故事。. Contribute to HW-whistleblower/True-Story-of-Pangu development by creating an account on GitHub. 盘古之殇:华为诺亚盘古大模型研发历程的心酸与黑暗 我是一名盘古大模型团队,华为诺亚方舟实验室的员工。 1. 现诺亚主任,前算法应用部部长,后改名为小模型实验室的主任王云鹤。前诺亚主任:姚骏(大家称姚老师)。...
Android×鸿蒙×AI 技术刊#第13期——APK极速瘦身策略、MVI架构实践与AI工具链新动态 本周 Android 生态聚焦性能优化、架构演进与 AI 融合三大方向: 1️⃣ 性能深度优化 APK 瘦身实战:Unreal 项目压缩 NativeLibs 与资源,实现 1.23G → 130M 体积优化; 鸿蒙组件冻结技术:freezeWhenInactive 属性抑制非活跃 UI 刷新,降低主线程负载。 2️⃣ 开发范式革新 MVI 架构解析:厘清单向数据流与状态管理核心,对比 Redux/MVVM 适用场景; Flutter Hotload 突破:双重映射技术绕过 iOS 26 权限限制,恢复真机 Hotload 能力。
Android×鸿蒙×AI 技术刊#第12期:Android 16新特性、Compose与Flutter对比、ART机制揭秘 本周 Android 生态动态聚焦系统升级、框架演进与底层优化三大方向: 1️⃣Android 16 更新深度解读 强制应用开启全屏模式(edge-to-edge) ,预测性返回手势默认激活; 引入动态刷新率API (getSuggestedFrameRate)、增强型安全模式 及广播优先级限制等关键行为变更。 2️⃣ 跨平台框架能力交锋 Compose Multiplatform:Jetpack Compose 对比 Flutter 在 包体积、冷启动性能 的显著优势; **Flutter 挑战 iOS 26 ...
Anthropic:我们如何构建多智能体研究系统 我们的研究(Research)功能利用多个 Claude 智能体,来更有效地探索复杂主题。 我们的研究(Research)功能利用多个 Claude 智能体,来更有效地探索复杂主题。在此,我们分享构建这一系统时遇到的工程挑战以及我们学到的经验教训。 现在,Claude 具备了研究能力^\[1\]^,能够横跨网络、Google Workspace 及任何集成应用进行搜索,以完成复杂的任务。
AI 编码代理(以 Cursor 和 Claude Code 为例)的崛起及其深远影响 软件开发行业正处在一个根本性的范式转换之中,其驱动力是人工智能编码代理(AI Coding Agents)的强势崛起。以 AI 原生集成开发环境(IDE)Cursor 和基于终端的代理工具 Claude Code 为代表的新一代工具,标志着从被动的 AI *辅助*(Assistance)到主动的 AI *代理*(Agency)的决定性飞跃。这一转变不仅带来了前所未有的生产力提升——研究表明,在特定任务上,开发者的完成速度可提升高达 55.8% 注:本文由 Gemini 2.5 Pro 的 Deep Research 生成,隐去了其中的引用文章列表。 软件开发行业正处在一个根本性的范式转换之...
Android×AI 技术刊#第11期——都是Android技术文 本周 Android 技术动态聚焦三大核心方向: 跨端框架突破 : 腾讯视频开源 ovCompose 框架 ,实现 Android/iOS/鸿蒙三端一码 开发,基于 Compose Multiplatform 深度优化性能与原生混排能力; 货拉拉开源 TheRouter 鸿蒙路由 ,支持跨模块解耦与动态路由表下发。 性能优化实践 : 手机系统 D-Vsync 渲染管线优化方案 发布,实测掉帧率降低 72.7% ,功耗仅微增 0.13%; Flutter 复现 iOS 26 "液态玻璃"效果 ,解析着色器与扭曲算法实现难点。
Android×鸿蒙×AI 技术刊#第10期——端侧AI · Kuikly性能 · Flow避坑 · 脱壳 · Dex解析... 亲爱的开发者朋友们,本周的Android技术周刊来啦!无论你在打磨性能、深潜底层,还是探索AI边界,这些新鲜热乎的干货都能助你一臂之力: Google全新 MLKit端上生成式API 现已开放!只需几行代码,就能让Gemini Nano在用户手机里完成文档总结、图片描述(离线免费+极速510 tokens/秒)。 腾讯开源 Kuikly框架鸿蒙适配方案!通过命令式CAPI暴改渲染链路,实测比React Native快6倍,QQ浏览器、腾讯新闻已投产,你的跨平台项目也能抄作业!
如何利用cursor快速理解复杂代码工程? 原文链接: 源码阅读 Cursor 代码生成大模型 如何利用cursor快速理解复杂代码工程? Cursor 91% 知友推荐 · 555 人评价 Cursor是一款智能代码生成与自动化编辑器,旨在帮助开发者更高效地编写和优化代码。...
一文看懂2025 Google IO,誓把一切“装”上Gemini,谷歌眼镜10年逆袭归来 公众号: 网易科技 发布时间: 1970-01-01 08:33:45 原文链接: 出品|网易科技《态度》栏目 作者|袁宁 丁广胜 发自山景城海岸线圆形剧场Google I/O大会 “我听说今天是双子星季(Gemini Season)的开始,”Sundar Pichai 一上台就抛出冷笑话,“但我不明白这有什么特别的。在谷歌,每天都是双子星(Gemini)季。” 2025年 Google I/O 主题演讲刚一开场,Pichai 就用 Gemini 做了个梗,引得全场轻笑。 5月20日的山景城,气氛热烈,网易科技排队一小时挤进会场前排,和来自全球的开发者、分析师、媒体一同见证这场发布。...
English "基于 MCP 的 AI Agent 应用开发实践" 是一篇被广泛转载和讨论的文章,特别在AI Agent和MCP(Model Context Protocol)技术社区中具有一定影响力。该文章主要探讨了如何通过标准化协议实现工具提供方与应用研发者的解耦,从而推动AI Agent应用研发范式的转变。 这篇实践文章常被提及与"字节跳动开源"相关,并以字节跳动开发的Agent TARS应用为例,详细介绍了MCP在开发范式和工具生态扩展方面的作用。文章的作者之一被识别为"AI技术老狗(QA)". 由于其内容的重要性,该文章在多个技术平台和社区都有出现,包括CSDN博客、InfoQ写作社区、墨滴以及51CTO等。许多平台都以"实操干货"或"全解析"等形式对其进行讨论、引用或转载,表明它已经成为该领域的重要参考资料。...
随着大语言模型(Large Language Model, LLM)技术的迅猛发展,其应用已从通用领域快速渗透至编译技术等专业场景。本文将聚焦大模型在编译优化中的创新实践,重点探讨基于大模型的自动向量化的优化方法及其实现机制。
最近爆火的MCP究竟有多大魅力?MCP开发初体验|得物技术 English 最近爆火的MCP究竟有多大魅力?MCP开发初体验|得物技术 公众号: 得物技术 发布时间: 1970-01-01 08:33:45 原文链接: 目录 一、前言 二、MCP 基础架构 基础架构 工作流程 三、MCP Server 开发&实践 准备 MCP Client 开发 MCP Server 配置 MCP Server 开始体验 进阶体验 联想一下 四、总结 一 前言 MCP 全称 Model Context Protocol,是由 Anthropic 公司在 2024 年 11 月推出一个开放协议,主要用于标准化应用程序向大语言模型提供上下文的方式。可以将 MCP 想象成 AI 应用程序的 USB-C 接口。...
Trae 重磅更新:AI编程+智能体+MCP,言出法随的新境界 Trae 重磅更新:AI编程+智能体+MCP,言出法随的新世界入门 原创 AGENT橘 AGENT橘 AGENT橘 在小说阅读器读本章 去阅读 在小说阅读器中沉浸阅读 Vibe Coding 和 MCP 都是最近特别流行的概念。 Vibe Coding,是氛围编程,是代码生成的言出法随,想要什么功能,就让AI写出代码。 MCP,是大模型上下文协议,是工具调用的言出法随,需要什么工具,就把叫它过来一起干活。 而如果把两者结合,会碰撞出怎样的火花? 先来看一段录屏,这是我花了十分钟写出来的一个探索大理的网页: 设计、开发、生成配图、添加动效,全部都是我用 AI 编程+MCP 完成,一行代码都不用写,一行图片提示词都不用写。...
AI 傻傻分不清楚?那么多 AI 变体究竟怎么选?这里快速简单理清! 2025 年的 AI 确实越来越好用,甚至可选的大模型也越来越多,不管是 web chat 还是 ide coding,现在都提供了大量丰富的可选模型,但是这同样也带来了「选择困难症」,特别是对于用户而言,面对有限的「免费次数」或者「排队时间」,选错模型等于浪费生命,所以本篇意在简单介绍下这些模型和变体的区别,帮助你简单了解它们的适用情况 。
【有嘴就能做开发】Cursor——AI编辑器 使用详解 作者: unknown 发布时间: 编辑于 2025-03-01 23:45・浙江 原文链接: 概述 Cursor是什么? Cursor是一款优秀的AI代码编辑器,它内置了Deepseek-R1、GPT-4、Claude等AI模型。 简单说,就是: Cursor = VS Code编辑器 + AI大模型 + Cursor功能特性(代码补全、文件编辑等) 它可以: 智能补全代码 解释代码 定位Bug AI大模型问答 文本编辑 更重要的是,它可以: 根据自然语言,生成代码 这一点,非常利好“不懂编程,但是有开发想法”的人。...
Github Copilot 近期重要更新一览 (2025.4.9)Github Copilot 宣布推出 Pro+(3 - 掘金 Github Copilot 宣布推出 Pro+(39🔪/月),5月5日 开始限制 高级模型 (除4o外所有) 访问次数 ,原 Pro 每月 300点 (能问 Claude 3.7x240次 ) 离上一篇《Github Copilot 近期的一次重要更新 (2024.9.26)》已经过去半年多了,今天比较闲,刷下 Github Copilot 的 更新日志 → Github Copilot ChangeLog 看下都有哪些重要更新,这不刷不知道,一刷吓一跳 ❗...
AI编程:从Copilot到Autopilot AI编程正在重塑软件开发的边界,让更多人能够将想法转化为现实,重新定义人与技术的关系。 AI编程是当前AI领域唯一盈利赛道。这不仅是一种技术革新,更是一场创造方式的变革,正在重塑软件开发的边界,让更多人能够将想法转化为现实,重新定义人与技术的关系。 从GitHub Copilot这样的代码补全插件,到Cursor这类AI IDE,AI编程工具正在变得更加集成和智能。这种演变不仅提高了效率,还大幅降低了编程门槛,使非程序员也能创造软件。
AI编译器的根本性权衡:既要通过抽象底层细节来实现易用性和可扩展性,但现代生成式AI工作负载又需要可编程性和硬件控制来实现极致性能。
BabelDOC: Yet Another Document Translator English BabelDOC is an open-source, AI-powered document translator developed by the funstory-ai team, specifically designed for translating PDF documents while preserving their original formatting and layout. It is particularly optimized for academic papers and professional documents....
GitHub - MobinX/awesome-mcp-list: A concise list for mcp servers A concise list for mcp servers. Contribute to MobinX/awesome-mcp-list development by creating an account on GitHub. Awesome MCP Servers - Concise List Note that this list is continuously updating and improving. Please star this repo ...
“聊天式编程”让代码听你的话:Cursor打造极致心流体验 公众号: 腾讯技术工程 发布时间: 1970-01-01 08:33:45 原文链接: 作者:吕昊俣 最近半年深度体验了Cursor,享受到了很多乐趣,这篇文章将分享对于Cursor的一些实践与思考。 “聊天式”编程已经到来 在2023年1月,四位麻省理工学院(MIT)本科生创立的AI编程工具Cursor横空出世,以“重新定义软件开发流程”的革新理念迅速崛起 。团队提出了“优秀的工程技术比算力更重要”的理念,不管是猜你所想的“tab、tab、tab”,还是一键添加多种类型的“上下文” 或是无所不能的Agent模式,真正意义上诠释了什么是你的专属私人编程助理,Cursor的出现,可以说标志着“聊天式”编程的到来。...
LLM Agent 领域研究碎片化严重:架构设计、协作模式、进化机制散落在不同工作中,缺乏统一的方法论框架来理解"Agent 如何构建、如何协作、如何进化"这一完整生命周期。
AI 时代下的工程领导力:如何打造高效团队 - 来自谷歌工程负责人、Chrome 开发者的宝贵经验分享 AI 是个好帮手,但不能全靠它,团队领导者得搞清楚“更好”到底是啥意思,然后带着团队更快地往那儿走,团队成员也是如此。 今天偶然读到 Chrome 开发者、Google 工程负责人、著名技术书籍作者 -Addy Osmani 的一篇文章「Leading Effective Engineering Teams in the Age of GenAI」,讲的特别好,对于产品和研发方向如何变得高效,不管你是团队领导者、还是团队成员,都很有价值,分享给朋友们,可以先看我的阅读笔记,针对自己感兴趣的部门再阅读原文(推荐阅读,作者信息和文章链接放在文末)
Lilian Weng 的经典综述文章,系统阐述以 LLM 为核心的自主 Agent 系统架构。三大核心组件:Planning(任务分解、自我反思,涵盖 CoT、ToT、ReAct、Reflexion、CoH、AD 等方法)、Memory(短期上下文学习、长期向量存储)、Tool Use(API 调用、代码执行、外部知识访问)。文章深入分析了每种方法的原理和适用场景,包括多 Agent 协作框架。该文是 Agent 领域被引用最多的综述之一,适合作为系统性理解 Agent 设计的入门基石。
本杂志开源^\[1\]^,欢迎投稿^\[2\]^。另有《谁在招人》^\[3\]^服务,发布程序员招聘信息。合作请邮件联系^\[4\]^([email protected]^\[5\]^)。
AI时代的性能分析:GPU Profiling初探 关于GPU Profiling和可视化的鸟瞰。 在CPU优化的过程中,例如我们遇到CPU打满的情况,我们可以通过perf等工具进行Profiling,然后将数据可视化成火焰图等形式进行分析;同样的,在GPU的优化过程中,我们也可以通过Profiling来进行性能优化。 例如在大热的DeepSeek的推理系统中,就提到用Profiling来优化:
4 段超神提示词解锁 Claude 3.7 能力上限 一段AI提示词能实现什么让人吃惊的效果!? 之前说出都没人信,让我们眼见为实 橘子推荐语: Claude 在升级到 3.7 之后,能力获得了大幅提升,在前端编程方面已经远远超出其他模型,重新定义了 AI PPT 的概念,我已经把所有图表都交给 Claude 3.7 用代码直接写了。 最近一直想把方法分享给大家,但苦于没有精力动笔,刚好我的朋友归藏做了一些研究,向阳乔木做了一些延展,写出了这篇很棒的文章。 欣然转载,希望大家都能体会到最新 AI 技术带来的震撼。 上周我的好朋友 @歸藏 发了一段提示词,核心思想是用前端和设计角度出发。
为了帮助大家更好地了解和掌握 Gemini2.0 的使用技巧,GDG 社区在 2.27 晚上7点在线上举办了「社区说」分享活动,邀请多位资深的 AI 开发专家,从不同角度为大家解读 Gemini 2.0 的最新变化和开发技巧。本文将带领大家详细回顾此次活动特约嘉宾们的精彩分享。
AI 代理可观测性 - 演变标准与最佳实践 AI 代理将在 2025 年成为人工智能的下一个重大飞跃,AI 代理的可观测性变得尤为重要,特别是在将这些代理扩展以满足企业需求时。没有适当的监控、追踪和日志记录机制,诊断问题、提高效率和确保 AI 代理驱动应用的可靠性将面临挑战。 作者:Guangya Liu (IBM), Sujay Solomon (Google) AI 代理将在 2025 年成为人工智能的下一个重大飞跃。从自主工作流到智能决策,AI 代理将为各行业的众多应用提供动力。然而,随着这一演变,AI 代理的可观测性变得尤为重要,特别是在将这些代理扩展以满足企业需求时。没有适当的监控、追踪和日志记录机制,诊断问题、提高效率和确保 AI 代理驱动应用的可靠性将面临挑战。
【科普】程序员必看,AI时代新协议 MCP 正在连接吞噬一切,20+资源全收录! 公众号: 向阳乔木推荐看 发布时间: 1970-01-01 08:33:45 原文链接: 字数 1800,阅读大约需 9 分钟 如果你最近经常刷 X 的话,你会发现一个频繁出现的关键词:MCP。 X(Twitter)上,AI 圈 10w+ 关注大V橘子兄这么评价: 不少独立开发圈的朋友们,对MCP技术也很感兴趣。 前段时间自己摸索,用AI写了一个MCP服务器,自然语言控制AI生成音频,效果让我十分震惊,所以快速组个MCP技术交流群。 个人觉得 MCP是 AI Agent 落地的关键协议,生态正在爆炸式增长,海外知名软件,没一个不在不提供自己的 MCP 服务。...
AI 正在推动程序员的进化,而不是灭亡 | 宝玉的分享 这是纽约时报新刊登的一篇 AI 对程序员影响的文章,有人担心 AI 很快会自动取代数百万个工作岗位,文章主要观点还是认为 AI 正在推动程序员的进化,而不是灭亡,创造力、批判性思维、解决问题的能力、沟通能力、共情能力------这些才是人们在未来需要持续培养的技能。当然,还要学会如何管理和使用好这些 AI 工具。 同时 HackerNews 上关于这篇文章也有不少讨论,一起整理后放在附录中供参考。 微软等公司推出的 AI 工具正辅助编写代码,让软件工程师站在这项技术对劳动力市场所带来冲击的最前沿。
DeepSeek-R1的成功标志着AI在推理能力方面的重要突破。它不仅展示了如何构建高性能的推理模型,更重要的是提供了一套可复现的技术方案,为整个AI社区带来了宝贵的经验。
如何应对产品形态与产品节奏相对确定情况下转变为『在业务需求与产品形态高度不确定性的情况下,如何实现业务交付时间与交付质量的确定性』。本专题《淘宝交易终端架构探索》是我们摸索出的部分实践总结,欢迎大家一起交流进步。
AI 也能"看懂"图片: 移动端相册 AI 搜图的奥秘PicQuery 通过创新的多模态搜索技术,为移动设备上的图片检索 - 掘金 PicQuery 通过创新的多模态搜索技术,为移动设备上的图片检索提供了一个高效、智能的解决方案。是一个非常值得学习,把玩的好项目。 其实大概三四个月前就想写一篇文章来介绍移动端 AI 搜图的一些进展,不过由于本人的精力有限和一些其他的原因,没有及时更新。所以也就拖更很久,好在春节有些时间可以把之前的一些知识总结,更好的展现给大家。 相信用 Android 手机的同学多少都有一些感觉,Android 手机上的相册都多了一个搜图的功能,例如小米手机或是 Oppo 手机都上线了类似的功能,输入文字可以获得相关的图片。下面展示一下小米相册里面的搜图功能: ?ima...
科技爱好者周刊#336:面对 AI,互联网正在衰落 English 科技爱好者周刊#336:面对 AI,互联网正在衰落 公众号: 阮一峰的网络日志 发布时间: 1970-01-01 08:33:45 原文链接: 这里记录每周值得分享的科技内容,周五发布。 本杂志开源\[1\],欢迎投稿\[2\]。另有《谁在招人》\[3\]服务,发布程序员招聘信息。合作请邮件联系\[4\]([email protected]\[5\])。 封面图 漳州钟法路的大榕树新春彩灯。(via\[6\]) 面对 AI,互联网正在衰落 这一段日子,新闻焦点全是 DeepSeek,其他重要事件就不显眼了。 我说的重要事件是,1月23日,就在 DeepSeek R1 模型发布三天后,OpenAI 公司推出了一个新的 AI 工具,叫做 Operator\[7\](操作员)。...
Android中AIDL和HIDL的区别,Google为什么更推荐AIDL? 在Android中,AIDL(Android Interface Definition Language) 和 HIDL(HAL Interface Definition Language) 是两种用于定义跨进程通信接口的语言。AIDL 是 Android 系统最早支持的 IPC(进程间通信)机制,而 HIDL 是从 Android 8.0 开始引入,用于 HAL(Hardware Abstraction Layer)模块的接口定义。 随着 Android 的发展,Google 决定从 Android 11 开始将新的 HAL 统 一使用 AIDL 接口,而逐步放弃 HIDL。这种转变背后的原因涉及技术复杂度、性能、开发效率和生态统一性等多个方面。
DeepSeek-R1 论文解析——人工智能领域的 RL LLM 新时代? DeepSeek-R1 论文解析——人工智能领域的 RL LLM 新时代? 近年来,人工智能 (AI) 领域取得了快速发展,大型语言模型 (LLM) 为通用人工智能 (AGI) 铺平了道路。OpenAI的 o1 是 一个出色的模型,它引入了创新的推理时间扩展技术,可显著增强推理能力。然而,它仍然是闭源的。 今天,我们深入研究了 DeepSeek 推出的开创性研究论文 DeepSeek-R1。这篇题为"DeepSeek-R1:通过强化学习激励大型语言模型中的推理能力"的 论文介绍了一种最先进的开源推理模型,以及使用大...
AI 编程智能体深度剖析:Cursor 与 Cline 实战对决,谁更胜一筹? 来源: 掘金 作者: 欧少泽 发布时间: 2025-01-30 原文链接: 一、前言 这篇文章主要讲的是闭源 AI 编程智能体 Cursor 和开源 AI 编程智能体 Cline ,之所以主要讲这两个工具,是因为测试了好多工具后,发现这两个工具分别是闭源和开源领域中是比较好用的 AI 编程智能体。 对于程序员来说,经常需要做的就是等待编译,包括等待本地编译和等待流水线编译,而有了 AI 编程智能体后,程序员需要等待的事项就多了一个: 等待 AI 编程智能体工作完成 。 AI 编程智能体 智能体,简单来说,就是你给 AI 越多的工具、资源,它就能帮你解决更多的问题。比如你把访问浏览器的权限给它,它就可以去查资料,把创建和编辑文件的权限给它,它就可以自己创建代码文件。...
AI 辅助编码的残酷真相:它能帮你完成70%的工作,但最后30%令人非常沮丧 在过去几年深入参与 AI 辅助开发的过程中,我注意到一个非常有趣的现象:尽管许多工程师都表示自己在使用 AI 时生产力显著提升,但我们日常使用的软件却并没有明显变好。到底发生了什么? 一份实战指南,以及为何我们需要重新审视自己的期望 在过去几年深入参与 AI 辅助开发的过程中,我注意到一个非常有趣的现象:尽管许多工程师都表示自己在使用 AI 时生产力显著提升,但我们日常使用的软件却并没有明显变好。到底发生了什么?
字节跳动旗下对标 Cursor 和 Windsurf 的 AI IDE 产品 —— Trae,今天正式上线了!
The 2025 AI Engineering Reading List English The 2025 AI Engineer Reading List. We picked 50 paper/models/blogs across 10 fields in AI Eng: LLMs, Benchmarks, Prompting, RAG, Agents, CodeGen, Vision, Voice, Diffusion, Finetuning. If you're starting from scratch, start here. 中文 2025 年 AI 工程师阅读清单。我们在 AI 工程的 10 个领域中精选了 50 篇论文/模型/博客:LLM、基准测试、提示工程、RAG、Agent、代码生成、视觉、语音、扩散模型、微调。...
Cursor 深度评测:革命性提效工具还是过誉的玩具? 最近 Cursor 很火,火到我身边的程序员们已经不聊河北彩花,LOL,黑猴等,而是在各种场合讨论这个 Cursor 的辅助编程能力。各类内容平台也在以惊人的速度,迭代出了许多相关教学视频: 我试用了一段时间,第一感觉确实很惊艳,能帮我解决很多基础问题,实打实地提升开发效率,印象比较深的,包括: Codebase Indexing、@symbol 等功能带来的更强的上下文索引能力,而这极大提升最终 LLM 生成的代码效果; Cursor Composer 功能提供了一个注意力非常聚焦的编程面板,相比于过往 GPT 等产品的即聊即抛的模式,更容易做好跨文件的编辑开发,而这更符合专业开发者的模块化编程习惯。...
以小说 AI 工作流为例,Cursor和Windsurf,为什么我最后选择Cursor(万字长文) 由于公众号文章访问受限,无法直接抓取全文内容。这是一个关于AI编程工具比较的长文,详细分析了Cursor和Windsurf两种AI编程工具的特点。 文章概要 这篇文章深入探讨了两种主流AI编程工具Cursor和Windsurf的比较分析,通过小说创作的具体工作流场景来展示各自的优势和适用性。...
1866 年,西门子的一位工程师发明了人类第一台直流发电机。 40 年后,通用电气在 1906 年开始量产真正让电灯普及的第一代白炽灯泡。 在这两者之间的半个世纪里,人类世界依然黑暗,电气的技术革命好像没有发生。 但,这只是因为我们身处后世,才能如此轻描淡写地将这 40 年一笔带过。对于当时的人们来说,电气技术的发展,是他们眼皮底下一天天展开的:第一条电报线路的铺设,第一个电话的接通,第一辆电车的开动,每一次技术的进步,都在真切地改变着他们的生活,只是它没有快到让当时的每个人都在一个时间点集体惊呼"啊,电气革命终于来了!"
吴恩达:从 Agent 到 Agentic Workflow ,AI 的未来何去何从? 作者:AI技能 原文链接: 公众号: AI技能 发布时间: 1970-01-01 08:33:44 原文链接: _关注 AI 技能,开启智能生活!___ 摘要 本文《AI 的未来何去何从?关于具有代理能力的系统》深入探讨了由 Andrew Ng 提出的具有代理能力的系统概念,强调这种系统通过迭代、自我改进的过程超越传统 AI 方法。 文章概述了具有代理能力系统的关键组成部分,如反思、使用工具、规划和多代理协作,并提供了创建用于生成 Medium 帖子想法的 AI 代理的逐步指南。该过程涉及设置代理类、制定详细的反应提示、创建工具/动作功能,并通过所有动作自动化代理,展示了 AI 的思考、规划和执行任务的潜力,无需人为干预。...
【GDE 分享】移植 Mediapipe LLM Demo 到 Kotlin Multiplatform English 【GDE 分享】移植 Mediapipe LLM Demo 到 Kotlin Multiplatform 公众号: 谷歌开发者 发布时间: 1970-01-01 08:33:44 原文链接: 以下文章来源于Android高效开发,作者2BAB _作者 / Android 谷歌开发者专家 El Zhang (2BAB)_ 在今年的厦门和广州 Google I/O Extended 上,我分享了《On-Device Model 集成 (KMP) 与用例》。本文是当时 Demo 的深入细节分析,同时也是后面几篇同类型文章的开头。...
深度解析 OpenAI o1 模型技术路线。从 System 1/System 2 思维框架切入,指出此前 LLM 都用快思考模式,o1 引入慢思考多步推理。核心创新在预训练、后训练(强化学习)和推理阶段突破,代表从 pattern completion 到 structured reasoning 的范式转变。
Unlimited Refill Cursor The page could not be found NOT_FOUND sin1::b5q5l-1776233335458-7bdc33be3c85
逐步解析 | 如何使用 LangChain、NestJS 和 Gemma 2 构建一个 Agentic RAG 应用 原文链接: English 环境异常 当前环境异常,完成验证后即可继续访问。 去验证 : , 。 视频 小程序 赞 ,轻点两下取消赞 在看 ,轻点两下取消在看 中文
AI 和写作 | Randy's Blog | Randy's Blog 到底什么样的形式是一个好的写作 Copilot, 我也没有答案,但我认为它一定不能是侵入式的。它应该在一旁默默地观察我写出来的想法,然后在合适的时候告诉我它对此的观点。它有比我多得多的知识量,可以做到: 在我提出一个观点时,找出其中可能的逻辑漏洞,帮助我更完整地思考。 在我提出一个观点时,找出其在学术研究中对应的名词可以解释这个观点,甚至找出对应的科学实验、论文、现实中的案例。这在非虚构类写作中十分有帮助。我最近在读 Ali Abdaal 的 Feel good productivity 一书,里面十个观点有八个都能举出一个科学实验来论证,我基本可以单方面认为 Ali 一定是在用 GPT ...
探索更强中文Embedding模型:Conan-Embedding 公众号: 腾讯技术工程 发布时间: 1970-01-01 08:33:44 原文链接: 作者:ethanntang 本文主要分享我们近期在Embedding模型训练上的工作「Conan-Embedding」。目前,Conan-Embedding已在最全面、最大规模的中文语义向量评测榜单C-MTEB上达到SOTA,超越了阿里、百川、OpenAI等众多Embedding模型。 图片由Venus-AI Draw平台生成并进行风格化 引言 概述 随着大模型时代的爆发,检索增强生成技术(RAG)在大语言模型中广泛应用。RAG是一种性价比极高的方案,在大语言模型中占据重要地位。Embedding模型作为RAG中检索召回的重要一环,扮演着极其关键的角色。...
o1发布后,信息量最大的圆桌对话:杨植麟、姜大昕、朱军探讨大模型技术路径 2024年9月19日云栖大会,一场名为"大模型通往AGI之路"的圆桌对话,聚焦 OpenAI 新模型 o1 的影响与大模型技术未来。嘉宾包括月之暗面创始人杨植麟、阶跃星辰创始人姜大昕、盛数科技首席科学家朱军,主持人是极客公园张鹏。 核心观点 o1 的意义 姜大昕指出 o1 展示了大型语言模型的"慢思考"(System 2)能力,类似于人类认知,极大拓展了 AI 的潜力。杨植麟也认可 o1 对提升 AI 能力的重要性,以及在数据挖掘遇到瓶颈时解决扩展定律(scaling law)挑战的意义。 AGI 发展加速 姜大昕和杨植麟都认为 AGI 的发展在过去 18 个月实际上在加速,而非放缓。...
The Product-Minded Software Engineer - The Pragmatic Engineer English The Product-Minded Software Engineer Before we start: I'm hosting the first-ever The Pragmatic Summit on 11 February, 2026, in San Francisco....
AI 将在可预见的未来深刻影响软件开发行业。 Cursor 是一款基于人工智能的代码编辑器,创建了一个集成开发环境 (IDE)。旨在帮助开发人员编写代码,并与 AI 进行实时互动,提供代码建议、错误检测和自动补全功能。 集成开发环境(IDE),支持多种编程语言(如 Python、JavaScript、Java 等)。 Cursor 团队表示,未来还会推出支持更多编程语言、增强调试功能等更新,让 Cursor 成为开发者的得力助手。 ✅参考数据(通过搜索获悉,2024 年软件市场的一组数据如下) 在软件开发行业,有超过 700 种编程语言可供选择。因此,在选择正确的编程语言时,企业和软件开发人员...
抄 Apple Intelligence 作业的思路 文章从 LLM 的近况切入,探讨 Apple Intelligen 发布时间: 2024-08-27T08:38:20.000Z 原文链接: 抄 Apple Intelligence 作业的思路 字节跳动\_离青 2024-08-27 4,179 阅读50分钟 已关注 6 月的 WWDC 7 月刷,7 月的构思 8 月写,着实拖延了些时日,希望成稿之日观点尚能构成参考 _(:з」∠)_ 字节跳动 Client AI 团队招聘中,业务年均百亿收益,SDK 日均万亿调用,诚邀推荐: - 社招 - 算法工程师 @北京/杭州/上海 - 平台工程师 @北京/深圳 - 移动工程师 @北京/深圳 - 校招 - 算法工程师 @北京/杭州 - 实习 - 前端工程师 @深圳...
LLM (Large Language Models) 的风头一时无两,席卷万千行业。业内不乏有关于 LLM 的研究和讨论,但鲜有立足终端的视角。团队上半年曾有过对 GPT 进终端的分析,但 LLM 日新月异,旧分析已经不完全跟得上变化了。适逢年底规划季,尝试重新梳理 LLM 的现状,预判未来变化的趋势,希望能为迷茫的同仁提供思考的角度,也希望获得战斗在一线的友军的指点。 求砖 \& 免砖申明: 不包含 LLM 入门介绍,够时间可以报吴恩达的免费课程和 NVIDIA 与 LlamaIndex 合力出品的;不够时间也有 Andrej Karpathy 的 一小时入门; 非算法出身,如有错漏之处,恳请指正;力争能让 RD、PM、DA 们都能看懂,如果不明处,欢迎讨论; 终端 LLM 应用有一定不...
Building A Generative AI Platform After studying how companies deploy generative AI applications, I noticed many similarities in their platforms. This post outlines the common components of a... After studying how companies deploy generative AI applications, I noticed many similarities in their pl...
Articels/腹背受敌的中国经济(3 万字长文).md at main · foreveryh/Articels · GitHub 文章转载分享. Contribute to foreveryh/Articels development by creating an account on GitHub. 繁华渐逝:腹背受敌的中国经济(3 万字长文) 全文约 3 万字,撰写花了我 14 个月。阅读需要 60 分钟。如果完全读懂,能受益 30 年。
English 关于"吴恩达:从 Agent 到 Agentic Workflow"这一主题,有许多文章和讨论对吴恩达(Andrew Ng)关于 Agentic AI 和智能体工作流的理念进行了阐述和转载。 吴恩达教授在多个场合,包括2024年Snowflake峰会开发者日和红杉资本的AI峰会,都深入探讨了Agentic Workflow。他强调,这种工作流的核心在于将复杂任务分解为多个步骤,并通过迭代优化逐步完善结果,使其更接近人类解决问题的思维模式。 您可以在以下平台找到相关的转载文章和深度解读: CSDN博客 上有一篇题为"吴恩达:从Agent 到Agentic,超越基础模型的下一代AI"的文章,详细介绍了吴恩达的观点。...
手搓AI智能体实战经验 来源: 微信公众号 原文链接: 过去的一年多,大模型风起云涌,不断迭代,作为一个多年 NLP 产品方向的从业者,可以说是享受其中,惊喜连连。记得22年底,那时疫情放开,身边的人全部病倒,在身体冷热交加中看到了 ChatGPT 的发布,马上在病榻上完成了注册,那时的感觉就仿佛黑暗中看到了曙光。当时我在一家物联网公司的 AI 研究院工作,基于 ChatGPT 开始设计很多 demo 取代之前的 NLP 任务 bert 方案,后面一年多不断地实验各种大模型的应用方法,颇为有趣。 腾讯日前也正式发布了大模型应用平台元器和混元 C 端产品元宝,也希望大家一起在上面多做一些有意思的智能体,故分享一下之前的探索经验,供大家参考。...
可能是全网最完整的探讨关于 copilot 写代码优劣及使用场景注意事项的文章 作为 Github copilot 刚 beta 发布就重度使用至今的有二十多年码龄四十多岁还在写代码的码农,我觉得我有足够的说服力来阐述我对这个问题的理解。当然,口说无凭,本着「谁主张谁举证」的民事诉讼原则,我拿 github 自身的 copilot statistics API 看了一下我过去近三周的使用数据(我不是每天都写代码,所以有些天没数据),惊奇地发现我使用 copilot 比我想象得还要「勤劳」:
科技爱好者周刊#301:OpenAI 的图书馆工位 English Issue 301 of "Tech Enthusiast Weekly" titled "OpenAI's Library Workspaces" was published on May 24, 2024. In this issue, Ruan Yifeng introduces OpenAI's headquarters in downtown San Francisco, a three-story building converted from a food factory....
本杂志开源^\[1\]^,欢迎投稿^\[2\]^。另有《谁在招人》^\[3\]^服务,发布程序员招聘信息。合作请邮件联系^\[4\]^([email protected]^\[5\]^)。
我如何夺冠新加坡首届 GPT-4 提示工程大赛 [译] 作者:Sheila Teo 原文链接: See all posts Published on 2024-05-06 Translated on 2023-12-28 我如何夺冠新加坡首届 GPT-4 提示工程大赛 [译] 原文: How I Won Singapore’s GPT-4 Prompt Engineering Competition 作者: Sheila Teo 深度探索我在驾驭大语言模型(LLMs)中学到的策略 庆祝这一里程碑 — 真正的胜利在于宝贵的学习经历! 上个月,我非常荣幸地在新加坡政府科技局(GovTech)组织的首届 GPT-4 提示工程大赛中脱颖而出,这场比赛吸引了超过 400 名杰出的参与者。...
English OpenAI首席执行官萨姆·奥特曼(Sam Altman)在斯坦福大学的一次对话中,分享了对人工智能(AI)、GPT-5、通用人工智能(AGI)、核聚变发电以及人类未来等多个关键领域的深刻见解。 奥特曼斯坦福对话要点 据报道,萨姆·奥特曼于4月24日在斯坦福大学的企业思想领袖讲座(ETL)活动上发表了演讲,并于5月2日发布了完整的对话视频及万字实录。在对话中,奥特曼强调了持续改进和负责任地迭代部署AI的重要性,并预测未来的AI模型将显著提升智能水平,对社会产生深远影响。他认为,AI的发展将是人类历史上一个非常重要的时刻,并表示OpenAI致力于确保AGI能造福全人类。奥特曼也对AI发展中可能出现的"微妙危险"表示担忧,并强调公开发展的重要性。...
查看浏览器Browsers的内核版本, 可以用 navigator.userAgent 在浏览器控制台输入:navigator.userAgent 几乎所有主要浏览器都支持 navigator.use
受社群里 @damo 老板的启发,哥飞决定从今天开始一个新栏目,不定期点评一些网站,说说他们有哪些做得好的地方,有哪些还值得改进的地方。
本杂志开源^\[1\]^,欢迎投稿^\[2\]^。另有《谁在招人》^\[3\]^服务,发布程序员招聘信息。合作请邮件联系^\[4\]^([email protected]^\[5\]^)。
\[AI Milestone\] AiPhone is coming \| AI+手机时代已来 > 2024年1月18日,三星正式推出了Galaxy S24系列机型,成为全球首款AI手机,从此Galaxy S24超越智能手机时代,将开创新的移动AI手机时代。这是自2007年苹果创始人史蒂夫·乔布斯发布首款iPhone后,智能手机的最强进化。本文主要介绍三星AI手机中涉及到的AI黑科技及原理,以及对AiPhone(AI+Phone)的未来趋势的一点点思考。
Tailor\[1\]是西瓜视频 Android 团队开发的一款内存快照裁剪压缩工具,广泛用于字节跳动旗下各大 App 的 OOM 治理及异常排查,收益显著,在西瓜视频上更是取得 OOM 降低95%以上的好成绩。Tailor 工具现已开源,本文将通过原理、方案和实践来剖析 Tailor 的相关细节。
AICore2022 年底横空出世的 GPT-3.5 引发了全球的大模型 LLM 狂潮。作为在 AI 领域耕
奥特曼斯坦福对话万字实录来了!关于GPT5、AGI、核聚变发电、人类未来 作者:腾讯科技 原文链接: 公众号: 腾讯科技 发布时间: 1970-01-01 08:33:44 原文链接: 丨划重点 ① 没有必要害怕超级智能的人工智能,因为与未来的模型相比,每个新模型都被认为能力不足,进而推动了持续的改进。 ② 仅仅专注于解决当前的人工智能限制可能是徒劳的,因为像GPT-5和GPT-6这样的未来模型可能会使这种努力过时。 ③ 太空不适合生物生存,人类派出机器人探索和殖民太空将更容易。 ④ 奥特曼在再生能源领域最看好核聚变,未来有望把一度电成本降至1美分。...
Android11+ AIDL:专为提升应用性能而生! Android新版本AIDL性能再提升化! 点击下方👇关注Android系统攻城狮 每日充电:OS+MultiMedia学习之旅
Explore the significant AI advancements, impactful partnerships, and legal debates that defined 2023. AI has undoubtedly made waves in 2023 and here we spotlight the most significant stories of the year poised to shape the future of this groundbreaking industry: *Correction: In the original blog post published on December 22, 2023, the title "AI Re...
2023 年是 AI 领域的关键年份,我们在此聚焦今年对该行业未来发展具有重大影响的主要事件 2023 年是 AI 领域的关键年份,我们在此聚焦今年对该行业未来发展具有重大影响的主要事件: *更正:在 2023 年 12 月 22 日发布的原博客中,标题"AI 发布(AI Releases)"造成了误解,因为内容涵盖了公告、更新及发布等多方面。我们对文本和信息图的标题进行了澄清。Stability AI 对其大语言模型(LLM)开源的提及未出现在信息图中,但保留在文章里,这强调了其在提升可获取性而非仅仅技术改进方面的重要性。信息图最初展示了 xAI 创业公司的成立,现已因不相关而移除。同时,Apple Vision Pro 的提及也被删去,因为文章更侧重于软件。我们还加入了最新发布的 Mid...
2023 年对我来说是神奇的一年,我意外的从一个程序员变成了一个 AI 资讯届的“网红”,到年底的时候我在 X 平台的阅读量超过 1 亿,微博上的阅读量则超过 10 亿,很多人通过我的微博或者 X 了解最新的 AI 资讯、教程和 Prompt 使用技巧。而这一切其实是从我患上了 AI 焦虑症开始的。我将向你分享我的故事,如何患上了 AI 焦虑症,又是如何克服它,并且成功的把 AI 变成自己的得力助手,让自己成为善用 AI 的人。 2023 年对我来说是神奇的一年,我意外的从一个程序员变成了一个 AI 资讯届的"网红",到年底的时候我在 X 平台的阅读量超过 1 亿,微博上的阅读量则超过 10 亿,很多人通过我的微博或者 X 了解最新的 AI 资讯、教程和 Prompt 使用技巧。而这一切其实...
The Cook and the Chef: Musk's Secret Sauce — Wait ... English The Cook and the Chef: Musk8217;s Secret Sauce November 6, 2015 By Tim Urban This is the last part of a four-part series on Elon Musks companies....
What Is ChatGPT Doing ... and Why Does It Work? English What Is ChatGPT Doing … and Why Does It Work?—Stephen Wolfram Writings ≡ Stephen Wolfram Writings ABOUT WRITINGS PUBLICATIONS MEDIA SCRAPBOOK CONTACT Recent | Categories Artificial Intelligence Big Picture Biology Companies &...
TikTok and the Sorting Hat — Remains of the Day English TikTok and the Sorting Hat August 04, 2020 by Eugene Wei I often describe myself as a cultural determinist, more as a way to differentiate myself from people with other dominant worldviews, though I am not a strict adherent....
American Idle — Remains of the Day I promised one final piece on TikTok, focused primarily on the network effects of creativity. And this is that, in part. But it discusses a bunch of other topics, some only tangentially related to TikTok. All the points I wanted to cover seem hyperlinked in a sprawling loose tangle. This could easily have been sev...
Azure OpenAI 的提示工程技术 - Azure OpenAI Service | Microsoft Learn 了解有关如何使用 GPT-3、ChatGPT 和 GPT-4 模型进行提示工程的选项 本指南不深入介绍聊天补全消息结构背后的机制。 如果你不熟悉以编程方式与 ChatGPT 和 GPT-4 模型交互,建议先阅读有关聊天补全 API 的操作指南。 本指南的这一部分中的所有示例都针对基础 GPT-4 模型进行了英语测试。 如果你在通过另一种语言阅读本文的本地化版本,则这些响应表示英语结果的本地化翻译。 若要根据你用于提示模型的语言详细了解潜在的限制,请参阅负责任 AI 透明度说明。
70款ChatGPT插件评测:惊艳的开发过程与宏大的商业化愿景 - 知乎 TL;DR: 我们对ChatGPT的插件商店中总共70款插件进行了评测。区别于Chrome,AppStore等平台的代码开发范式,开发者仅使用自然语言就可以开发ChatGPT插件,并由GPT模型自行决定在使用过程中是否调用插件。约八成插件… Shimmer: Nutrition Coach TL;DR: 我们对ChatGPT的插件商店中总共70款插件进行了评测。区别于Chrome,AppStore等平台的代码开发范式,开发者仅使用自然语言就可以开发ChatGPT插件,并由GPT模型自行决定在使用过程中是否调用插件。约八成插件集中于购物、餐饮、旅行、住房和求职场景,其余分布在教育、财经咨讯、内容社区和编程技术场景...
ChatGPT的火爆出圈,让大家对NLP语言模型的发展历程产生了浓厚的兴趣。本文将从深度学习在NLP领域的发展历程,到大语言模型的发展历程,再到大语言模型的未来展望,带你一起了解NLP语言模型的发展历史。 本文处于初稿状态,可能存在很多错误,如果你有不同的看法,欢迎不吝赐教,先行感谢! ChatGPT的火爆出圈,让大家对自然语言处理(Natural Language Processing)语言模型的发展历程产生了浓厚的兴趣。本文将从深度学习在NLP领域的发展历程,到大语言模型的发展历程,再到大语言模型的未来展望,带你一起了解NLP语言模型的发展历史。 想必很多人对ChatGPT涌现出的多领域能...
陆奇在这篇演讲中用信息、模型、行动三位一体框架解释大模型拐点:模型成本正从边际成本走向固定成本,AI 会重塑服务经济、创业机会和个人职业价值。文章适合作为理解中国 AI 创业语境、OpenAI 影响和大模型时代结构性机会的背景材料。
English AutoGPT is a powerful platform that allows you to create, deploy, and manage continuous AI agents that automate complex workflows. Download to self-host (Free!). Join the Waitlist for the cloud-hosted beta. Setting up and hosting the AutoGPT Platform yourself is a technical process....
Apple Neural Engine 上部署 Transformer 的技术方案
#67 OpenAI CEO 详解 GPT-4与AI的未来(播客笔记) 3月20日,OpenAI CEO Sam Altman 和科技主播 Lex Fridman 进行对谈,主要讨论 GPT-4、通用人工智能(AGI)、 OpenAI 公司、AI 带来的潜在问题,以及 AI 的未来。我总结了对话中最启发我的部分,约 3000字。受限于精力与认知,笔记中难免有谬误,敬请指正。总体来说,Sam Altman 认为,GPT-4 等 AI 系统并非少数人的成果,而是源于无数人... 3月20日,OpenAI CEO Sam Altman 和科技主播 Lex Fridman 进行对谈,主要讨论 GPT-4、通用人工智能(AGI)、 OpenAI 公司、AI 带来的潜在问题,以及 AI 的未来。 我总结...
最近两个月,受到香港中文大学卓越传媒人驻校计划的邀请,我在香港进行了为期八周的访学,并为新闻学院的学生们开设了一个工作坊,主题是关于"如何提问"。就在我们上课的几周时间里,ChatGPT以迅雷不及掩耳的速度进入了大众的视野。我在课上与同学们进行了讨论。有人说,在GPT的时代,会提问可能比会回答更加重要。有人欣喜,认为GPT将大大提高人类工作效率,减少无意义的重复劳动;也有人担忧,认为GPT可能会带来大规模失业,甚至动摇社会的基本结构。 比尔·盖茨称赞,当前这场由ChatGPT衍生开来的人工智能革命是他所见到的自1980年以来最具革命性的技术进步。具体来说,GPT的革命性到底体现在什么地方?当前关于人工智能的讨论有些怎样的误区?它可能会带来什么影响?有什么是它能做的、又有什么是它永远也做不到的...
GitHub - getActivity/AiIndex: ChatGPT ChatGPT. Contribute to getActivity/AiIndex development by creating an account on GitHub. * OpenAI 开发的 ChatGPT 在全球瞬间爆火,上线仅 5 天,ChatGPT 用户就超过 100 万,而在推出不到 3 个月,它的月活用户就突破了 1 亿,成为人类历史上最快用户破亿的软件产品;这使我对 ChatGPT 产生了非常浓厚的兴趣,当我第一次尝试使用它时,我被它的出色表现惊艳到了,我没想到它能真正理解我的话,并且能够将...
《通用人工智能的火花:GPT-4早期实验》是3月最重要的一篇论文,引起了广泛的关注和讨论,但是论文长达 154页,中文版本还无人翻译。
最近ChatGPT可以说是火遍了全世界,作为由知名人工智能研究机构OpenAI于2022年11月30日发布的一个大型语言预训练模型,他的核心在于能够理解人类的自然语言,并使用贴近人类语言风格的方式来进行回复。模型开放使用以来,在人工智能领域引起了巨大的轰动,也成功火出了技术圈。从数据上看,ChatGPT用户数在5天内就达到了100万,2个月就达到了1亿;另外,在很多非人工智能领域,已经有机构在尝试用ChatGPT去做一些智能生成的事。…
基于Stable Diffusion扩散模型的综述 AIGC,这个当前的现象级词语。本文尝试从文生图的发展、对其当前主流的 Stable Diffusion 做一个综述。以下为实验按要求生成的不同场景、风格控制下的生成作品。 GAN 系列算法开启了图片生成的新起点。GAN的主要灵感来源于博弈论中零和博弈的思想,通过生成网络G(Generator)和判别网络D(Discriminator)不断博弈,进而使G学习到数据的分布。 G是一个生成式的网络,它接收一个随机的噪声z(随机数),通过这个噪声生成图像。 D是一个判别网络,判别一张图片是不是"真实的"。它的输入参数是x,x代表一张图片,输出D(x)代表x为真实图片的概率,如果为1,就代表100%是真实的图片。
Lilian Weng 经典 Prompt Engineering 综述。系统梳理 zero/few-shot、Instruction Prompting、CoT、Self-Consistency、ToT 等技术,深入分析 few-shot 示例选择策略(k-NN、图方法、对比学习)。还涵盖 ReAct、PAL 等外部工具范式。引用最广的入门文献之一。
Can GPT-4 *Actually* Write Code? I test GPT 4's code-writing capabilities with some actual real world problems. Since ChatGPT came out I've seen quite a lot of people posting about its capability to write code. People have posted about how they had it design and implement a number puzzle game (wit...
GPT-4 重磅发布,有哪些升级和变化? 作者:qizailiu,腾讯 IEG 算法研究员 > 昨天 OpenAI 发布最新里程碑 AI 语言模型 GPT-4,GPT-4 是一个大型多模态模型(接受图像和文本输入,输出为文本),目前虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平。 本文主要参考 OpenAI 关于 GPT4 的官方 Blog,目前各公众号关于 GPT4 的内容基本来自官方 Blog、技术报告和官方视频内容。相关内容传送门: 官方 ChatGPT Plus 体验地址:<
对于 ChatGPT 如今大家应该都不陌生,经过这么长时间的「调戏」,相信大家应该都感受用 ChatGPT
GPT-4震撼发布:多模态大模型,直接升级ChatGPT、必应,开放API,游戏终结了? > ChatGPT 点燃了科技行业的明灯,GPT-4 能燎原吗? 谁能革得了 ChatGPT 的命?现在看来还是 OpenAI 自己。 在 ChatGPT 引爆科技领域之后,人们一直在讨论 AI「下一步」的发展会是什么,很多学者都提到了多模态,我们并没有等太久。今天凌晨,OpenAI 发布了多模态预训练大模型 GPT-4。 GPT-4 实现了以下几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至 2.5 万字;回答准确性显著提高;能够生成歌词、创意文本,实现风格变化。 「GPT-4 是世界第一款...
ChatGPT 在做什么… 以及它为何发挥作用? 作者:Stephen Wolfram,发表于 2023年2月14日原文链接: 作者 :Stephen Wolfram,发表于 2023年2月14日 原文链接 : 文章字数 :约 3.4 万字 建议收藏后阅读...... 提示:本文包括一百多张图片...... 微信公共账号的编辑器经常会出现图片处理错误(尤其是在使用 Markdown 处...
作者:yiqiuzheng,腾讯 IEG 前端工程师 这两年 AI 关键词频频热搜,从 2022 年 4 月初代码自动补全神器Copilot点燃程序员圈,到 10 月中旬的 AI 绘画Stable Diffcusion 1.0震惊绘画圈,最后到如今的ChatGPT引爆全网各领域。AI 人工智能时代已然到来。在 2023 年,AI 绘画技术和应用的发展已经非常迅速。目前,AI 绘画技术已经能够生成逼真的图像、视频和音频,同时还能够模仿艺术家的风格,创造出令人惊叹的艺术作品。 但是这些早期的 AI 绘画模型要么被大公司长久把持(例如OpenAI公司,他们早在 2021 年就推出了Dall-E1AI绘画模型,并未开源。直到Stability AI公司于 2022 年 8 月...
GitHub - PlexPt/awesome-chatgpt-prompts-zh: ChatGPT 中文调教指南。各种场景使用指南。学习怎么让它听你的话。 ChatGPT是由OpenAI训练的一款大型语言模型,能够生成类人文本。 官网是 它能够生成类似于人类写作的文本。您只需要给出提示或提出问题,它就可以生成你想要的东西。 在此页面中,您将找到可与 ChatGPT 一起使用的各种提示。 只需按照README.md文件中的提示输入即可。 点击这里 可以将您自己的调教指南添加到列表中。 同时您也可以从这个文件中获取创作灵感来创建您自己的提示。 如果你想将...
从 ChatGPT 看 AI 未来的 7 种场景可能性 公众号: 刘言飞语 发布时间: 1970-01-01 08:33:43 原文链接: 写在前面 ChatGPT 自去年 11 月 30 日发布后,开始在科技圈里引起热议。到了如今 2 月份,已经变成(科技领域)全民狂欢,有个说法是,Web3 的开发者大都掉头去搞 AI 了;大厂纷纷入局,紧张加码;民间也有老王带 5000 万美金下场,ChatGPT 套壳产品遍地丛生。 在充满焦虑和 fomo 氛围中,我还是想着是否能捋出一条自己的思路来——AI 到底能做什么? 很多初次接触的朋友第一印象就是,这不就是个很聪明的聊天机器人嘛?无非是个加强版的小冰。有趣之后,怕是就没有需求了。这个观点恐怕是错的。...
ChatGPT的工作原理,这篇文章说清楚了 ChatGPT 能够自动生成一些读起来表面上甚至像人写的文字的东西,这非常了不起,而且出乎意料。但它是如何做到的?为什么它能发挥作用?我在这里的目的是大致介绍一下 ChatGPT 内部的情况,然后探讨一下为什么它能很好地生成我们认为是有意义的文本。 我首先要说明一下,我将把重点放在正在发生的事情的大的方向上,虽然我会提到一些工程细节,但我不会深入研究它们。(我所说的实质内容也同样适用于目前其他的 "大型语言模型" LLM 和 ChatGPT)。 首先要解释的是,ChatGPT 从根本上说总是试图对它目前得到的任何文本进行 "合理的延续",这里的 ...
The AI Arms Race Is On. Start Worrying English To create is human. For the past 300,000 years weve been unique in our ability to make art, cuisine, manifestos, societies: to envision and craft something new where there was nothing before.Now we have company....
每一代GPT模型的参数量都爆炸式增长,堪称“越大越好”。2019年2月发布的GPT-2参数量为15亿,而2020年5月的GPT-3,参数量达到了1750亿。 还是有很多读者对于ChatGPT充满期待(幻想?梦想),今天给大家分享技术层… 每一代GPT模型的参数量都爆炸式增长,堪称"越大越好"。2019年2月发布的GPT-2参数量为15亿,而2020年5月的GPT-3,参数量达到了1750亿。 还是有很多读者对于ChatGPT充满期待(幻想?梦想),今天给大家分享技术层面的拆解,读完之后是否是会理性一点呢?enjoy~ 文末推荐几篇直接采访ChatGPT创始人视角的文章,共赏enjoy~ 去年1...
ChatGPT能否取代Google、百度这样的传统搜索引擎?为什么中国不能很快做出ChatGPT?当前,对这些问题的探讨大多囿于大型语言模型(LLM)的技术可行性,忽略或者非常粗糙地估计了实现这些目标背后的经济成本,从而造成对LLM的开发和应用偏离实际的误判。 本文作者从经济学切入,详细推导了类ChatGPT模型搜索的成本、训练GPT-3以及绘制LLM成本轨迹的通用框架,为探讨LLM成本结构和其未来发展提供了可贵的参考视角。 * LLM驱动的搜索已经在经济上可行 :粗略估计,在现有搜索成本结构的基础上,高性能LLM驱动搜索的成本约占当下预估广告收入/查询的15%。 * 但经济可行并不意味着经济...
谈谈ChatGPT 背后的核心技术论文 公众号: 架构师 发布时间: 1970-01-01 08:33:43 原文链接: 架构师(JiaGouX) 我们都是架构师! 架构未来,你来不来? 缘起 输入几个简单的关键词,AI能帮你生成一篇短篇小说甚至是专业论文。作为上知天文下知地理对话语言模型,最近大火的ChatGPT在邮件撰写、视频脚本、文本翻译、代码编写等任务上强大表现,让埃隆·马斯克都声称感受到了AI的“危险”。 最近大火的ChatGPT的计算逻辑来自于一个算法名字叫Transformer。它来源于2017年的一篇科研论文《Attention is all your need》。...
科技爱好者周刊(第234期):AI 聊天有多强? 公众号: 阮一峰的网络日志 发布时间: 1970-01-01 08:33:42 原文链接: 这里记录每周值得分享的科技内容,周五发布。 封面图 荷兰乌特勒支市的图书馆,读者如果想要为电子设备充电,必须自己骑自行车发电。(via\[1\]) 本周话题:AI 聊天有多强? 上周最大的技术新闻是,OpenAI 公司发布\[2\]了一款 AI 聊天软件 ChatGPT\[3\]。 它其实不能算聊天软件,更像是一个“问不倒先生”,不管什么问题,都能告诉你答案。 它的回答质量之高,令人震惊,完全不像机器人,更像百科全书。 网友问它:“大家都說租房就是帮房东缴房贷,所以买房才是更好的选择。你怎么看? 它回答如下: “是的,有人认为租房只会帮助房东偿还房贷,而购买房屋才是更好的选择。...
ChatGPT内核:InstructGPT,基于反馈指令的PPO强化学习 聊天机器人 ChatGPT 在诱导下写出「毁灭人类计划书」,并给出... 5.1 对准性研究(Alignment Research)的启发 > 聊天机器人 ChatGPT 在诱导下写出「毁灭人类计划书」,并给出代码,AI 发展有哪些问题需关注? 泻药。开发GPT也有两年了,看到这样的新闻确实是欣慰而震撼的。GPT Family刚提出的时候并没有受到很大的关注度,因此GPT-1也是不温不火。到GPT-2的时候auto-regressive paradigm终于开始有一群大佬研究,到现在也在学术界被广泛研究,很多大模型都...
Google 介绍 MLGO 框架,首个工业级将 ML 系统性集成到 LLVM 编译器的通用框架。使用强化学习训练神经网络替代编译器中的启发式决策。两个具体优化:1) Inlining-for-size:通过 RL 策略替代内联启发式,在 30k 模块上训练的策略可泛化到其他软件,实现 3%-7% 代码体积缩减(Fuchsia OS 上达 6.3%);2) Regalloc-for-performance:寄存器分配优化,提升 0.3%-1.5% QPS。训练后的策略通过 XLA AOT 嵌入编译器,无运行时依赖。
本文总结对于深度学习编译领域过去两年的思考和未来展望。新一代架构一直是我们核心关注的主题,这里提到的各个特性也都已重构完成或者进行中。TVM FFI去年逐渐成熟,TensorIR本身刚被合并到主干,后续metaschedule陆续进入主干。
Android 车载应用开发与分析 (4)- 编写基于AIDL 的 SDK - 掘金 之前介绍了车载应用开发体系中如何使用Jetpack在HMI中构建MVVM架构Android 车载应用开发与分析 (3)- 构建 MVVM 架构(Java版),通过之前的介绍,也了解到在大多数车载 之前介绍了车载应用开发体系中如何使用Jetpack在HMI中构建MVVM架构Android 车载应用开发与分析 (3)- 构建 MVVM 架构(Java版),通过之前的介绍,也了解到在大多数车载系统应用架构中,一个完整的应用往往会包含三层,分别是 HMI Human Machine Interface,显示UI信息,进行人机交互。 Service
Fragment 是 Android 中历史十分悠久的一个组件,在 Android 3.0 (API 级别 11)的时候推出,时至今日已成为 Android 开发中最常用的组件之一。在一开始的时候,引入 Fragment 的目的是为了在大屏
Progress is not achieved by luck or accident, but by working on yourself daily. English "Progress is not achieved by luck or accident, but by working on yourself daily." This powerful statement is attributed to the ancient Greek Stoic philosopher Epictetus (c. 50–130 AD)....
"If something is humanly possible, it's attainable by you too." | Revue StoicallyTyped Newsletter - Happy Monday! Here is Issue #10! This issue will be a special issue that focuses on being a collection of resources related to the no Happy Monday! Here is Issue #10! This issue will be a special issue that focuses on being a collection of resources ...
本文选自付费邮件通讯「iPad Power User」,这是一份聚焦 iPad、iPadOS 与个人生产力的邮件通讯产品,通过不断探索与生活、工作息息相关的数字工具与方法论,为订阅读者提供中文互联网领域最优质的数字工具使用技巧、应用(服务)推荐以及数字化思考,欢迎试读、订阅。
Android滚动组件图片加载优化与滚动速度的精确监听 | Paincker 背景 在Android应用中,ListView / RecyclerView / ScrollView 滚动时,如果有过多图片加载容易导致卡顿,特别是快速滚动时,bindView中大量图片加载操作,会导致系统频繁分配回收内存,不仅消耗大量CPU和网络流量资源,而且极端情况下还会因为内存来不及回收产生OOM。 在Android应用中,ListView / RecyclerView / ScrollView 滚动时,如果有过多图片加载容易导致卡顿,特别是快速滚动时,bindView中大量图片加载操作,会导致系统频繁分配回收内存,不仅消耗大量CPU和网络流量资源,而且极端情况下还会因为内存来不及回收产生OOM。 一种最基...
Eugene Wei 从《Seeing Like a State》出发分析 TikTok 产品设计如何帮助算法'看见'。核心论点:TikTok 成为自己的训练数据来源,产品设计创造了训练数据闭环。为所有想利用 ML 算法的公司提供产品设计范式。