Models

模型与实验室

GPT、Claude、Gemini、开源模型、模型能力边界。

111精选条目
01Models
模型与实验室 5.0 · 必读
Google Gemini Embedding 2 多模态嵌入模型

Google推出的首个原生多模态嵌入模型,支持视频分析、视觉购物助手等多种应用场景,已向公众开放使用。

为什么重要Google原生多模态嵌入模型:支持视频和视觉分析
2026-05-03 · X · @GoogleAI
02Models
模型与实验室 4.0 · 优秀
xAI 发布 Grok 4.3:常驻推理、100万上下文、超低定价,附带语音克隆套件 Custom Voices

xAI 发布 Grok 4.3 模型,主打"常驻推理"(always-on reasoning)能力,具备 100 万 token 上下文窗口,API 定价仅为 Grok 4.20 的 60%(输入 $1.25/百万token,输出 $2.50/百万token)。在 Artificial Analysis Intelligence Index 上比 Grok 4.20 提升 4 分,以 500B 参数超越 Claude Sonnet 4.6。同时发布 Custom Voices 语音克隆套件,仅需 1 分钟语音样本即可生成可用的语音克隆。xAI 工程师表示更大规模的模型正在训练中。

为什么重要xAI 用 500B 参数和激进定价在推理模型赛道上打出性价比牌,语音克隆是意外亮点。
2026-05-01 · 文章 · xAI
03Models
模型与实验室 3.0 · 值得看
深度调研:Claude Code 最强配置单 · 9 个 GitHub 工具深度评测

调研时间: 2026-04-16 调研人: AI 助理(Subagent) 主题分类: AI 开发工具 / Claude Code 生态 --- Claude Code 已成为当前 AI 辅助编程的事实标准,而其真正的威力取决于周边工具链的搭配质量. 本次调研覆盖 9 款 GitHub 上与 Claude Code 强相关的工具与插件,按功能分为知识增强、技能增强、自动化设计三类. 核心结论:Superpowers 和 GSD 是本次评测中唯二达到"必装"标准的工具——前者重塑了软件工程的纪律与方法论,后者用原子化 subagent 执行模型根治了长会话

为什么重要调研时间: 2026-04-16 调研人: AI 助理(Subagent) 主题分类: AI 开发工具 / Claude Code 生态 --- Claude Code 已成为当前 AI 辅助编程的事实标准,而其真正的威力取决于周边工具链的搭配质量.
2026-05-01 · 文章
Models 2026-05-01 · 文章
它是什么?和 Claude Code 有什么区别?

与此同时,Anthropic 的年经常性收入刚突破 300 亿美元,是去年 12 月的三倍. 华尔街已经开始紧张了,WSJ 说投资者对传统 SaaS 公司的股价越来越谨慎,担心 Anthropic 这类产品会让一些传统软件服务变得多余. 和你已经在用的 Claude Code 有什么区别. 如果你用过 Claude Code,你知道 AI 智能体怎么工作:你给它一个任务,它自己规划步骤、调用工具、写代码、改文件,一步步把事做完. Claude Code 跑在你自己的电脑上,是给开发者个人用的命令行工具. Managed Agents 跑在 Anthropic 的云上,是给企业用的 API 服务

3.0 · 值得看 研究者
Models 2026-05-01 · 文章
四项新研究一致显示:LLM 医疗建议准确率低,不应作为临床决策依据

Source: Gary Marcus | 2026-04-23 URL: com/p/please-dont-trust-your-chatbot-for > 注:原文抓取失败,此内容基于 RSS 摘要整理. Gary Marcus compiles four new studies warning against LLM medical advice. BMJ: nearly 50% of chatbot responses on cancer/vaccines/nutrition had serious problems, delivered wi

3.0 · 值得看 研究者
Models 2026-05-01 · 文章
iamzhihuix/skills-manage: Desktop app to manage AI coding agent skills across Claude Code, Curso...

备注:原文抓取自 GitHub(iamzhihuix/skills-manage),README 全文保存于此. > 原文链接: com/iamzhihuix/skills-manage > 作者:iamzhihuix > 发表时间:2026-04-21 > 抓取时间:2026-04-22 --- (全文见 Obsidian 本地备份:`Cubox/iamzhihuix-skills-manage- Desktop app to manage AI coding agent skills across Claude Code, Cursor, G

3.0 · 值得看 研究者
Models 2026-05-01 · 文章
awesome-gpt-image-2: GPT-Image2 工业级提示词引擎与模板库

GitHub: com/freestylefly/awesome-gpt-image-2 Stars: 1235 (截至 2026-04-27) License: MIT GPT-Image2 全量开放后,AI 画图从"能不能出图"变成了"能不能稳定、可控、可复用地出图". 这个项目做的不是单纯收集提示词,而是把零散案例逆向整理成一套更适合 Agent 和自动化工作流调用的 Prompt-as-Code 资产. 核心目标:把"散文式提示词"压缩成"结构化协议". - 🧱 原子化 Schema:把主体、光影、材质、排版等视觉要素拆成可组合组件 - ⚙️ 工作流友好

3.0 · 值得看 研究者
Models 2026-05-01 · 文章
Gemini 3.1 Flash TTS:最强表现力语音合成模型,70语言覆盖

质量评分:5 来源: com/GoogleAI/status/2044447638511383024 抓取时间: 2026-04-18 --- 原文: > Today we launched Gemini 3. 1 Flash TTS, our most expressive and controllable text-to-speech model yet. This launch includes audio tags. 🗣🏷 Audio

3.0 · 值得看 研究者
Models 2026-05-01 · 文章
GPT-2 规模模型训练干预实验:学习率是最大变量,Dropout 反而有害

Source: Giles Thomas | 2026-04-23 URL: com/2026/04/llm-from-scratch-32m-interventions-conclusion Giles Thomas 在自己训练 GPT-2 规模模型(163M 参数,44 小时本地训练)过程中系统性测试了多种干预手段. 按效果排序:学习率调整(最大收益)+ 调度;Weight decay(有效);QKV bias(微小帮助);Gradient clipping(效果有限);PyTorch AMP(训练速度翻倍但 loss 轻微变差);Weight tying(反而让

3.0 · 值得看 研究者
Models 2026-05-01 · 文章
Farzapedia:用 LLM 把日记笔记变成个人维基的完整工作流

质量评分:5 来源: com/karpathy/status/2040572272944324650 抓取时间: 2026-04-18 --- 原文: > Farzapedia, personal wikipedia of Farza, good example following my Wiki LLM tweet. I really like this approach to personalization in a number of

3.0 · 值得看 研究者
Models 2026-05-01 · 文章
Claude Code 从 Pro 版移除引发信任危机,Anthropic 仅靠一条推文回应

Source: Simon Willison | 2026-04-22 URL: net/2026/Apr/22/claude-code-confusion/ > 注:原文抓取失败,此内容基于 RSS 摘要整理. Anthropic quietly moved Claude Code from the $20/month Pro plan to the $100/month Max plan on claude. com/pricing, sparking outrage across Reddit/HN/Twitter. An Anthropic

3.0 · 值得看 研究者
Models 2026-05-01 · 文章
Claude Code 2026: New Features and Agentic Capabilities

发布时间: 2026-04-24 > 作者: Anthropic Team --- 摘要 / Summary: Claude Code 在 2026 年迎来重大更新,第一季度发布了多个重要功能:Remote Control(远程控制)、Dispatch(后台工作流)、Channels(频道)、Computer Use(计算机控制)、Auto Mode(自动模式)和 AutoDream. Sonnet 5 "Fennec" 作为 Claude 5 代的第一个模型,拥有 100 万 token 上下文窗口,并引入 Dev Team 多智能体协作模式. 界面重新设计集成了终端、文件编辑、

3.0 · 值得看 研究者
Models 2026-05-01 · 文章
ChatGPT Images 2.0 发布,Where's Waldo 风格测试引发争议

Source: Simon Willison | 2026-04-21 URL: net/2026/Apr/21/gpt-image-2/ OpenAI 发布 ChatGPT Images 2. 0,Sam Altman 称从 gpt-image-1 到 2 是巨大飞跃. Simon Willison 测试发现:细节还原很好但文字渲染仍有错误;让模型找自己生成的 raccoon 并画红圈,模型答错了自己在图里画的内容——说明多模态模型的自我验证能力仍存在明显漏洞. 这类 Where's Waldo 风格测试暴露了当前图像生成+视觉推理 pipeli

3.0 · 值得看 研究者
Models 2026-05-01 · 文章
Anthropic 等 Nature 论文:LLM 可通过无关数据传递隐藏偏好

质量评分:4 来源: com/AnthropicAI/status/2044493337835802948 抓取时间: 2026-04-18 --- 原文: > Research we co-authored on subliminal learning—how LLMs can pass on traits like preferences or misalignment through hidden signals in data—

3.0 · 值得看 研究者
Models 2026-04-30 · 文章
DeepSeek V4 发布:1.6 万亿参数、适配华为昇腾,API 价格再砍至首发价十分之一

DeepSeek 发布 V4 系列,包含 1.6 万亿参数的 V4-Pro 和 2840 亿参数的 V4-Flash,均支持 100 万 token 上下文窗口,MIT 开源。V4 发布前未向英伟达和 AMD 提供早期访问,而是提前数周让华为进行软件适配优化,这是大模型行业首次。API 缓存命中价格降至首发价的十分之一,V4-Pro 已成为 DeepSeek 内部 Agentic Coding 模型。

deepseekv4huaweiascendopen-sourcepricing
4.0 · 优秀 研究者
Models 2026-04-30 · 文章
Building with Gemini Embedding 2: Agentic multimodal RAG and beyond

Gemini Embedding 2 正式GA,是首个将文本、图像、视频、音频和文档映射到统一语义空间的多模态嵌入模型。支持超过 100 种语言,单次调用可处理 8192 token 文本、6 张图像、120 秒视频、180 秒音频和 6 页 PDF。通过 task prefix 实现非对称检索,显著提升 Agentic RAG 和视觉搜索精度。法律平台 Harvey 借此 Recall@20 提升 3%,视觉搜索 Match@20 从 60% 提升至 87%。

geminiembeddingmultimodalRAGvision-search
4.0 · 优秀 研究者
Models 2026-04-29 · 文章
Centaur 认知模型遭质疑:号称模拟人类思维 160 项任务,实际"知道答案但不懂问题"

此前被报道为认知心理学突破的 AI 模型 Centaur,声称能在 160 项认知任务上模拟人类思维。但新研究发现其最大局限在于语言理解——能给出正确答案但无法识别问题背后的意图。数据拟合层面的表现不等于认知模拟能力,对"AI 已接近人类认知能力"的叙事提出了重要修正。

ai-researchcognitive-sciencecentaurcriticism
3.0 · 值得看 研究者
Models 2026-04-26 · GitHub
awesome-gpt-image-2: World's largest GPT Image 2 prompt library

awesome-gpt-image-2 是目前最大的 GPT Image 2 提示词库,每日更新,汇集 1800+ 精选提示词并附带预览图,支持 16 种语言。GPT Image 2 的核心能力:精准文字渲染(中日英)、跨图一致性、商业级插画输出、故事板/IP 角色生成、多语言设计海报。同时提供 YouMind GPT Image 2 Prompts Gallery 在线画廊,支持分类浏览和 AI 一键生成。GitHub 2558 Stars。

gpt-image-2openaiprompt-libraryimage-generationmultimodal
3.0 · 值得看 研究者
Models 2026-04-25 · X
Qwen-Image-2.0-Pro 发布,Text-to-Image 排名进入全球前 10

Qwen 图像模型升级到 2.0 Pro,图像质量、多语言文字渲染和指令遵循能力全面提升。在 Text-to-Image Arena 全球排名第 9,人像、写实、电影风格等细分场景进入前 10。主打更一致的跨风格表现,中文场景优化到位,适用于国际化视觉内容生产。国产开源视觉模型又一次突破,是做国际化视觉内容的新选择。

ai-toolsqwenimage-generation
4.0 · 优秀 研究者
Models 2026-04-25 · X
AI驱动的设计工具分享

Suryansh Tiwari 深度解析了 Claude 风格多智能体系统的两种核心架构:Sub-Agents(隔离执行,单次任务,父节点控制)和 Agent Teams(协作通信,共享上下文,对等交互)。核心区别在于上下文边界的设计而非角色分工。提出了 5 种关键模式:Prompt Chaining、Routing、Parallelization、Orchestrator-Worker、Evaluator-Optimizer。强调应基于上下文边界而非角色来拆分任务,避免每个交接点的质量损失。

multi-agentsub-agentsagent-teamsclaudearchitecture
4.0 · 优秀 研究者
Models 2026-04-23 · X
Qwen 3.6 27B 模型登陆 Ollama

Qwen 3.6 27B 参数模型已在 Ollama 平台上线,同时支持 OpenClaw(openclaw launch openclaw --model qwen3.6:27b)和 Claude Code(ollama launch claude --model qwen3.6:27b)等主流 Agent 工具。这是 Qwen 系列在开源本地部署方向的又一次推进,配合 Ollama 的生态,在消费级硬件上跑起来相对轻松。对于需要本地部署开源模型做私有化工作的团队,这是一个值得测试的新选项。

qwenollamaopen-sourcelocal-llm
4.0 · 优秀 研究者
Models 2026-04-22 · X
免费 5 天课程:从 AI 用户到 AI 建造者

Allie K. Miller 推出免费 5 天邮件课程「AI Fast Track」,核心主张是:「用 AI」与「用 AI 建造工具」之间存在鸿沟,仅复制粘贴 Prompt 远远不够。课程无需编程基础,手把手教你用 Claude 构建个人 AI 软件、自动化脚本和实用工具。每天一个主题,聚焦可落地的 side project,而非泛泛的 AI 概念,tens of thousands 已经注册,适合想从「消费者」升级为「建造者」的 AI 用户。

ai-toolstutorialclaudeautomation
5.0 · 必读 研究者 / 学习者
Models 2026-04-22 · X
16 分钟掌握 Claude Design 全套用法:视频/幻灯/网站/App/设计系统

Peter Yang 发布 Claude Design 实操教程 live demo,在 16 分钟内演示了用 Claude Design 创建视频、幻灯片、网站、App 乃至完整设计系统的完整流程。涵盖从概念到可交付物的每一步,展示 Claude 在多模态创意工作中的实际能力边界。视频为实时演示,可直接参考其操作路径用于自己的项目。

ai-toolsclaudedesigntutorial
5.0 · 必读 研究者 / 学习者
Models 2026-04-18 · X
Google推出企业版Android Studio Gemini:隐私保护的企业级AI编程辅助

Google在Android Studio中推出企业版Gemini,提供超越消费版的高级隐私保护:客户代码和输入不用于训练共享模型,数据由客户自有,SOC 1/2/3和ISO/IEC 27001等多项认证覆盖,并支持Private Google Access、VPC Service Controls和细粒度IAM权限。面向对数据安全有要求的大中小企业,标志着AI编程辅助工具进入企业合规时代。

androidgeminigoogleenterprisecode-assistprivacy
4.0 · 优秀 研究者
Models 2026-04-18 · X
Gemini Agentic Vision:LLM自己写代码,完成复杂视觉推理任务

Gemini新增视觉Agent能力:模型可将数据表格转化为高质量图表、分析信息图、理解图像内容并绘制边界框、按大小对物体进行视觉排序等。核心突破是LLM能自主写代码来驱动视觉任务执行,而非预设视觉管道,标志着视觉推理从「固定流程」向「自主规划」的重要转变。

geminivisionagenticmultimodalcode-executionchart-generation
4.0 · 优秀 研究者
Models 2026-04-16 · X
Gemini 3.1 Flash TTS 登陆 Google Vids,支持一键脚本转专业旁白

Google AI 宣布 Gemini 3.1 Flash TTS 已在 Google Vids 中推送,同时通过 Gemini API 和 Google AI Studio 预览开放。该功能可将脚本一键转化为工作室级旁白配音,面向 pitch deck 和 passion project 等场景。这是 Google 生态内首次实现「脚本→专业配音」的端到端覆盖,视频创作者无需再借助第三方语音合成工具,工作流大幅简化。

ai-toolsttsgooglegemini
5.0 · 必读 研究者
Models 2026-04-16 · 文章
KV Cache 深度解析:为什么 LLM 第一个 Token 最慢

从注意力机制原理出发,详解 KV Cache 的工作原理与工程权衡。自回归生成中 Token 1-49 的 K/V 每次都重算是 O(n^2) 浪费;KV Cache 把历史 K/V 只算一次并缓存,新 Token 只追加自己的 K/V,实现约 5x 提速;代价是显存占用,context window 翻倍意味着单请求 cache 翻倍。Prefill 阶段(首个 Token)最贵,因为要一次性算完所有历史 K/V,这就是 TTFT 瓶颈的来源。GQA/MQA 通过共享 K/V head 显著降内存,是大规模服务必用方案。

KV-CacheLLMinferenceTTFTprefillattention
4.0 · 优秀 研究者
Models 2026-04-14 · X
LLM长期记忆问题

[EN] - 来源:X/Twitter 原文链接: 作者:chrysb 日期:2026-04-14 抓取时间:2026-04-14 12:00...

llmmemorycontext-windowretrievalsummarizationconversation-ai
5.0 · 必读 研究者
Models 2026-04-14 · 文章
Get ready for Google I/O: Livestream schedule revealed

Google I/O 2026 将于 5 月 19-20 日举行,重点聚焦 AI、 Android、Chrome 和 Cloud 领域。大会将以'代理时代'(agentic era)为主题,发布面向 AI 自动化复杂工作流的新工具,简化 AI 就绪应用的高质量构建。注册已开放,可在线观看主题演讲和技术演示。

google-ioagenticai-toolsandroidgemini
4.0 · 优秀 研究者
Models 2026-04-14 · X
Decoding Transformer Architecture

[EN] - 来源:X/Twitter 原文链接: 作者:amitiitbhu 日期:2026-04-14 抓取时间:2026-04-14 12:00...

transformerattentionllmarchitectureencoderdecoder
4.0 · 优秀 研究者
Models 2026-04-12 · X
MiniMax M2.7 正式开源:代码编辑 SOTA,权重已上线 Hugging Face

MiniMax M2.7 模型权重已在 Hugging Face 公开,达到 SWE-Pro 56.22% 和 Terminal Bench 2 57.0% 的 SOTA 性能。该模型为特殊许可,禁止未经授权商业使用,并非 OSI 认可的开源定义。配套提供 MiniMax API 和技术博客。M2.7 在代码编辑和终端任务上表现优异,对研究者和非商业用途的开发者是值得关注的新基座模型。

ai-toolsopen-sourceminimaxcode
5.0 · 必读 研究者
Models 2026-04-11 · 文章
万字干货:理解 Harness Engineering,看这一篇就够了

Harness Engineering 是继 Prompt Engineering 和 Context Engineering 之后 2026 年 AI 领域的核心工程方法论,由 HashiCorp 联合创始人 Mitchell Hashimoto 提出。核心比喻是缰绳:AI Agent = SOTA 模型(野马)+ Harness(驾驭系统)= 千里马。文章系统性拆解了 Harness 的设计目标(R.E.S.T 模型:可靠性、效率、安全性、可观测性)、四层架构(控制平面+数据平面)、核心运行机制(REPL 容器抽象、Token 转化流水线、Function Calling 生命周期)、规划模式(Plan-and-Execute 为主)、沙盒执行框架(从进程级到 VM 级四档隔离)以及度量体系。适合 Agent 系统工程师建立完整的工程化框架认知。

harness-engineeringai-agentprompt-engineeringcontext-engineeringllmsandbox
4.0 · 优秀 研究者
Models 2026-04-10 · 文章
[2303.10130] GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language...

GPTs are GPTs: 劳动力市场影响潜力初探 原文链接: 原文:GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models Title GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models 标题(中文): GPTs are GPTs:大型语言模型对劳动力市场影响潜力的初步审视 Authors Tyna Eloundou, Sam Manning, Pamela Mishkin, Daniel Rock 作者(中文): Tyna Eloundou、Sam Manning、Pamela Mishki...

3.0 · 值得看 研究者
Models 2026-04-06 · X
Launching Claude Managed Agents

Anthropic 发布 Claude Managed Agents:预构建的可配置 Agent 运行底座,运行在托管基础设施上。三大核心概念:Agent(版本化配置)、Environment(沙盒模板)、Session(有状态运行)。四种用法:事件触发、定时、即发即忘、长时间任务。架构上将"大脑"(Claude+调度框架)、"手"(沙盒工具)、"记忆"(会话日志)解耦,支持独立故障恢复。

claudemanaged-agentsanthropicagent-sdkinfrastructurecloud-agent
5.0 · 必读 研究者
Models 2026-04-06 · GitHub
open claude design开源:超95%还原度的逆向工程

open claude design 正式开源,浓缩和逆向所有 claude design 最先进的设计模板,还原度超过 95%。历时 72 小时,18700+ 行代码,30+ 设计 Skills,支持超过 71 套设计系统,兼容所有 code agent,包括 claude code、codex、openclaw 等。项目为 AI 编程代理提供了开箱即用的设计能力增强。

claude-designopen-sourcedesign-systemcode-agentskills
4.0 · 优秀 研究者
Models 2026-04-06 · X
用 LLM + Obsidian 构建个人知识库:基于 Karpathy 的"LLM Knowledge Bases"工作流

基于 Karpathy 的 LLM Knowledge Bases 工作流,将知识库管理类比为 CI/CD:原始资料→编译产物→运行时输出三层分离。用 Obsidian + Claude Code 实现三层目录结构:raw/(摄取)、wiki/(编译成品)、平台目录(发布)。三个摄取入口(Web Clipper、Podwise、手动剪藏),编译环节包含逐篇摘要、概念抽取、索引更新。强调增量编译和质量保障。

obsidianllmknowledge-basekarpathycompileci-cd
4.0 · 优秀 研究者
Models 2026-04-06 · 文章
GPT-5.5 官方提示词指南核心要点

OpenAI 上周发布 GPT-5.5 后,紧接着放出了一份官方提示词指南。这份指南传递的核心信息只有一个:别再写长提示词了。 GPT-5.5 距离上一代 GPT-5.4 只隔了六周,API 定价每百万输入 Token 5 美元、输出 30 美元,上下文窗口 100 万 Token,目前已面向 Plus、Pro、Business 和 Enterprise 用户开放。模型本身的变化各家媒体已经报道过,这份提示词指南更值得关注的是它暗示的使用方式转变。 【1】越短越好,告诉它"要什么"而不是"怎么做" 过去用 AI 模型,很多人习惯写一长串步骤,手把手教模型该先查什么、再比什么、最后怎么输出。OpenAI 在指南里直接说:这套玩法过时了。GPT-5.5 的推理能力够强,你只需要描述清楚想要的结果、成功的标准和限制条件,剩下的让它自己规划路径。...

4.0 · 优秀 研究者
Models 2026-04-06 · X
Anthropic 今天发了一个新产品,可能会让一批做 AI 智能体基础设施的团队失业

中文深度分析 Claude Managed Agents。与 Claude Code 的区别:Code 跑在本地给个人用,Managed Agents 跑在云端给企业用,24 小时不间断。典型用法:事件触发型(Sentry 自动修 bug)、定时型(每日简报)、即发即忘型(Slack 派活)、长时间任务。技术架构将大脑/手/记忆解耦。案例:Notion、Sentry、Atlassian、Rakuten 等已接入。Anthropic 年化收入突破 300 亿美元。

claudemanaged-agentsanthropicenterpriseagent-infrastructure
4.0 · 优秀 研究者
Models 2026-04-06 · X
Andrew Ng:AI智能体加速编程,软件工程的未来走向何方?

Andrew Ng在AI开发者大会上指出:AI让编程更容易将带来更多人参Coding,而非消灭编程工作;手写代码和阅读代码不再重要,可以在对代码提问后直接以更高抽象级别操作;定制应用将爆发(因为现在为小众人群写软件也划算了);Product Management Bottleneck(决定做什么比建造什么更成瓶颈)将成为主要矛盾。Ng对「AI导致失业」的末日论持反驳态度。

software-engineeringai-agentsandrew-ngjob-marketfuture-of-workcoding-agents
4.0 · 优秀 研究者
Models 2026-04-06 · GitHub
replit slides设计技能模板:0限制完全本地设计Agent

开源了 replit slides 的全套设计 skills 模板,提供 8 套 replit 样式(helix / holm / vance / bevel / world-dark / world-mint / atlas / bluehouse),支持 0 限制、完全本地运行的设计 Agent。配合 open claude design 项目,为 AI 编程代理提供完整的幻灯片设计能力。

replitslidesdesign-agentskillsopen-source
3.0 · 值得看 研究者
Models 2026-04-06 · X
用 Obsidian + Claude 搭个人知识库:核心架构实践

Obsidian + Claude 搭建个人知识库的核心架构实践。核心思路:把笔记库当代码仓库来"编译"。三层目录结构:原料/(只读,Claude 不可修改)→ 摘要/(Claude 结构化编译产物)→ 沉淀/(Query 高质量回答落文件)。两个元文件:CLAUDE.md(控制 AI 行为的最高宪法)和 index.md(全局目录 + TLDR,Claude 检索时先扫再深读)。日常工作流三个动作:Ingest(逐篇处理)、Query(好回答存文件)、Lint(定期健康检查)。防腐化底线:重要断言必须有来源、新旧冲突报 diff 不覆盖、区分事实和推论。

ObsidianClaude知识库CLAUDE.md个人知识管理
3.0 · 值得看 研究者
Models 2026-04-06 · X
Google Gemma-4-31B 模型被彻底破解

Google 最新 Gemma-4-31B 基础模型出现越狱版本 Gemma-4-31B-JANG_4M-CRACK,HarmBench 得分 93.7%(149/159)。采用 18GB 混合精度 MLX 量化,支持 Apple Silicon,原生支持视觉多模态。已在 Hugging Face 开放下载。

gemmajailbreakopen-sourceharmbenchsafety
3.0 · 值得看 研究者
Models 2026-04-05 · X
你不知道的大模型训练:原理、路径与新实践

Tw93 继 Claude Code 和 Agent 深度分析后的第三篇长文,系统梳理大模型训练全链路。核心判断:2026 年拉开差距的不再是预训练本身,而是后训练、评测、奖励、Agent 训练、蒸馏。详细拆解了预训练(数据配方、过训练、tokenizer 设计)、后训练多阶段流水线(冷启动 SFT → GRPO 强化学习 → 拒绝采样微调 → 对齐 RL)、评测-Grader-Reward 反馈回路、推理模型(o1/DeepSeek-R1)、Agent 训练(Kimi K2.5 PARL、Cursor Composer 2、Chroma Context-1)、Meta-Harness(只改 harness code 就能拉出 6x 性能差距)。含大量配图和 14 篇参考文献。

大模型训练预训练后训练RLHF蒸馏Agent训练
5.0 · 必读 研究者
Models 2026-04-05 · X
Farzapedia:用个人日记和聊天记录打造可检索的个人 AI 维基

开发者 Farza 将 2500 条日记、Apple Notes 和 iMessage 对话导入 LLM,自动生成了 400 篇涵盖朋友、创业项目、研究领域和喜好的个人维基文章。与「用越多越懂你」的隐式记忆不同,这是一种完全显式的记忆 artifact,透明可控。这一思路为个人知识管理提供了新范式:让 AI 用你自己的真实数据构建可检索、可阅读的个人知识库,而非依赖通用模型的模糊记忆。

workflowpromptpersonal-wikillmmemory
5.0 · 必读 研究者
Models 2026-04-05 · X
LLM Knowledge Bases

Karpathy 分享他用 LLM 构建个人知识库的工作流:raw/ 目录存放原始文档,LLM 增量"编译"成 .md wiki(含摘要、反向链接、概念分类文章);用 Obsidian 作为 IDE 前端查看原始数据、编译产物和可视化;wiki 达到约 100 篇文章/40 万字后,可以直接向 LLM agent 提问复杂问题。关键发现:不需要 fancy RAG,LLM 自己会维护索引文件和文档摘要。输出形式包括 Markdown 文件、幻灯片(Marp 格式)、matplotlib 图像。还会用 LLM 做 wiki 健康检查(不一致数据、缺失数据、新文章候选)。

LLM知识库ObsidianMarkdownRAG个人知识管理
4.0 · 优秀 研究者
Models 2026-04-05 · 文章
Karpathy 最新方法论:把 LLM 当编译器用,知识管理该换个思路了

解读 Andrej Karpathy 2026 年 4 月提出的 LLM 知识库方法论。核心类比:把 LLM 当编译器,原始资料当源代码,生成 Wiki 当可执行文件。三层目录结构:raw/(原始素材)、wiki/(LLM 编译产出的结构化 Markdown)、output/(查询结果和衍生输出)。四步工作流:摄入(Ingest)到编译(Compile)到查询(Query)到健康检查(Lint)。与 RAG 的关键区别:RAG 是查询时实时检索(临时性),Karpathy 的方法是提前编译(持久性),查询结果自动回写 Wiki。适用规模约 40 万字,不需要向量数据库。

Karpathyknowledge-managementLLMwikiobsidianknowledge-compile
4.0 · 优秀 研究者
Models 2026-04-05 · 文章
Tufts 大学研究:神经符号 AI 在机器人操控任务中能耗降低 100 倍,准确率反升

Tufts 大学 Matthias Scheutz 实验室论文(将在 ICRA 2026 维也纳会议展示)表明,神经符号 AI 方法在结构化长时序机器人操控任务中,训练能耗降低至纯端到端方法的百分之一,同时任务准确率更高。该方法将传统神经网络与符号推理结合,用逻辑规则分解任务步骤,为 AI 能耗瓶颈提供了替代路径。

neuro-symbolicai-researchenergy-efficiencyroboticsicra
3.0 · 值得看 研究者
Models 2026-03-21 · 文章
你不知道的 Agent:原理、架构与工程实践 - Tw93

研究完 Claude Code 的架构之后,发现自己对 Agent 底层的理解还不够深入,加上团队在 Agent 方向已经有不少业务落地,但一直缺少一份系统梳理,所以又补了一轮资料、开源实现和轻量实验,把控制流、上下文工程、工具设计、记忆、评测和安全这些问题重新串了一遍。

4.0 · 优秀 研究者
Models 2026-03-07 · X
Your LLM Doesn't Write Correct Code. It Writes Plausible Code.

通过一个极端案例(LLM 重写的 Rust SQLite 实现比原版慢 20,171 倍)揭示 LLM 生成代码的核心问题:优化表面正确性而非实际正确性。详细拆解了两个关键 Bug(缺失 ipk 检查导致 O(n²) vs O(log n)、每次语句都 fsync),以及五个复合性能问题。引用 METR 随机对照试验(AI 用户慢 19%)、GitClear 分析(复制粘贴首次超过重构)等研究,论证 LLM 的 sycophancy 问题。结论:代码不是你的,直到你能自己找到其中的 bug。

LLM代码质量SQLite性能AI对齐sycophancy
5.0 · 必读 研究者
Models 2026-03-06 · X
The Ultimate Beginner's Guide to Claude (March 2026)

Source: @aiedge_ The only guide you need to master Claude from zero. 介绍 The only guide you need to master Claude from zero. 这是从零开始掌握 Claude 的唯一指南。 Last week, Anthropic shipped its best suite of Claude features yet. If you're still using ChatGPT, this is the nail in the coffin. **上周,Anthropic 发布了迄今为止最好的 Claude 功能套件。如果你还在使用 ChatGPT,这就是压死骆驼的最后一根稻草。

claudeprompt-engineeringskillcontext-managementClaudeAnthropic
5.0 · 必读 研究者
Models 2026-03-06 · X
Claude 终极入门指南:100 小时实测,一篇讲透

By @yanhua1010 (Yanhua) · Fri Mar 06 02:40:30 +0000 2026 📊 ❤️ 145 🔁 43 🔖 259 👁️ 10,204 💬 1 📐 400 words 本文受 @aiedge 的 Claude 终极初学者指南 启发创作,结合个人一年多的实战经验。 2026 年 3 月,Anthropic 一口气释放了 Claude 有史以来最强的功能组合。Skills、Cowork、Opus 4.6。 如果你还在观望,或者还停留在"问它一个问题,得到一个回答"的阶段,这篇文章会帮你重新理解 Claude 到底是什么,以及怎么真正用好它。 我用 Claude 超过一年了。从最早的 API 到今天的桌面端、Code、Cowork,几乎每一个功能更新我都第一时间上手。...

claudememoryskillcontext-managementarchivex-bookmarks
5.0 · 必读 研究者
Models 2026-03-05 · X
Anthropic 官方出品 Claude 101:一份从入门到上手的完整学习指南

Anthropic 最近在自家的教育平台 Anthropic Academy 上线了一门免费课程叫 Claude 101,总共 13 节课,从最基础的"Claude 是什么"一路讲到企业搜索、深度研究、自定义技能,覆盖了一个普通用户上手 Claude 需要知道的几乎所有东西。 这篇文章把 13 节课的核心内容做了一次系统梳理,按照课程原有的四大模块展开,帮你在最短时间内把 Claude 的能力版图看清楚。 课程开篇花了很大篇幅去讲 Claude 的设计哲学,核心就一句话: 帮你从想法的萌芽阶段就找到答案,并建立各种联系 具体来说,Claude 能跟你一起阅读文档、分析电子表格、制作演示文稿,把你脑子里的想法从"文字和幻灯片"变成真实可执行的条目、更新、行动。...

clauderagClaudeAI学习指南Anthropic
4.0 · 优秀 研究者
Models 2026-03-04 · X
AI、矿产与澳洲经济:2026,澳洲能迎来“新国运”吗?

By @rwayne (Roland的思考日记) · Sat Feb 28 12:21:10 +0000 2026 📊 ❤️ 1,991 🔁 668 🔖 3,535 👁️ 1,234,504 💬 172 📐 438 words 这是一篇约8000字的深度分析。说三件事:第一,AI正在改写全球价值链的利润分配规则,物理资源的相对价值在上升;第二,澳大利亚手里有好牌,但好牌和赢之间隔着加工能力、制度设计和时间窗口;第三,对在澳洲生活的普通人来说,理解自己在价值链上的位置比关注任何宏观叙事都重要。建议留20分钟完整阅读,我知道在当下阅读长文是一个很辛苦的事情,但是保证这篇文章会让你读完有所收获,我不建议使用ai总结,会压缩文章的质量。...

claudephone-ai
5.0 · 必读 研究者
Models 2026-03-04 · X
2026-03-04-0813-brucexu_eth-Deep-Research-盲测-ChatGPT-5.2-Pro-vs-Clau-2028796588039262505

@brucexu_eth (brucexu.eth ❤️🐼🦇🔊) 🕐 Tue Mar 03 11:36:14 +0000 2026 📊 ❤️ 91 🔁 10 🔖 74 👁️ 20,264 💬 7 我这两天用真实且有深度的实际问题(一个行业市场调研)深度盲测了 ChatGPT 5.2 Thinking、Gemini 3.1 Pro、Claude Opus 4.6 的普通付费版(20 USD)账号的 Deep Research,结果开始令我大跌眼镜,后来发现不对又正常了。然后又加了 ChatGPT 5.2 Pro 的 Deep research 和 Extended Pro 做对比。...

claude
4.0 · 优秀 研究者
Models 2026-03-01 · X
读霍华德·马克斯的《AI Hurtles Ahead》有感

By @RichTerry123 (Terry) · Sat Feb 28 06:58:30 +0000 2026 📊 ❤️ 77 🔁 18 🔖 157 👁️ 15,346 💬 2 📐 33 words 这是他最新一篇备忘录的标题叫做AI Hurtles Ahead,翻译过来是AI疾驰而来。 巴菲特曾给予他极高的评价:“当我看到邮件里有霍华德·马克斯的备忘录时,我总是第一时间打开阅读。我总能从中学到东西。” 对他这篇备忘录的内容,我做了个梳理,分享给大家: 1.对AI的理解:他惊叹于Claude输出的内容,认为大众不要把 AI 模型理解为一个检索数据并加以复述的搜索引擎,它实际上是一个能够综合数据并基于数据进行推理的计算机系统。 AI 是真实存在的,过去,金融行业,乃至很多知识密集型行业的核心竞争力很大一部分建立在获取和处理海量信息的能力上。...

claude
3.0 · 值得看 研究者
Models 2026-02-28 · X
Qwen3.5-122B-A10B Pooled on Dual Mac Studio M4 Max with Exo + Thunderbolt 5 RDMA

24+ 小时调试后,在两台 Mac Studio M4 Max 上通过 Exo + Thunderbolt 5 RDMA 实现了 Qwen3.5-122B-A10B 的完整池化运行。持续吞吐约 52 tok/s,并发 c=2 稳定(p95 约 10.37 秒)。提供了完整的 Day-0 实操指南,包含精确命令与失败检查关卡。

qwenmac-studiordmaexolocal-inferencethunderbolt
4.0 · 优秀 研究者
Models 2026-02-27 · 文章
终端大模型操作系统的架构、优化与展望

通过本地化搭载大模型,终端设备的智能能力将获得飞跃式提升,铸造移动计算的下一个黄金时代,对学术界和产业界都是巨大的机遇。

4.0 · 优秀 研究者
Models 2026-01-18 · 文章
深度解析:算力巨轮的引擎 —— 从SIMD到SIMT以及GPU如何统治AI时代

摘要: 当我们在《赛博朋克2077》的夜之城中流连忘返,或者惊叹于 ChatGPT 生成的精妙回答时,很少有人意识到这背后正在进行着怎样规模的数字狂欢。为了支撑现代图形渲染和人工智能,GPU 架构经历了一场从"方阵士兵"到"特种部队"的静默革命。本文将深入解剖 GPU 的微观架构,从 SIMD 的物理局限到 SIMT 的逻辑突围,并揭示 GPGPU 是如何凭借"极度并行"的哲学,成为现代 AI 产业的心脏。

4.0 · 优秀 研究者
Models 2026-01-08 · 文章
Claude Code 之父自爆:Claude Code 的终极用法

Claude Code 之父自爆:Claude Code 的终极用法 你可能听过 Claude Code,甚至用过它来写点代码、改点文档。但你有没有想过:如果 AI 不是“临时用一下的工具”,而是你开发流程中的正式成员,甚至是一个自动化协作系统——它会怎样改变你的工作方式? Boris Cherny 作为 Claude Code 之父,他写了一篇非常详细的推文,分享了自己如何高效使用这款工具,以及他和团队在实际工作中如何将 Claude 深度集成进整个工程流程。 这篇文章将对他的经验做一次系统的整理和通俗的解读。 Boris 是怎么让 AI 成为他工作流中的自动化伙伴的? 核心要点 他介绍了自己的工作流程,包括: ✅ 怎么用 Claude: 开很多个 Claude 一起跑:在终端和网页上开 5~10 个会话并行处理任务,还用手机 Claude。...

claude
4.0 · 优秀 研究者
Models 2026-01-03 · 文章
如何使用 Claude Code 的每个功能

作为 Claude Code 的深度用户,看到这篇文章《How I Use Every Claude Code Feature》觉得非常好,他详细介绍了Claude Code中很多高级功能的作用以及使用技巧,DD也收获颇丰,所以转过来推荐大家一起学习一下。 > > 下面是本篇文章的翻译,根据实际情况选择阅读。原文链接:

3.0 · 值得看 研究者
Models 2025-12-29 · 文章
一键拯救大模型的前端审美能力

如果我们也想要包括GPT-5.2-Codex、GLM-4.7、M2.1在内的其他主流模型也拥有审美能力,怎么办?是否有快速提升他们前端审美能力的方法呢?

3.0 · 值得看 研究者
Models 2025-12-22 · 文章
2025 LLM Year in Review

2025 LLM Year in Review 2025 has been a strong and eventful year of progress in LLMs. The following is a list of personally notable and mildly surprising "paradigm changes" - things that altered the landscape and stood out to me conceptually. Reinforce...

LLMDeepSeek
4.0 · 优秀 研究者
Models 2025-12-19 · 文章
Real-World Agent Examples with Gemini 3

Google 展示 Gemini 3 与六大开源框架(ADK、Agno、Browser Use、Eigent、Letta、mem0)的协作案例,涵盖零售选址、多智能体工作室、浏览器自动化、Salesforce 流程管理、社交 AI Agent 和记忆层等实际场景。Gemini 3 作为核心编排器,提供精确的推理深度控制和状态管理,解决 AI Agent 落地的可靠性难题。

gemini-3multi-agentADKagnobrowser-useletta
4.0 · 优秀 研究者
Models 2025-12-16 · 文章
claude code's DX is too good. and that's a problem. | thinking out loud

claude code's DX is too good. and that's a problem. | thinking out loud 原文链接: English原文 发布时间: 2025-12-14T00:00:00.000Z 原文链接: Here's a tension I've been thinking about: Claude Code might be getting _too_ good. Not in the "AI is taking our jobs" sense. In the DX sense....

3.0 · 值得看 研究者
Models 2025-12-06 · 文章
State of AI | OpenRouter

OpenRouter 联合 a16z 的 100 万亿 token LLM 使用分析。核心发现:开源模型采用率提升、创意角色扮演和编程是最热门任务、Agent 推理模式兴起、'Glass Slipper'留存效应。含开源 vs 闭源、地理分布、成本动态等多维度数据。

OpenRoutera16zLLM100T-tokensagentic开源模型
5.0 · 必读 研究者
Models 2025-08-15 · 文章
Anthropic全网追杀的人,可能是我……

Anthropic全网追杀的人,可能是我…… Anthropic官方说,有一个用户在一个月内消耗了价值数万美金的的token,从而决定限速。这个用户,好像,是我本人…… 上个月,Anthropic官方发布了信息,有一个用户,只花了$200美元订阅套餐,却在一个月内消耗了数万美金的(tens of thousands)的token。从而决定对所有人进行限速...... 全世界的程序员都在好奇,这位每个月花数万美金的老哥是谁?

ClaudeAnthropic
4.0 · 优秀 研究者
Models 2025-08-11 · 文章
一个半月高强度 Claude Code 使用后感受

上善若水,人淡如菊。这里是王巍 (onevcat) 的博客,用来记录一些技术和想法,主要专注于 Swift 和 iOS 开发。

4.0 · 优秀 研究者
Models 2025-07-27 · 文章
来自 OpenAI 离职员工的爆料:关于 OpenAI 的一些思考

来自 OpenAI 离职员工的爆料:关于 OpenAI 的一些思考 来源: 微信公众号 原文链接: 作者:Calvin 三周前,我离开了 OpenAI[1]。我是在 2024 年 5 月加入这家公司的。 我想分享我的这些思考,是因为外界关于 OpenAI 在做什么的讨论充满了迷雾和噪音,但很少有人能第一手地描述在那里工作的文化到底是什么感觉。 Nabeel Quereshi[2] 写过一篇非常棒的文章,叫做《关于 Palantir 的反思》[3],他在文中深入思考了是什么让 Palantir 如此与众不同。我想趁着记忆还新鲜,为 OpenAI 做同样的事情。你在这里不会看到任何商业机密,更多的是我对这个历史上最引人入胜的组织之一,在当下这个极不平凡的时期的一些反思。 开门见山地说:我离开的决定背后没有任何个人恩怨——事实上,我对此感到非常纠结。...

4.0 · 优秀 研究者
Models 2025-07-27 · 文章
新一代 Agentic AI 智能体,助力 Android 开发 | Google I/O你好,我是朱涛。今天我们来聊聊 - 掘金

新一代 Agentic AI 智能体,助力 Android 开发 | Google I/O 往期文章: 《00. 文章合集目录》 《Google Gemini 如何加速 Android 开发?》 《深入理解 Android Jetpack Lifecycle(用法篇)》 《深入理解 Jetpack Lifecycle(原理篇)》 你好,我是朱涛。今天我们来聊聊 AI 和 Android 开发的话题。 往年的 Google I/O 大会,Android 几乎每年都是主角。但是,从近两年开始,AI 在 I/O 大会的重要性逐渐提升,而今年 Google I/O 大会上,AI 已经成为了万众瞩目的主角。 这几年,以 ChatGPT 为代表的生成式 AI 发展迅猛,各个科技巨头都开发出了各自的AI。...

4.0 · 优秀 研究者
Models 2025-07-06 · GitHub
GitHub - HW-whistleblower/True-Story-of-Pangu: 诺亚盘古大模型研发背后的真正的心酸与黑暗的故事。

GitHub - HW-whistleblower/True-Story-of-Pangu: 诺亚盘古大模型研发背后的真正的心酸与黑暗的故事。 诺亚盘古大模型研发背后的真正的心酸与黑暗的故事。. Contribute to HW-whistleblower/True-Story-of-Pangu development by creating an account on GitHub. 盘古之殇:华为诺亚盘古大模型研发历程的心酸与黑暗 我是一名盘古大模型团队,华为诺亚方舟实验室的员工。 1. 现诺亚主任,前算法应用部部长,后改名为小模型实验室的主任王云鹤。前诺亚主任:姚骏(大家称姚老师)。...

embedding大模型
3.0 · 值得看 研究者
Models 2025-06-30 · 文章
Android×鸿蒙×AI 技术刊#第13期——APK极速瘦身策略、MVI架构实践与AI工具链新动态

Android×鸿蒙×AI 技术刊#第13期——APK极速瘦身策略、MVI架构实践与AI工具链新动态 本周 Android 生态聚焦性能优化、架构演进与 AI 融合三大方向: 1️⃣ 性能深度优化 APK 瘦身实战:Unreal 项目压缩 NativeLibs 与资源,实现 1.23G → 130M 体积优化; 鸿蒙组件冻结技术:freezeWhenInactive 属性抑制非活跃 UI 刷新,降低主线程负载。 2️⃣ 开发范式革新 MVI 架构解析:厘清单向数据流与状态管理核心,对比 Redux/MVVM 适用场景; Flutter Hotload 突破:双重映射技术绕过 iOS 26 权限限制,恢复真机 Hotload 能力。

GeminiAndroidPerformance
4.0 · 优秀 研究者
Models 2025-06-18 · 文章
Anthropic:我们如何构建多智能体研究系统

Anthropic:我们如何构建多智能体研究系统 我们的研究(Research)功能利用多个 Claude 智能体,来更有效地探索复杂主题。 我们的研究(Research)功能利用多个 Claude 智能体,来更有效地探索复杂主题。在此,我们分享构建这一系统时遇到的工程挑战以及我们学到的经验教训。 现在,Claude 具备了研究能力^\[1\]^,能够横跨网络、Google Workspace 及任何集成应用进行搜索,以完成复杂的任务。

ClaudeAnthropicInferencePerformance
4.0 · 优秀 研究者
Models 2025-06-09 · 文章
Android×鸿蒙×AI 技术刊#第10期——端侧AI · Kuikly性能 · Flow避坑 · 脱壳 · Dex解析...

Android×鸿蒙×AI 技术刊#第10期——端侧AI · Kuikly性能 · Flow避坑 · 脱壳 · Dex解析... 亲爱的开发者朋友们,本周的Android技术周刊来啦!无论你在打磨性能、深潜底层,还是探索AI边界,这些新鲜热乎的干货都能助你一臂之力: Google全新 MLKit端上生成式API 现已开放!只需几行代码,就能让Gemini Nano在用户手机里完成文档总结、图片描述(离线免费+极速510 tokens/秒)。 腾讯开源 Kuikly框架鸿蒙适配方案!通过命令式CAPI暴改渲染链路,实测比React Native快6倍,QQ浏览器、腾讯新闻已投产,你的跨平台项目也能抄作业!

GeminiAndroidFine-tuningPerformanceWeeklyAI Safety
4.0 · 优秀 研究者
Models 2025-05-21 · 文章
一文看懂2025 Google IO,誓把一切“装”上Gemini,谷歌眼镜10年逆袭归来

一文看懂2025 Google IO,誓把一切“装”上Gemini,谷歌眼镜10年逆袭归来 公众号: 网易科技 发布时间: 1970-01-01 08:33:45 原文链接: 出品|网易科技《态度》栏目 作者|袁宁 丁广胜 发自山景城海岸线圆形剧场Google I/O大会 “我听说今天是双子星季(Gemini Season)的开始,”Sundar Pichai 一上台就抛出冷笑话,“但我不明白这有什么特别的。在谷歌,每天都是双子星(Gemini)季。” 2025年 Google I/O 主题演讲刚一开场,Pichai 就用 Gemini 做了个梗,引得全场轻笑。 5月20日的山景城,气氛热烈,网易科技排队一小时挤进会场前排,和来自全球的开发者、分析师、媒体一同见证这场发布。...

4.0 · 优秀 研究者
Models 2025-05-07 · 文章
编译器优化那些事儿(22):LLM for Vectorization

随着大语言模型(Large Language Model, LLM)技术的迅猛发展,其应用已从通用领域快速渗透至编译技术等专业场景。本文将聚焦大模型在编译优化中的创新实践,重点探讨基于大模型的自动向量化的优化方法及其实现机制。

4.0 · 优秀 研究者
Models 2025-03-19 · 文章
AI时代的性能分析:GPU Profiling初探

AI时代的性能分析:GPU Profiling初探 关于GPU Profiling和可视化的鸟瞰。 在CPU优化的过程中,例如我们遇到CPU打满的情况,我们可以通过perf等工具进行Profiling,然后将数据可视化成火焰图等形式进行分析;同样的,在GPU的优化过程中,我们也可以通过Profiling来进行性能优化。 例如在大热的DeepSeek的推理系统中,就提到用Profiling来优化:

InferenceDeepSeekPerformanceProfiling
4.0 · 优秀 研究者
Models 2025-03-11 · 文章
【社区说-回顾】全方位 360° 讲解 Gemini 2.0,我家的猫真会后空翻

为了帮助大家更好地了解和掌握 Gemini2.0 的使用技巧,GDG 社区在 2.27 晚上7点在线上举办了「社区说」分享活动,邀请多位资深的 AI 开发专家,从不同角度为大家解读 Gemini 2.0 的最新变化和开发技巧。本文将带领大家详细回顾此次活动特约嘉宾们的精彩分享。

4.0 · 优秀 研究者
Models 2025-02-18 · 文章
图解DeepSeek-R1的创新训练和推理模型实现原理

DeepSeek-R1的成功标志着AI在推理能力方面的重要突破。它不仅展示了如何构建高性能的推理模型,更重要的是提供了一套可复现的技术方案,为整个AI社区带来了宝贵的经验。

4.0 · 优秀 研究者
Models 2025-02-12 · 文章
淘宝订单列表Fragment转场动画卡顿解决方案

如何应对产品形态与产品节奏相对确定情况下转变为『在业务需求与产品形态高度不确定性的情况下,如何实现业务交付时间与交付质量的确定性』。本专题《淘宝交易终端架构探索》是我们摸索出的部分实践总结,欢迎大家一起交流进步。

4.0 · 优秀 研究者
Models 2025-02-09 · 文章
AI 也能"看懂"图片: 移动端相册 AI 搜图的奥秘PicQuery 通过创新的多模态搜索技术,为移动设备上的图片检索 - 掘金

AI 也能"看懂"图片: 移动端相册 AI 搜图的奥秘PicQuery 通过创新的多模态搜索技术,为移动设备上的图片检索 - 掘金 PicQuery 通过创新的多模态搜索技术,为移动设备上的图片检索提供了一个高效、智能的解决方案。是一个非常值得学习,把玩的好项目。 其实大概三四个月前就想写一篇文章来介绍移动端 AI 搜图的一些进展,不过由于本人的精力有限和一些其他的原因,没有及时更新。所以也就拖更很久,好在春节有些时间可以把之前的一些知识总结,更好的展现给大家。 相信用 Android 手机的同学多少都有一些感觉,Android 手机上的相册都多了一个搜图的功能,例如小米手机或是 Oppo 手机都上线了类似的功能,输入文字可以获得相关的图片。下面展示一下小米相册里面的搜图功能: ?ima...

OpenAIAndroidMultimodal
4.0 · 优秀 研究者
Models 2025-02-07 · 文章
科技爱好者周刊#336:面对 AI,互联网正在衰落

科技爱好者周刊#336:面对 AI,互联网正在衰落 English 科技爱好者周刊#336:面对 AI,互联网正在衰落 公众号: 阮一峰的网络日志 发布时间: 1970-01-01 08:33:45 原文链接: 这里记录每周值得分享的科技内容,周五发布。 本杂志开源\[1\],欢迎投稿\[2\]。另有《谁在招人》\[3\]服务,发布程序员招聘信息。合作请邮件联系\[4\]([email protected]\[5\])。 封面图 漳州钟法路的大榕树新春彩灯。(via\[6\]) 面对 AI,互联网正在衰落 这一段日子,新闻焦点全是 DeepSeek,其他重要事件就不显眼了。 我说的重要事件是,1月23日,就在 DeepSeek R1 模型发布三天后,OpenAI 公司推出了一个新的 AI 工具,叫做 Operator\[7\](操作员)。...

4.0 · 优秀 研究者
Models 2025-02-04 · 论文
DeepSeek-R1 论文解析——人工智能领域的 RL LLM 新时代?

DeepSeek-R1 论文解析——人工智能领域的 RL LLM 新时代? DeepSeek-R1 论文解析——人工智能领域的 RL LLM 新时代? 近年来,人工智能 (AI) 领域取得了快速发展,大型语言模型 (LLM) 为通用人工智能 (AGI) 铺平了道路。OpenAI的 o1 是 一个出色的模型,它引入了创新的推理时间扩展技术,可显著增强推理能力。然而,它仍然是闭源的。 今天,我们深入研究了 DeepSeek 推出的开创性研究论文 DeepSeek-R1。这篇题为"DeepSeek-R1:通过强化学习激励大型语言模型中的推理能力"的 论文介绍了一种最先进的开源推理模型,以及使用大...

deepseekllmfine-tuningopenaiinference
3.0 · 值得看 研究者
Models 2024-12-04 · 文章
【GDE 分享】移植 Mediapipe LLM Demo 到 Kotlin Multiplatform

【GDE 分享】移植 Mediapipe LLM Demo 到 Kotlin Multiplatform English 【GDE 分享】移植 Mediapipe LLM Demo 到 Kotlin Multiplatform 公众号: 谷歌开发者 发布时间: 1970-01-01 08:33:44 原文链接: 以下文章来源于Android高效开发,作者2BAB _作者 / Android 谷歌开发者专家 El Zhang (2BAB)_ 在今年的厦门和广州 Google I/O Extended 上,我分享了《On-Device Model 集成 (KMP) 与用例》。本文是当时 Demo 的深入细节分析,同时也是后面几篇同类型文章的开头。...

4.0 · 优秀 研究者
Models 2024-10-31 · 文章
OpenAI o1模型的前世今生

深度解析 OpenAI o1 模型技术路线。从 System 1/System 2 思维框架切入,指出此前 LLM 都用快思考模式,o1 引入慢思考多步推理。核心创新在预训练、后训练(强化学习)和推理阶段突破,代表从 pattern completion 到 structured reasoning 的范式转变。

openaio1reasoningsystem-2chain-of-thoughtSTEM
4.0 · 优秀 研究者
Models 2024-09-27 · 文章
探索更强中文Embedding模型:Conan-Embedding

探索更强中文Embedding模型:Conan-Embedding 公众号: 腾讯技术工程 发布时间: 1970-01-01 08:33:44 原文链接: 作者:ethanntang 本文主要分享我们近期在Embedding模型训练上的工作「Conan-Embedding」。目前,Conan-Embedding已在最全面、最大规模的中文语义向量评测榜单C-MTEB上达到SOTA,超越了阿里、百川、OpenAI等众多Embedding模型。 图片由Venus-AI Draw平台生成并进行风格化 引言 概述 随着大模型时代的爆发,检索增强生成技术(RAG)在大语言模型中广泛应用。RAG是一种性价比极高的方案,在大语言模型中占据重要地位。Embedding模型作为RAG中检索召回的重要一环,扮演着极其关键的角色。...

4.0 · 优秀 研究者
Models 2024-09-19 · 文章
o1发布后,信息量最大的圆桌对话:杨植麟、姜大昕、朱军探讨大模型技术路径

o1发布后,信息量最大的圆桌对话:杨植麟、姜大昕、朱军探讨大模型技术路径 2024年9月19日云栖大会,一场名为"大模型通往AGI之路"的圆桌对话,聚焦 OpenAI 新模型 o1 的影响与大模型技术未来。嘉宾包括月之暗面创始人杨植麟、阶跃星辰创始人姜大昕、盛数科技首席科学家朱军,主持人是极客公园张鹏。 核心观点 o1 的意义 姜大昕指出 o1 展示了大型语言模型的"慢思考"(System 2)能力,类似于人类认知,极大拓展了 AI 的潜力。杨植麟也认可 o1 对提升 AI 能力的重要性,以及在数据挖掘遇到瓶颈时解决扩展定律(scaling law)挑战的意义。 AGI 发展加速 姜大昕和杨植麟都认为 AGI 的发展在过去 18 个月实际上在加速,而非放缓。...

4.0 · 优秀 研究者
Models 2024-09-03 · 文章
0x1 Underlying LLMs

LLM (Large Language Models) 的风头一时无两,席卷万千行业。业内不乏有关于 LLM 的研究和讨论,但鲜有立足终端的视角。团队上半年曾有过对 GPT 进终端的分析,但 LLM 日新月异,旧分析已经不完全跟得上变化了。适逢年底规划季,尝试重新梳理 LLM 的现状,预判未来变化的趋势,希望能为迷茫的同仁提供思考的角度,也希望获得战斗在一线的友军的指点。 求砖 \& 免砖申明: 不包含 LLM 入门介绍,够时间可以报吴恩达的免费课程和 NVIDIA 与 LlamaIndex 合力出品的;不够时间也有 Andrej Karpathy 的 一小时入门; 非算法出身,如有错漏之处,恳请指正;力争能让 RD、PM、DA 们都能看懂,如果不明处,欢迎讨论; 终端 LLM 应用有一定不...

LLMRAGInferenceLLaMAMultimodal
4.0 · 优秀 研究者
Models 2024-05-24 · 文章
科技爱好者周刊#301:OpenAI 的图书馆工位

科技爱好者周刊#301:OpenAI 的图书馆工位 English Issue 301 of "Tech Enthusiast Weekly" titled "OpenAI's Library Workspaces" was published on May 24, 2024. In this issue, Ruan Yifeng introduces OpenAI's headquarters in downtown San Francisco, a three-story building converted from a food factory....

4.0 · 优秀 研究者
Models 2024-05-02 · 文章
奥特曼斯坦福对话万字实录来了!关于GPT5、AGI、核聚变发电、人类未来

English OpenAI首席执行官萨姆·奥特曼(Sam Altman)在斯坦福大学的一次对话中,分享了对人工智能(AI)、GPT-5、通用人工智能(AGI)、核聚变发电以及人类未来等多个关键领域的深刻见解。 奥特曼斯坦福对话要点 据报道,萨姆·奥特曼于4月24日在斯坦福大学的企业思想领袖讲座(ETL)活动上发表了演讲,并于5月2日发布了完整的对话视频及万字实录。在对话中,奥特曼强调了持续改进和负责任地迭代部署AI的重要性,并预测未来的AI模型将显著提升智能水平,对社会产生深远影响。他认为,AI的发展将是人类历史上一个非常重要的时刻,并表示OpenAI致力于确保AGI能造福全人类。奥特曼也对AI发展中可能出现的"微妙危险"表示担忧,并强调公开发展的重要性。...

4.0 · 优秀 研究者
Models 2023-12-26 · 文章
2023: The Year of AI

Explore the significant AI advancements, impactful partnerships, and legal debates that defined 2023. AI has undoubtedly made waves in 2023 and here we spotlight the most significant stories of the year poised to shape the future of this groundbreaking industry: *Correction: In the original blog post published on December 22, 2023, the title "AI Re...

ChatGPTLLMMidjourney
4.0 · 优秀 研究者
Models 2023-12-26 · 文章
2023: AI 的一年 [译]

2023 年是 AI 领域的关键年份,我们在此聚焦今年对该行业未来发展具有重大影响的主要事件 2023 年是 AI 领域的关键年份,我们在此聚焦今年对该行业未来发展具有重大影响的主要事件: *更正:在 2023 年 12 月 22 日发布的原博客中,标题"AI 发布(AI Releases)"造成了误解,因为内容涵盖了公告、更新及发布等多方面。我们对文本和信息图的标题进行了澄清。Stability AI 对其大语言模型(LLM)开源的提及未出现在信息图中,但保留在文章里,这强调了其在提升可获取性而非仅仅技术改进方面的重要性。信息图最初展示了 xAI 创业公司的成立,现已因不相关而移除。同时,Apple Vision Pro 的提及也被删去,因为文章更侧重于软件。我们还加入了最新发布的 Mid...

ChatGPTLLMMidjourneyPrompt EngineeringVision
4.0 · 优秀 研究者
Models 2023-12-12 · 文章
2023 年,我患上了 AI 焦虑症

2023 年对我来说是神奇的一年,我意外的从一个程序员变成了一个 AI 资讯届的“网红”,到年底的时候我在 X 平台的阅读量超过 1 亿,微博上的阅读量则超过 10 亿,很多人通过我的微博或者 X 了解最新的 AI 资讯、教程和 Prompt 使用技巧。而这一切其实是从我患上了 AI 焦虑症开始的。我将向你分享我的故事,如何患上了 AI 焦虑症,又是如何克服它,并且成功的把 AI 变成自己的得力助手,让自己成为善用 AI 的人。 2023 年对我来说是神奇的一年,我意外的从一个程序员变成了一个 AI 资讯届的"网红",到年底的时候我在 X 平台的阅读量超过 1 亿,微博上的阅读量则超过 10 亿,很多人通过我的微博或者 X 了解最新的 AI 资讯、教程和 Prompt 使用技巧。而这一切其实...

ChatGPTGPT-4OpenAIStable DiffusionMidjourneyPrompt Engineering
4.0 · 优秀 研究者
Models 2023-05-29 · 文章
Azure OpenAI 的提示工程技术 - Azure OpenAI Service | Microsoft Learn

Azure OpenAI 的提示工程技术 - Azure OpenAI Service | Microsoft Learn 了解有关如何使用 GPT-3、ChatGPT 和 GPT-4 模型进行提示工程的选项 本指南不深入介绍聊天补全消息结构背后的机制。 如果你不熟悉以编程方式与 ChatGPT 和 GPT-4 模型交互,建议先阅读有关聊天补全 API 的操作指南。 本指南的这一部分中的所有示例都针对基础 GPT-4 模型进行了英语测试。 如果你在通过另一种语言阅读本文的本地化版本,则这些响应表示英语结果的本地化翻译。 若要根据你用于提示模型的语言详细了解潜在的限制,请参阅负责任 AI 透明度说明。

ChatGPTGPT-4GPT-3OpenAIPrompt Engineering
4.0 · 优秀 研究者
Models 2023-04-13 · GitHub
GitHub - Torantulino/Auto-GPT: An experimental ope...

English AutoGPT is a powerful platform that allows you to create, deploy, and manage continuous AI agents that automate complex workflows. Download to self-host (Free!). Join the Waitlist for the cloud-hosted beta. Setting up and hosting the AutoGPT Platform yourself is a technical process....

gpt-4llm
4.0 · 优秀 研究者
Models 2023-04-01 · 视频
OpenAI CEO 详解 GPT-4与AI的未来(播客笔记)

#67 OpenAI CEO 详解 GPT-4与AI的未来(播客笔记) 3月20日,OpenAI CEO Sam Altman 和科技主播 Lex Fridman 进行对谈,主要讨论 GPT-4、通用人工智能(AGI)、 OpenAI 公司、AI 带来的潜在问题,以及 AI 的未来。我总结了对话中最启发我的部分,约 3000字。受限于精力与认知,笔记中难免有谬误,敬请指正。总体来说,Sam Altman 认为,GPT-4 等 AI 系统并非少数人的成果,而是源于无数人... 3月20日,OpenAI CEO Sam Altman 和科技主播 Lex Fridman 进行对谈,主要讨论 GPT-4、通用人工智能(AGI)、 OpenAI 公司、AI 带来的潜在问题,以及 AI 的未来。 我总结...

ChatGPTGPT-4OpenAIAI Safety
4.0 · 优秀 研究者
Models 2023-03-22 · 文章
AIGC图像生成的原理综述与落地畅想

基于Stable Diffusion扩散模型的综述 AIGC,这个当前的现象级词语。本文尝试从文生图的发展、对其当前主流的 Stable Diffusion 做一个综述。以下为实验按要求生成的不同场景、风格控制下的生成作品。 GAN 系列算法开启了图片生成的新起点。GAN的主要灵感来源于博弈论中零和博弈的思想,通过生成网络G(Generator)和判别网络D(Discriminator)不断博弈,进而使G学习到数据的分布。 G是一个生成式的网络,它接收一个随机的噪声z(随机数),通过这个噪声生成图像。 D是一个判别网络,判别一张图片是不是"真实的"。它的输入参数是x,x代表一张图片,输出D(x)代表x为真实图片的概率,如果为1,就代表100%是真实的图片。

AIGCStable DiffusionEmbeddingTransformerDiffusionVision
4.0 · 优秀 研究者
Models 2023-03-09 · 文章
ChatGPT 在做什么… 以及它为何发挥作用?

ChatGPT 在做什么… 以及它为何发挥作用? 作者:Stephen Wolfram,发表于 2023年2月14日原文链接: 作者 :Stephen Wolfram,发表于 2023年2月14日 原文链接 : 文章字数 :约 3.4 万字 建议收藏后阅读...... 提示:本文包括一百多张图片...... 微信公共账号的编辑器经常会出现图片处理错误(尤其是在使用 Markdown 处...

llmchatgpt
4.0 · 优秀 研究者
Models 2023-02-20 · 文章
从 ChatGPT 看 AI 未来的 7 种场景可能性

从 ChatGPT 看 AI 未来的 7 种场景可能性 公众号: 刘言飞语 发布时间: 1970-01-01 08:33:43 原文链接: 写在前面 ChatGPT 自去年 11 月 30 日发布后,开始在科技圈里引起热议。到了如今 2 月份,已经变成(科技领域)全民狂欢,有个说法是,Web3 的开发者大都掉头去搞 AI 了;大厂纷纷入局,紧张加码;民间也有老王带 5000 万美金下场,ChatGPT 套壳产品遍地丛生。 在充满焦虑和 fomo 氛围中,我还是想着是否能捋出一条自己的思路来——AI 到底能做什么? 很多初次接触的朋友第一印象就是,这不就是个很聪明的聊天机器人嘛?无非是个加强版的小冰。有趣之后,怕是就没有需求了。这个观点恐怕是错的。...

4.0 · 优秀 研究者
Models 2023-02-20 · 文章
ChatGPT的工作原理,这篇文章说清楚了

ChatGPT的工作原理,这篇文章说清楚了 ChatGPT 能够自动生成一些读起来表面上甚至像人写的文字的东西,这非常了不起,而且出乎意料。但它是如何做到的?为什么它能发挥作用?我在这里的目的是大致介绍一下 ChatGPT 内部的情况,然后探讨一下为什么它能很好地生成我们认为是有意义的文本。 我首先要说明一下,我将把重点放在正在发生的事情的大的方向上,虽然我会提到一些工程细节,但我不会深入研究它们。(我所说的实质内容也同样适用于目前其他的 "大型语言模型" LLM 和 ChatGPT)。 首先要解释的是,ChatGPT 从根本上说总是试图对它目前得到的任何文本进行 "合理的延续",这里的 ...

llmchatgpt
4.0 · 优秀 研究者
Models 2023-02-07 · 文章
ChatGPT背后的经济账

ChatGPT能否取代Google、百度这样的传统搜索引擎?为什么中国不能很快做出ChatGPT?当前,对这些问题的探讨大多囿于大型语言模型(LLM)的技术可行性,忽略或者非常粗糙地估计了实现这些目标背后的经济成本,从而造成对LLM的开发和应用偏离实际的误判。 本文作者从经济学切入,详细推导了类ChatGPT模型搜索的成本、训练GPT-3以及绘制LLM成本轨迹的通用框架,为探讨LLM成本结构和其未来发展提供了可贵的参考视角。 * LLM驱动的搜索已经在经济上可行 :粗略估计,在现有搜索成本结构的基础上,高性能LLM驱动搜索的成本约占当下预估广告收入/查询的15%。 * 但经济可行并不意味着经济...

llmpromptinferencechatgpt
4.0 · 优秀 研究者
Models 2023-02-06 · 文章
谈谈ChatGPT 背后的核心技术论文

谈谈ChatGPT 背后的核心技术论文 公众号: 架构师 发布时间: 1970-01-01 08:33:43 原文链接: 架构师(JiaGouX) 我们都是架构师! 架构未来,你来不来? 缘起 输入几个简单的关键词,AI能帮你生成一篇短篇小说甚至是专业论文。作为上知天文下知地理对话语言模型,最近大火的ChatGPT在邮件撰写、视频脚本、文本翻译、代码编写等任务上强大表现,让埃隆·马斯克都声称感受到了AI的“危险”。 最近大火的ChatGPT的计算逻辑来自于一个算法名字叫Transformer。它来源于2017年的一篇科研论文《Attention is all your need》。...

4.0 · 优秀 研究者
Models 2022-12-09 · 文章
科技爱好者周刊(第234期):AI 聊天有多强?

科技爱好者周刊(第234期):AI 聊天有多强? 公众号: 阮一峰的网络日志 发布时间: 1970-01-01 08:33:42 原文链接: 这里记录每周值得分享的科技内容,周五发布。 封面图 荷兰乌特勒支市的图书馆,读者如果想要为电子设备充电,必须自己骑自行车发电。(via\[1\]) 本周话题:AI 聊天有多强? 上周最大的技术新闻是,OpenAI 公司发布\[2\]了一款 AI 聊天软件 ChatGPT\[3\]。 它其实不能算聊天软件,更像是一个“问不倒先生”,不管什么问题,都能告诉你答案。 它的回答质量之高,令人震惊,完全不像机器人,更像百科全书。 网友问它:“大家都說租房就是帮房东缴房贷,所以买房才是更好的选择。你怎么看? 它回答如下: “是的,有人认为租房只会帮助房东偿还房贷,而购买房屋才是更好的选择。...

4.0 · 优秀 研究者
Models 2022-04-21 · 文章
新一代深度学习编译技术变革和展望

本文总结对于深度学习编译领域过去两年的思考和未来展望。新一代架构一直是我们核心关注的主题,这里提到的各个特性也都已重构完成或者进行中。TVM FFI去年逐渐成熟,TensorIR本身刚被合并到主干,后续metaschedule陆续进入主干。

4.0 · 优秀 研究者