模型与实验室 3.0 · 值得看 2025-02-04 · 论文

DeepSeek-R1 论文解析——人工智能领域的 RL LLM 新时代？

DeepSeek-R1 论文解析——人工智能领域的 RL LLM 新时代？ DeepSeek-R1 论文解析——人工智能领域的 RL LLM 新时代？近年来，人工智能 (AI) 领域取得了快速发展，大型语言模型 (LLM) 为通用人工智能 (AGI) 铺平了道路。OpenAI的 o1 是一个出色的模型，它引入了创新的推理时间扩展技术，可显著增强推理能力。然而，它仍然是闭源的。今天，我们深入研究了 DeepSeek 推出的开创性研究论文 DeepSeek-R1。这篇题为"DeepSeek-R1：通过强化学习激励大型语言模型中的推理能力"的论文介绍了一种最先进的开源推理模型，以及使用大...

打开原文回到归档

继续阅读

Agents 4.0 · 优秀

Google《智能体设计模式》之智能体推理引擎的内部视角 - 附录F 中翻版

Google《智能体设计模式》之智能体推理引擎的内部视角 - 附录F 中翻版原创企业AI小蜜书企业AI小蜜书企业AI解构局在小说阅读器读本章去阅读在小说阅读器中沉浸阅读点击上方蓝字关注，一起畅游AI 前言：这本由谷歌资深工程主管 Antonio Gulli 免费分享的《智能体设计模式》，系统性地提炼出 21 个核心智能体设计模式，涵盖从提示链、工具使用到多智能体协作、自我修正等关键技术。本书的中文翻译流程为「AI 初次翻译 → AI 交叉评审 → 人工评审 → 人工交叉评审」，所有翻译内容将会持续更新到开源项目：github.com/ginobefun/agentic-design-patterns-cn。我参与了第十四章（RAG）和附录F（LLM内部推理引擎）的翻译，请大家在本文/开源项目地址提交指正。...

2025-10-19 · 文章

Coding 3.0 · 值得看

Claude刚登顶，OpenAI就放出24小时不休息的编程AI，谁才是最强？

关于Claude刚登顶，OpenAI就放出24小时不休息的编程A的收藏文章

2025-12-06 · 文章

Models 4.0 · 优秀

GitHub - PacktPublishing/LLM-Engineers-Handbook: The LLM's practical guide: From the fundamental...

GitHub - PacktPublishing/LLM-Engineers-Handbook: The LLM's practical guide: From the fundamentals to... The LLM's practical guide: From the fundamentals to deploying advanced LLM and RAG apps to AWS using LLMOps best practices - PacktPublishing/LLM-Engineers-Handbook LLM Engineer's Handbook: Maste...

2026-04-10 · GitHub

Models 4.0 · 优秀

ChatGPT背后的经济账

ChatGPT能否取代Google、百度这样的传统搜索引擎？为什么中国不能很快做出ChatGPT？当前，对这些问题的探讨大多囿于大型语言模型（LLM）的技术可行性，忽略或者非常粗糙地估计了实现这些目标背后的经济成本，从而造成对LLM的开发和应用偏离实际的误判。本文作者从经济学切入，详细推导了类ChatGPT模型搜索的成本、训练GPT-3以及绘制LLM成本轨迹的通用框架，为探讨LLM成本结构和其未来发展提供了可贵的参考视角。 * LLM驱动的搜索已经在经济上可行：粗略估计，在现有搜索成本结构的基础上，高性能LLM驱动搜索的成本约占当下预估广告收入/查询的15%。 * 但经济可行并不意味着经济...

2023-02-07 · 文章