清华大学2025年DeepSeekDeepResearch应用报告59页

本文是清华大学2025年关于%ignore_a_1% Deep Research应用的报告，核心内容围绕DeepSeek深度思考R1、Gemini Deep Research以及ChatGPT的Deep Research功能的应用、技术实现、实际案例分析及未来发展方向展开。

Table of Contents

DeepSeek深度思考R1

DeepSeek深度思考R1是一款基于深度学习技术的推理模型，核心功能是通过强化学习提升推理能力，引入自我反思机制，提高推理准确性和可靠性。其性能在数学、代码、自然语言推理等任务上与OpenAI的GPT-4相当，例如在2024年美国高级中学数学竞赛AIME题目上的一次性解题正确率达到39.2%，而GPT-4约为9.3%。

DeepSeek R1的推理过程分为四个阶段：

输入阶段：利用自然语言处理技术解析用户问题。
思维链生成：构建初步推理路径，运用思维链推理技术。
强化学习优化：自我检查和反思，优化推理路径。
最终答案生成：输出最终答案及详细推理链。

Gemini Deep Research

Gemini Deep Research是Google AI推出的多模态大模型Gemini的高级功能，旨在帮助用户进行实时、深入的研究。其功能包括实时信息检索、深入主题研究、辅助决策及生成可在线编辑报告。使用时，用户需定义研究问题和目标，构建有效的搜索策略，利用多来源信息进行跨学科、跨地区及不同利益相关者的观点分析。

ChatGPT的Deep Research

ChatGPT的Deep Research功能旨在帮助用户完成复杂的多步骤信息检索与研究任务。用户只需提供提示或问题，ChatGPT会在互联网上搜索、分析并综合信息，生成综合报告。其主要用途包括数据调研与可视化、模糊信息检索、专业知识问答、消费产品调研及专业领域研究。

Deep Research的技术实现路径包括：

专业定制的模型：基于OpenAI的o3模型变体，针对网页浏览和数据分析优化。
自主的步骤执行：通过强化学习训练，模型学会规划策略，执行多步搜索路径。
工具与多模态能力：处理多种格式资料，调用工具进行数据处理。

实战案例分析

报告中提供了多个实战案例，展示DeepSeek R1和Gemini Deep Research在不同领域的应用。例如，DeepSeek R1在撰写舆论分析报告和行业研究中的应用，以及Gemini Deep Research在实时信息检索和深入主题研究中的应用。

未来发展方向

推理大模型的未来发展方向包括提升模型能力、丰富输出形式、加强事实校验与控制及与其他智能体的整合。这些改进将使模型在检索策略和推理准确性上进一步提高，减少错误和遗漏，并提供更直观的报告形式。

结论

报告强调，推理大模型在多个领域展现出巨大潜力，能够显著提升研究和分析的效率。然而，模型仍存在局限性，如研究质量与准确性有限、新发现能力有限及过程不可完全复现等。未来，随着技术的不断进步，推理大模型有望在更多领域发挥更大作用。