當(dāng)前位置：首頁 > 新聞資訊 > 人工智能應(yīng)用 > DeepSeek原理與落地應(yīng)用,基于上下文預(yù)測(cè)下一個(gè) token,激發(fā)深度思考等,提升對(duì)話質(zhì)量

DeepSeek原理與落地應(yīng)用,基于上下文預(yù)測(cè)下一個(gè) token,激發(fā)深度思考等,提升對(duì)話質(zhì)量

來源：北京大學(xué) 編輯：創(chuàng)澤時(shí)間：2025/3/7 主題：其他 [加盟]

人工智能概念辨析：介紹大模型相關(guān)術(shù)語，回顧大模型從運(yùn)算推理、知識(shí)工程到深度學(xué)習(xí)的發(fā)展歷程，對(duì)比生成模型和推理模型在定位、推理能力、多模態(tài)支持、應(yīng)用場景和用戶交互體驗(yàn)的差異。

DeepSeek R1

公司與模型：DeepSeek 成立于 2023 年 7 月，獲幻方量化支持，專注大語言模型開發(fā)。旗下模型包括生成模型 V3 和推理模型 R1，R1 具有推理能力強(qiáng)、開源、低成本、國產(chǎn)化等特點(diǎn)，在國際競爭中處于第一梯隊(duì)。

使用與部署：提供官方網(wǎng)頁、APP、API，還可通過國家超算平臺(tái)等第三方渠道使用。個(gè)人可通過 Ollama 部署蒸餾模型，企業(yè)可利用 vLLM 進(jìn)行生產(chǎn)級(jí)部署。部署 R1 滿血版需特定算力支持，不同算力配置價(jià)格不同。

模型原理：GPT 采用 Transformer 架構(gòu)，經(jīng)預(yù)訓(xùn)練、監(jiān)督微調(diào)等階段，基于上下文預(yù)測(cè)下一個(gè) token。生成模型有語言理解和生成等能力，但存在幻覺等問題。DeepSeek R1 通過思維鏈、強(qiáng)化學(xué)習(xí)和蒸餾技術(shù)，提升推理能力，減少模型大小。

落地應(yīng)用

提示詞技巧：包括真誠直接、使用通用公式、說人話、反向 PUA、善于模仿、擅長銳評(píng)、激發(fā)深度思考等，可提升對(duì)話質(zhì)量。

應(yīng)用場景：適用于推理密集型任務(wù)、教育與知識(shí)應(yīng)用、文檔分析、開放領(lǐng)域問答寫作等場景。在教育與學(xué)術(shù)領(lǐng)域，可用于教學(xué)設(shè)計(jì)、作業(yè)批改、論文輔助等；在知識(shí)付費(fèi)領(lǐng)域，可進(jìn)行課程大綱設(shè)計(jì)、直播腳本撰寫等。

附件：DeepSeek原理與落地應(yīng)用,基于上下文預(yù)測(cè)下一個(gè) token,激發(fā)深度思考等,提升對(duì)話質(zhì)量