人工智能概念辨析:介紹大模型相關(guān)術(shù)語,回顧大模型從運(yùn)算推理、知識(shí)工程到深度學(xué)習(xí)的發(fā)展歷程,對(duì)比生成模型和推理模型在定位、推理能力、多模態(tài)支持、應(yīng)用場景和用戶交互體驗(yàn)的差異。
DeepSeek R1
公司與模型:DeepSeek 成立于 2023 年 7 月,獲幻方量化支持,專注大語言模型開發(fā)。旗下模型包括生成模型 V3 和推理模型 R1,R1 具有推理能力強(qiáng)、開源、低成本、國產(chǎn)化等特點(diǎn),在國際競爭中處于第一梯隊(duì)。
使用與部署:提供官方網(wǎng)頁、APP、API,還可通過國家超算平臺(tái)等第三方渠道使用。個(gè)人可通過 Ollama 部署蒸餾模型,企業(yè)可利用 vLLM 進(jìn)行生產(chǎn)級(jí)部署。部署 R1 滿血版需特定算力支持,不同算力配置價(jià)格不同。
模型原理:GPT 采用 Transformer 架構(gòu),經(jīng)預(yù)訓(xùn)練、監(jiān)督微調(diào)等階段,基于上下文預(yù)測(cè)下一個(gè) token。生成模型有語言理解和生成等能力,但存在幻覺等問題。DeepSeek R1 通過思維鏈、強(qiáng)化學(xué)習(xí)和蒸餾技術(shù),提升推理能力,減少模型大小。
落地應(yīng)用
提示詞技巧:包括真誠直接、使用通用公式、說人話、反向 PUA、善于模仿、擅長銳評(píng)、激發(fā)深度思考等,可提升對(duì)話質(zhì)量。
應(yīng)用場景:適用于推理密集型任務(wù)、教育與知識(shí)應(yīng)用、文檔分析、開放領(lǐng)域問答寫作等場景。在教育與學(xué)術(shù)領(lǐng)域,可用于教學(xué)設(shè)計(jì)、作業(yè)批改、論文輔助等;在知識(shí)付費(fèi)領(lǐng)域,可進(jìn)行課程大綱設(shè)計(jì)、直播腳本撰寫等。
附件:DeepSeek原理與落地應(yīng)用,基于上下文預(yù)測(cè)下一個(gè) token,激發(fā)深度思考等,提升對(duì)話質(zhì)量

本地化部署DeepSeek的基本方法,了解更專業(yè)的企業(yè)級(jí)部署方法,講解Unsloth R1動(dòng)態(tài)量化部署的三種實(shí) 現(xiàn)路徑:基于llama.cpp、KTransformers以及Ollama框架動(dòng)態(tài)量化部署
美國在 GenAI領(lǐng)域的領(lǐng)先地位正在被中國迎頭趕上,AI 供應(yīng)鏈格局將被重塑;開放權(quán)重模型正在推動(dòng)基礎(chǔ)模型層商品化,為應(yīng)用開發(fā)者帶來新機(jī)遇;擴(kuò)大規(guī)模并非通往 AI 進(jìn)步的唯一途徑
突破大模型訓(xùn)練固定思維,敢于嘗試在低精度 FP8 的模式下訓(xùn)練大模型,出現(xiàn)了較好的效果,每10年計(jì)算成本降低約1000倍,但人們的購買量增加了 10 萬倍
DeepSeek大模型的開源,低成本和高性能將大幅降低大模型的獲得,部署和應(yīng)用成本,將加快大模型在 B 端和 C 端應(yīng)用場景的落地;已應(yīng)用于端側(cè)、教育、金融、辦公、傳媒、醫(yī)療、智能汽車、企業(yè)服務(wù)等多個(gè)應(yīng)用場景,應(yīng)用領(lǐng)域廣闊
DeepSeek 降低了單個(gè)模型的部署成本,AI 應(yīng)用有望大規(guī)模落地, 推理算力需求將顯著增長,相關(guān)廠商有望加速進(jìn)入業(yè)績兌現(xiàn)期,在 AI 應(yīng)用前沿落地 場景中,全球 AI 應(yīng)用產(chǎn)業(yè)有望迎來共振期
PI 調(diào)用層面,DS/OpenAI 的輸入費(fèi)用分別為 0.55/15 美元/百萬 token,DS 推理使用成本僅為 OpenAI 的 4%,顯著的降低資金門檻,推動(dòng)了 AI 技術(shù)平權(quán)
精準(zhǔn)數(shù)據(jù)洞察與自動(dòng)化效能提升方法論;DeepSeek將在企業(yè)服務(wù)、科研創(chuàng)新等垂直領(lǐng)域深度滲透;DeepSeek將通過開源戰(zhàn)略擴(kuò)大開發(fā)者社區(qū)規(guī)模,并推出模型微調(diào)平臺(tái)和低代碼部署工具
周鴻祎以DeepSeek帶來的變革為切入點(diǎn),深入剖析AI行業(yè)發(fā)展趨勢(shì),并分享了AI技術(shù)于創(chuàng)業(yè)的應(yīng)用前景,未來應(yīng)用將從六大方向?qū)崿F(xiàn)爆發(fā),企業(yè)內(nèi)部未來一定是多個(gè)大模型組合工作
AI生成的回答重復(fù)相似,缺乏新意,即使改變提問,無法提供不同的結(jié)論;使用更多樣的訓(xùn)練數(shù)據(jù)和算法,提高AI的多樣性;優(yōu)化訓(xùn)練參數(shù), 避免模型陷入局部最優(yōu)
模型難以處理訓(xùn)練集外的復(fù)雜場景,模型過度依賴參數(shù)化記憶,普通用戶難以辨別AI內(nèi)容的真實(shí)性,可能對(duì)醫(yī)療建議、法律咨詢等專業(yè)場景的可 靠性產(chǎn)生長期懷疑
DeepSeek技術(shù)突破與應(yīng)用場景,冷啟動(dòng)數(shù)據(jù)與多階段優(yōu)化,本地部署與端云協(xié)同,垂直領(lǐng)域深耕(醫(yī)療、金融、教育);智能協(xié)作與自動(dòng)化轉(zhuǎn)型,消費(fèi)決策與商業(yè)研究賦能
你想要生成什么樣的文案? 這樣的文案具備哪些特征? 你要針對(duì)什么生成類似文案? 篇幅、用詞、結(jié)構(gòu)優(yōu)化;批量生成新媒體文案