基于書生·浦語2.0強大的基座模型能力,豐登通過注入我國種業(yè)相關的科研文獻、科技書籍、種企報告等數(shù)據(jù),使大模型獲得了理解和分析育種相關專業(yè)問題的能力,拓展了大模型助力生物育種的探索路徑。
生物育種技術是第一產業(yè)里的關鍵核心技術。而我國當前的育種信息通常散布在眾多育種科研文獻、技術書籍和網(wǎng)絡資源中。由于缺乏統(tǒng)一的數(shù)據(jù)和知識平臺,數(shù)據(jù)的孤島性、分散性導致育種工作人員不得不跨越多個文獻源、書籍,甚至需要編寫代碼進行數(shù)據(jù)訪問,限制了生物育種中的工作效率。同時,育種技術的學習有著顯著的行業(yè)和知識壁壘,這也限制了青年人從事育種行業(yè)的選擇。
習書記指示“加快推進生物育種研發(fā)應用”。相較于國內外其他大語言模型,豐登作為交叉學科的科研創(chuàng)新重點關注生物育種。豐登可以有效地總結歷史數(shù)據(jù)和專家經(jīng)驗,旨在支持用戶在品種選育、農藝性狀、栽培技術和推廣區(qū)域四大核心領域提供解釋和回答,助力育種知識的在國內的傳承和推廣。具體特點如下:
• 豐登深度挖掘并結構化我國在育種領域積累的包括學術文獻、書籍、田間日志和政府公示在內的廣泛知識。將文本信息中提煉出的知識通過大模型的技術手段匯聚到模型權重中,將分散在不同文獻中的同一知識點整合歸納。
• 跨領域知識融合。豐登通過書生·浦語2.0大語言模型基座,除了作物學、農學和遺傳學等種業(yè)相關學科,還整合了生物學、遺傳學、氣象學、土壤學等相關領域的多學科知識。通過提示詞的合理運用,豐登可以被用來發(fā)掘這些領域之間的新聯(lián)系。
• 提高信息獲取效率。豐登通過自然語言對話接口降低了應用門檻,用戶可以直接提出問題并迅速獲得易于理解的信息。相較于文獻數(shù)據(jù)庫查詢和網(wǎng)絡搜索,多輪對話的方式確保了信息的實時性和高效獲取,極大提高了信息獲取效率。豐登未來還可以通過加入語音輸入模塊,完成語音和文字信息的實時轉換,進一步提高工作效率。
• 知識共享與傳播。豐登的長遠目標是為政府機構提供種業(yè)相關的信息咨詢和基于種業(yè)大數(shù)據(jù)的政策建議;為育種企業(yè)和科研院所提供專業(yè)的知識獲取方式,并提供智能化的育種建議;為高等院校的相關師生提供教學輔助工具,為國家培養(yǎng)下一代人才;為農民提供生產流程中的智能助手,提高工作效率。
豐登可以提高獲取種業(yè)信息的工作效率并降低了育種知識的學習門檻,對振興國內種業(yè),推廣育種知識,促進科學研究有重要意義。大模型技術的運用不僅填補了我國在種業(yè)專業(yè)領域的大模型空白,同時也是對我國育種領域采納新技術的一次大膽嘗試。
以水稻為例,豐登計劃實現(xiàn)2.5萬個水稻審定品種的品種選育歷史記錄問答、農藝性狀描述、栽培技術推薦及歷史推廣區(qū)域查詢;針對4000個主要栽培品種的每一個基因變異鑒定;針對250份核心品種的農藝性狀和表型問答,包括但不限于多光譜、核磁共振、CT等等;以及針對水稻15個關鍵發(fā)育階段的空間組學測序和單細胞組學測序數(shù)據(jù)。目前豐登已經(jīng)收到了來自國內六十余家單位的合作和測試申請,包括中國種子集團、先正達集團中國、隆平高科、正大集團等種業(yè)公司,中國科學院、中國農業(yè)科學院、上海農業(yè)科學院、廣東農業(yè)科學院等農業(yè)科研單位,中國農業(yè)大學、華中農業(yè)大學、南京農業(yè)大學、西北農林科技大學等高等院校。豐登的問世對中國種業(yè)大模型的發(fā)展起到了不可替代的促進作用。
相較于傳統(tǒng)的言傳身教和基于數(shù)據(jù)庫的知識圖譜技術,豐登是大語言模型技術在育種領域的首次嘗試,對于國內育種技術升級換代具有里程碑意義。未來豐登還會通過調用人工智能模型的方式逐步融入圖像分析功能,多組學分析功能和決策育種功能,進一步提升育種工作效率,實現(xiàn)智能育種。
機器人底盤 Disinfection Robot 消毒機器人 講解機器人 迎賓機器人 移動機器人底盤 商用機器人 智能垃圾站 智能服務機器人 大屏機器人 霧化消毒機器人 紫外線消毒機器人 消毒機器人價格 展廳機器人 服務機器人底盤 核酸采樣機器人 機器人代工廠 智能配送機器人 噴霧消毒機器人 圖書館機器人 導引機器人 移動消毒機器人 導診機器人 迎賓接待機器人 導覽機器人 |