【資料圖】
1月13日,記者從南京農業大學(以下簡稱“南農”)獲悉,該校主導研發出國內首個面向通用農業領域的開源垂直大語言模型“司農”。這標志著南農在農業領域的人工智能基礎模型研究與應用取得新突破。
據悉,研究團隊依托南農學科優勢,收集了包括動物科學、農業經濟管理、農業資源與環境、園藝學、智慧農業、動物醫學、植物保護、作物育種等學科數據,涵蓋了近9000冊書籍、24萬余篇學術論文和近2萬份政策、標準,構建了體系相對完整的農業基礎數據集。
針對大語言模型在專業領域應用中常見的“幻覺問題”和知識滯后性,團隊在模型訓練階段,除微調傳統指令外,還引入了思維鏈和上下文參考等多維訓練數據,顯著提升了模型對于農業專業知識的理解與生成能力。
針對文獻知識利用效率問題,團隊推出多智能體檢索增強框架。該框架通過優化知識庫構建、智能查詢改寫、混合檢索等策略,使模型能夠精準調用專業知識,有效保障了生成內容的準確性與時效性。
目前,司農大語言模型已在魔塔社區和GitHub社區全面開源,發布了8B和32B兩種參數規模的版本。這一開源開放策略,旨在降低農業AI應用門檻,助力廣大科研機構、企業和開發者基于司農大語言模型進行二次開發與創新應用,共同培育智慧農業的應用生態。
關鍵詞: 最新資訊