深度學習模型已經(jīng)成功地應用于各種基于圖像的植物表型應用,包括疾病檢測和分類。然而,有監(jiān)督的深度學習模型的成功部署需要大量的標記數(shù)據(jù),
由于固有的復雜性,這在植物科學(和大多數(shù)生物學)領域是一個重大挑戰(zhàn)。具體來說,數(shù)據(jù)注釋是昂貴的、費力的、耗時的,并且需要用于表型任務的領域專業(yè)知識,
尤其是對于疾病。為了克服這一挑戰(zhàn),已經(jīng)提出了主動學習算法來減少深度學習模型所需的標記量,以實現(xiàn)良好的預測性能。
在大豆葉子上收集的九類數(shù)據(jù)(八類應激數(shù)據(jù)和一類健康數(shù)據(jù)),其中包括第一個數(shù)據(jù)集
主動學習方法通過使用采集函數(shù)自適應地建議樣本進行注釋來工作,以在固定標記預算下實現(xiàn)最大(分類)性能。
報告了四種不同的主動學習方法的性能,(1)深度貝葉斯主動學習(DBAL),(2)熵,(3)最小置信度,(4)核心集,
基于傳統(tǒng)的隨機采樣標注的兩種不同的基于圖像的分類數(shù)據(jù)集。
第二個數(shù)據(jù)集的九個類別包括八個雜草種類和一個無雜草類別
第一個圖像數(shù)據(jù)集由屬于八種不同大豆脅迫和健康類別的大豆 [Glycine max L. (Merr.)] 葉子組成,
第二個圖像數(shù)據(jù)集由來自田間的九種不同雜草組成。對于固定的標記預算,對于兩個數(shù)據(jù)集,
使用基于主動學習的獲取策略的深度學習模型的分類性能優(yōu)于基于隨機采樣的獲取。
數(shù)據(jù)注釋的主動學習策略的集成可以幫助減輕植物科學應用中的標簽挑戰(zhàn),特別是在專用于注釋的資源有限的情況下。
電話
微信