中科院軟件所在跨粒度小樣本學(xué)習(xí)方面取得突破

2023-02-07 11:55:16


(相關(guān)資料圖)

近日,中科院軟件所天基綜合信息系統(tǒng)重點(diǎn)實(shí)驗(yàn)室研究團(tuán)隊(duì)的論文“Meta Attention-Generation Network for Cross-Granularity Few-Shot Learning”被計(jì)算機(jī)視覺領(lǐng)域頂級(jí)學(xué)術(shù)期刊IJCV(International Journal of Computer Vision)接收,第一作者為助理研究員強(qiáng)文文、博士生李江夢(mèng)。論文首次提出一個(gè)新的學(xué)習(xí)問題:跨粒度的小樣本學(xué)習(xí)(CG-FSL),并基于結(jié)構(gòu)因果理論推導(dǎo)出適用于CG-FSL的因果學(xué)習(xí)模型,稱為元注意力生成網(wǎng)絡(luò) (MAGN),有效突破細(xì)粒度小樣本學(xué)習(xí)的瓶頸。 

細(xì)粒度分類旨在識(shí)別屬于粗粒度類別的細(xì)粒度子類的圖像,相比于粗粒度樣本,其收集和標(biāo)注難度大、成本高?,F(xiàn)有的標(biāo)準(zhǔn)小樣本學(xué)習(xí)(FSL)側(cè)重于對(duì)已知和未知類進(jìn)行泛化,所有的分類都處于相同的粒度級(jí)別。實(shí)踐中使用FSL方法來解決分類問題時(shí),需要為某些細(xì)粒度類提供大量標(biāo)記樣本。如何才能實(shí)現(xiàn)基于少量標(biāo)記樣本的細(xì)粒度分類,是研究團(tuán)隊(duì)希望解決的問題。由于粗粒度類樣本的易得性,研究團(tuán)隊(duì)希望從粗粒度類別中學(xué)習(xí)知識(shí),并通過少量樣本轉(zhuǎn)移到細(xì)粒度類別中。 

基于上述探索和分析,研究團(tuán)隊(duì)遵循認(rèn)知神經(jīng)學(xué)的規(guī)律,提出了基于大量粗粒度類標(biāo)簽樣本進(jìn)行訓(xùn)練,在測(cè)試階段對(duì)細(xì)粒度子類標(biāo)簽樣本進(jìn)行劃分的方法。同時(shí),通過結(jié)構(gòu)因果模型(SCM)對(duì)CG-FSL進(jìn)行分析,發(fā)現(xiàn)在粗粒度級(jí)別學(xué)習(xí)的標(biāo)準(zhǔn)小樣本學(xué)習(xí)模型實(shí)際上是一個(gè)混雜因素。研究團(tuán)隊(duì)采用后門調(diào)整以解耦干擾,推導(dǎo)并提出了一個(gè)稱為元注意力生成網(wǎng)絡(luò) (MAGN) 的因果CG-FSL模型。該模型以雙層優(yōu)化方式進(jìn)行訓(xùn)練,可以自適應(yīng)地生成多注意圖,以消除由粗粒度類別信息引起的混淆。 

研究團(tuán)隊(duì)基于5個(gè)不同的細(xì)粒度圖像數(shù)據(jù)集,通過構(gòu)建多個(gè)基準(zhǔn)和評(píng)估協(xié)議,來對(duì)比CG-FSL方法和幾種廣泛使用的FSL方法。經(jīng)過大量實(shí)驗(yàn),結(jié)果表明CG-FSL更具有挑戰(zhàn)性,所構(gòu)建的MAGN模型在細(xì)粒度分類任務(wù)精度上明顯優(yōu)于標(biāo)準(zhǔn)小樣本學(xué)習(xí)模型,實(shí)現(xiàn)了在跨粒度小樣本學(xué)習(xí)上的突破。 

標(biāo)簽: 認(rèn)知神經(jīng)學(xué) 中科院軟件所

關(guān)閉
新聞速遞