文/集佳知識(shí)產(chǎn)權(quán)代理有限公司 朱靜
機(jī)器學(xué)習(xí)(Machine Learning, ML)是一門(mén)多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度等多門(mén)學(xué)科,專門(mén)研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或者技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。簡(jiǎn)單的講,機(jī)器學(xué)習(xí)是一門(mén)人工智能的學(xué)科,其主要研究對(duì)象是人工智能,特別是如何在經(jīng)驗(yàn)學(xué)習(xí)中改善具體算法的性能。
目前,機(jī)器學(xué)習(xí)已經(jīng)在眾多領(lǐng)域得到應(yīng)用,例如數(shù)據(jù)挖掘、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、生物特征識(shí)別、搜索引擎、證券市場(chǎng)分析、DNA序列預(yù)測(cè)以及機(jī)器人運(yùn)用。隨著機(jī)器學(xué)習(xí)在各個(gè)領(lǐng)域的快速發(fā)展,眾多企業(yè)逐漸投入研發(fā)機(jī)器學(xué)習(xí)技術(shù),從而使得幾年來(lái)涉及機(jī)器學(xué)習(xí)技術(shù)的專利越來(lái)越多,于此同時(shí),企業(yè)對(duì)機(jī)器學(xué)習(xí)的專利申請(qǐng)需求也越來(lái)越多,因此,如何撰寫(xiě)機(jī)器學(xué)習(xí)技術(shù)的專利是目前專利從業(yè)人員所關(guān)注的重點(diǎn)之一?;诖?,筆者根據(jù)撰寫(xiě)經(jīng)驗(yàn)談一談涉及機(jī)器學(xué)習(xí)技術(shù)的專利申請(qǐng)文件的撰寫(xiě)策略。
機(jī)器學(xué)習(xí)在技術(shù)實(shí)現(xiàn)時(shí),大致分為模型訓(xùn)練階段和模型應(yīng)用階段,所謂模型訓(xùn)練階段是指利用機(jī)器學(xué)習(xí)算法對(duì)樣本數(shù)據(jù)進(jìn)行學(xué)習(xí)以訓(xùn)練模型的階段,所謂模型應(yīng)用階段是指利用訓(xùn)練好的模型對(duì)新數(shù)據(jù)進(jìn)行預(yù)測(cè)的階段。而在實(shí)際技術(shù)研發(fā)過(guò)程中,有時(shí)會(huì)針對(duì)模型訓(xùn)練階段產(chǎn)生相關(guān)專利,而有時(shí)會(huì)針對(duì)模型應(yīng)用階段產(chǎn)生相關(guān)專利,當(dāng)然,大部分時(shí)候是在兩個(gè)階段都有相關(guān)的改進(jìn)點(diǎn),即同時(shí)產(chǎn)生相關(guān)專利。
基于機(jī)器學(xué)習(xí)技術(shù)本身的特點(diǎn),筆者根據(jù)自身撰寫(xiě)經(jīng)驗(yàn)總結(jié)出以下撰寫(xiě)策略:
?。?)、在實(shí)際操作中,先根據(jù)交底書(shū)明確技術(shù)改進(jìn)點(diǎn)屬于哪個(gè)階段,方案僅涉及訓(xùn)練階段的改進(jìn)點(diǎn),還是僅涉及到應(yīng)用階段的改進(jìn)點(diǎn),還是兩者皆有。根據(jù)方案的改進(jìn)點(diǎn)所屬的具體階段部署對(duì)應(yīng)的權(quán)項(xiàng)。下面針對(duì)不同的情況分別進(jìn)行說(shuō)明。
一種情況是,方案僅在模型訓(xùn)練階段存在改進(jìn)點(diǎn),例如,在模型訓(xùn)練階段涉及到原始數(shù)據(jù)采集、樣本數(shù)據(jù)挖掘、特征提取、模型內(nèi)部結(jié)構(gòu)變化、模型參數(shù)更新算法以及模型組合訓(xùn)練等一個(gè)或者多個(gè)方面,方案若在這些方面作了改進(jìn),針對(duì)這種情況,則僅部署模型的訓(xùn)練方法以及產(chǎn)品等相關(guān)權(quán)項(xiàng)。
另一種情況是,方案僅在模型應(yīng)用階段存在改進(jìn)點(diǎn),例如,在模型應(yīng)用階段一般會(huì)涉及到數(shù)據(jù)采集、特征提取、模型內(nèi)部結(jié)構(gòu)變化、模型輸出結(jié)果應(yīng)用以及模型組合應(yīng)用等一個(gè)或者多個(gè)方面,方案若在這些方面作了改進(jìn),則僅部署模型的應(yīng)用方法以及產(chǎn)品等相關(guān)權(quán)項(xiàng)。
還有一種情況是,方案既涉及模型訓(xùn)練階段又涉及模型應(yīng)用階段,例如:方案涉及到模型內(nèi)部結(jié)構(gòu)的改進(jìn),則既需要部署模型訓(xùn)練的方法還需要部署模型應(yīng)用的方法以及相關(guān)產(chǎn)品等權(quán)項(xiàng)。
(2)、在確定應(yīng)部署的權(quán)項(xiàng)主題之后,再確定具體改進(jìn)點(diǎn)所屬的特定環(huán)節(jié),根據(jù)特定環(huán)節(jié)定位出合理的權(quán)項(xiàng)范圍,而無(wú)需站在模型訓(xùn)練過(guò)程或者模型應(yīng)用過(guò)程的全局角度進(jìn)行定位,以避免喪失權(quán)利。下面進(jìn)行舉例說(shuō)明。
一種情況是,有些方案僅僅涉及訓(xùn)練階段的某一個(gè)獨(dú)立環(huán)節(jié)的改進(jìn),則可以將方案定位到具體的獨(dú)立環(huán)節(jié),而無(wú)需站在整個(gè)訓(xùn)練過(guò)程進(jìn)行全局定位,這樣能夠確定出合理的權(quán)項(xiàng)范圍。
例如:有些方案僅涉及模型訓(xùn)練階段中樣本數(shù)據(jù)采集方面的改進(jìn),則可以將權(quán)項(xiàng)范圍定位在樣本數(shù)據(jù)采集的范圍即可,具體在撰寫(xiě)時(shí),方法權(quán)要的步驟描述出如何采集樣本數(shù)據(jù)以完整表征改進(jìn)點(diǎn)即可,可以跳出交底書(shū)中限定的特定模型下的訓(xùn)練場(chǎng)景,基于此,也可以對(duì)方案進(jìn)行場(chǎng)景性擴(kuò)展,以及訓(xùn)練過(guò)程中其他環(huán)節(jié)的擴(kuò)展。但在從權(quán)中可以通過(guò)名詞限定或者增加方法步驟的方式進(jìn)一步地保護(hù)樣本數(shù)據(jù)應(yīng)用于具體模型訓(xùn)練的方案,以保證交底書(shū)中提供的最佳場(chǎng)景應(yīng)用的方案。例如,在從權(quán)中采用功能性限定,如所述樣本數(shù)據(jù)用于某某模型訓(xùn)練,或者利用所述樣本數(shù)據(jù)對(duì)某某模型進(jìn)行訓(xùn)練。
另一種情況是,有些方案僅僅涉及訓(xùn)練階段中損失函數(shù)部分的改進(jìn),而此部分也無(wú)法作為獨(dú)立的方案,基于此,可以根據(jù)該改進(jìn)點(diǎn)所處的具體環(huán)節(jié),或者與其直接相關(guān)的環(huán)節(jié),確定權(quán)項(xiàng)合理的范圍;在機(jī)器學(xué)習(xí)中損失函數(shù)部分會(huì)涉及構(gòu)建目標(biāo)函數(shù)以及利用目標(biāo)函數(shù)進(jìn)行模型參數(shù)優(yōu)化環(huán)節(jié),基于此,可以將權(quán)項(xiàng)范圍定位到這兩個(gè)環(huán)節(jié)相結(jié)合所組成的范圍,而無(wú)需站在訓(xùn)練過(guò)程全局角度進(jìn)行定位,也不能定位到函數(shù)本身的范圍,即不能盲目縮小范圍至喪失技術(shù)方案本身所需的素材導(dǎo)致不屬于保護(hù)客體,也不能局限于整個(gè)實(shí)際方案實(shí)現(xiàn)的場(chǎng)景,這樣才能夠確定出合理的權(quán)項(xiàng)范圍。
?。?)、在實(shí)際操作中,大部分涉及機(jī)器學(xué)習(xí)技術(shù)的方案會(huì)同時(shí)涉及到模型訓(xùn)練以及模型應(yīng)用兩個(gè)階段的改進(jìn),針對(duì)此情況,考慮到實(shí)際維權(quán)階段的相關(guān)問(wèn)題,建議先從模型應(yīng)用角度部署相關(guān)權(quán)項(xiàng),再?gòu)哪P陀?xùn)練角度部署相關(guān)權(quán)項(xiàng)。這主要是因?yàn)?,一方面模型?yīng)用相比模型訓(xùn)練更容易取證,由于模型訓(xùn)練一般僅在后臺(tái)完成,而模型應(yīng)用則有可能由前臺(tái)完成,供用戶使用。因此,模型應(yīng)用相比模型訓(xùn)練更容易取證。另一方面,模型應(yīng)用的市場(chǎng)價(jià)值也遠(yuǎn)遠(yuǎn)大于模型訓(xùn)練的市場(chǎng)價(jià)值,例如,有時(shí)模型訓(xùn)練可能一次性完成,而一旦模型在訓(xùn)練好之后是會(huì)被重復(fù)應(yīng)用,而且很容易被移植應(yīng)用;在實(shí)際應(yīng)用中,有的企業(yè)主要負(fù)責(zé)模型算法研究進(jìn)行模型訓(xùn)練,從而為其他多家企業(yè)提供訓(xùn)練好的模型,則其他多家企業(yè)會(huì)同時(shí)應(yīng)用這一模型實(shí)現(xiàn)其產(chǎn)品功能。也就是說(shuō),模型應(yīng)用再現(xiàn)的可能性比模型訓(xùn)練再現(xiàn)的可能性要高的多。因此,建議優(yōu)先考慮構(gòu)建模型應(yīng)用的權(quán)利要求,再考慮構(gòu)建模型訓(xùn)練的權(quán)利要求。
另外,還考慮到專利申請(qǐng)經(jīng)費(fèi)或者維權(quán)等各種問(wèn)題,在實(shí)際撰寫(xiě)過(guò)程中,也可以將模型訓(xùn)練過(guò)程作為模型應(yīng)用權(quán)項(xiàng)的從屬權(quán)項(xiàng)進(jìn)行部署。例如,權(quán)1是一種模型應(yīng)用方法,而權(quán)2引用權(quán)1,進(jìn)一步增加關(guān)于如何訓(xùn)練權(quán)1中的模型的方案。
?。?)、在實(shí)際操作中,也會(huì)遇到有些案件雖然提及到機(jī)器學(xué)習(xí)技術(shù),但其僅是利用了已有的模型進(jìn)行相應(yīng)處理,對(duì)模型訓(xùn)練以及模型應(yīng)用均為作改進(jìn),因此,針對(duì)這種類型的案件,在撰寫(xiě)時(shí),可以不寫(xiě)模型的訓(xùn)練,也無(wú)需關(guān)注模型的具體網(wǎng)絡(luò)結(jié)構(gòu),可以把模型當(dāng)作能夠?qū)崿F(xiàn)特定數(shù)據(jù)處理的,具有一定輸入輸出映射功能的黑盒處理即可,無(wú)需浪費(fèi)過(guò)多筆墨,而把重點(diǎn)放在方案的實(shí)際改進(jìn)點(diǎn)。
?。?)、在實(shí)際操作中,考慮到機(jī)器學(xué)習(xí)技術(shù)本身技術(shù)復(fù)雜性較高,為了提高專利申請(qǐng)文件的可讀性,可以針對(duì)方案本身的技術(shù)特點(diǎn)在說(shuō)明書(shū)布局以及說(shuō)明書(shū)附圖特殊處理,例如,針對(duì)模型訓(xùn)練和模型應(yīng)用具有改進(jìn)的方案,雖然在權(quán)利要求中先部署的模型應(yīng)用后部署的模型訓(xùn)練,但在說(shuō)明書(shū)中可以先部署模型訓(xùn)練的相關(guān)實(shí)施例,再部署模型應(yīng)用的相關(guān)實(shí)施例,以方便企業(yè)審核人、審查員、法官等在處理案件時(shí)更容易理解方案的實(shí)現(xiàn)。
另外,在針對(duì)模型網(wǎng)絡(luò)結(jié)構(gòu)本身有改進(jìn)的方案,由于模型的網(wǎng)絡(luò)結(jié)構(gòu)的改進(jìn)本質(zhì)上是對(duì)數(shù)據(jù)處理邏輯的改進(jìn),而數(shù)據(jù)處理邏輯從數(shù)據(jù)層面來(lái)講,往往是網(wǎng)絡(luò)參數(shù)矩陣以及其含義的變化,這種變化是很難通過(guò)簡(jiǎn)單的繪圖來(lái)表征,對(duì)此,可以將模型內(nèi)部網(wǎng)絡(luò)結(jié)構(gòu)功能模塊化,根據(jù)其對(duì)數(shù)據(jù)處理邏輯,確定每個(gè)模塊的輸入輸出,進(jìn)而通過(guò)級(jí)聯(lián)式方式繪制出由具有特定功能的模塊所組成的模型,尤其是在繪圖中,可以有效結(jié)合實(shí)際研發(fā)過(guò)程中的中間結(jié)果圖以及實(shí)際應(yīng)用中產(chǎn)生的效果圖,例如,模型用于對(duì)圖像進(jìn)行處理所產(chǎn)生的效果圖,這樣,能夠通過(guò)圖文結(jié)合的方式更清楚地表征方案的核心改進(jìn)點(diǎn)和有益效果,也能夠方便企業(yè)審核人、審查員、法官等在處理案件時(shí)更容易理解方案的具體情況。
以上主要是筆者根據(jù)個(gè)人經(jīng)驗(yàn),說(shuō)明了撰寫(xiě)涉及機(jī)器學(xué)習(xí)技術(shù)的專利申請(qǐng)文件時(shí)需要考慮的幾點(diǎn)因素,當(dāng)然,在撰寫(xiě)專利申請(qǐng)文件時(shí)也需要兼顧考慮其他因素。由于,機(jī)器學(xué)習(xí)本身涉及的知識(shí)非常廣闊,該技術(shù)還在不斷的發(fā)展更新中,筆者也僅能夠了解其中一角,如有紕漏之處還請(qǐng)批評(píng)指正。