涉及機(jī)器學(xué)習(xí)技術(shù)的專利申請文件的撰寫策略

2018-07-13

　　文/集佳知識產(chǎn)權(quán)代理有限公司朱靜

　　機(jī)器學(xué)習(xí)（Machine Learning, ML）是一門多領(lǐng)域交叉學(xué)科，涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度等多門學(xué)科，專門研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為，以獲取新的知識或者技能，重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。簡單的講，機(jī)器學(xué)習(xí)是一門人工智能的學(xué)科，其主要研究對象是人工智能，特別是如何在經(jīng)驗(yàn)學(xué)習(xí)中改善具體算法的性能。
　　目前，機(jī)器學(xué)習(xí)已經(jīng)在眾多領(lǐng)域得到應(yīng)用，例如數(shù)據(jù)挖掘、計(jì)算機(jī)視覺、自然語言處理、生物特征識別、搜索引擎、證券市場分析、DNA序列預(yù)測以及機(jī)器人運(yùn)用。隨著機(jī)器學(xué)習(xí)在各個(gè)領(lǐng)域的快速發(fā)展，眾多企業(yè)逐漸投入研發(fā)機(jī)器學(xué)習(xí)技術(shù)，從而使得幾年來涉及機(jī)器學(xué)習(xí)技術(shù)的專利越來越多，于此同時(shí)，企業(yè)對機(jī)器學(xué)習(xí)的專利申請需求也越來越多，因此，如何撰寫機(jī)器學(xué)習(xí)技術(shù)的專利是目前專利從業(yè)人員所關(guān)注的重點(diǎn)之一?；诖?，筆者根據(jù)撰寫經(jīng)驗(yàn)談一談涉及機(jī)器學(xué)習(xí)技術(shù)的專利申請文件的撰寫策略。
　　機(jī)器學(xué)習(xí)在技術(shù)實(shí)現(xiàn)時(shí)，大致分為模型訓(xùn)練階段和模型應(yīng)用階段，所謂模型訓(xùn)練階段是指利用機(jī)器學(xué)習(xí)算法對樣本數(shù)據(jù)進(jìn)行學(xué)習(xí)以訓(xùn)練模型的階段，所謂模型應(yīng)用階段是指利用訓(xùn)練好的模型對新數(shù)據(jù)進(jìn)行預(yù)測的階段。而在實(shí)際技術(shù)研發(fā)過程中，有時(shí)會針對模型訓(xùn)練階段產(chǎn)生相關(guān)專利，而有時(shí)會針對模型應(yīng)用階段產(chǎn)生相關(guān)專利，當(dāng)然，大部分時(shí)候是在兩個(gè)階段都有相關(guān)的改進(jìn)點(diǎn)，即同時(shí)產(chǎn)生相關(guān)專利。
　　基于機(jī)器學(xué)習(xí)技術(shù)本身的特點(diǎn)，筆者根據(jù)自身撰寫經(jīng)驗(yàn)總結(jié)出以下撰寫策略：
　?。?）、在實(shí)際操作中，先根據(jù)交底書明確技術(shù)改進(jìn)點(diǎn)屬于哪個(gè)階段，方案僅涉及訓(xùn)練階段的改進(jìn)點(diǎn)，還是僅涉及到應(yīng)用階段的改進(jìn)點(diǎn)，還是兩者皆有。根據(jù)方案的改進(jìn)點(diǎn)所屬的具體階段部署對應(yīng)的權(quán)項(xiàng)。下面針對不同的情況分別進(jìn)行說明。
　　一種情況是，方案僅在模型訓(xùn)練階段存在改進(jìn)點(diǎn)，例如，在模型訓(xùn)練階段涉及到原始數(shù)據(jù)采集、樣本數(shù)據(jù)挖掘、特征提取、模型內(nèi)部結(jié)構(gòu)變化、模型參數(shù)更新算法以及模型組合訓(xùn)練等一個(gè)或者多個(gè)方面，方案若在這些方面作了改進(jìn)，針對這種情況，則僅部署模型的訓(xùn)練方法以及產(chǎn)品等相關(guān)權(quán)項(xiàng)。
　　另一種情況是，方案僅在模型應(yīng)用階段存在改進(jìn)點(diǎn)，例如，在模型應(yīng)用階段一般會涉及到數(shù)據(jù)采集、特征提取、模型內(nèi)部結(jié)構(gòu)變化、模型輸出結(jié)果應(yīng)用以及模型組合應(yīng)用等一個(gè)或者多個(gè)方面，方案若在這些方面作了改進(jìn)，則僅部署模型的應(yīng)用方法以及產(chǎn)品等相關(guān)權(quán)項(xiàng)。
　　還有一種情況是，方案既涉及模型訓(xùn)練階段又涉及模型應(yīng)用階段，例如：方案涉及到模型內(nèi)部結(jié)構(gòu)的改進(jìn)，則既需要部署模型訓(xùn)練的方法還需要部署模型應(yīng)用的方法以及相關(guān)產(chǎn)品等權(quán)項(xiàng)。
　　（2）、在確定應(yīng)部署的權(quán)項(xiàng)主題之后，再確定具體改進(jìn)點(diǎn)所屬的特定環(huán)節(jié)，根據(jù)特定環(huán)節(jié)定位出合理的權(quán)項(xiàng)范圍，而無需站在模型訓(xùn)練過程或者模型應(yīng)用過程的全局角度進(jìn)行定位，以避免喪失權(quán)利。下面進(jìn)行舉例說明。
　　一種情況是，有些方案僅僅涉及訓(xùn)練階段的某一個(gè)獨(dú)立環(huán)節(jié)的改進(jìn)，則可以將方案定位到具體的獨(dú)立環(huán)節(jié)，而無需站在整個(gè)訓(xùn)練過程進(jìn)行全局定位，這樣能夠確定出合理的權(quán)項(xiàng)范圍。
　　例如：有些方案僅涉及模型訓(xùn)練階段中樣本數(shù)據(jù)采集方面的改進(jìn)，則可以將權(quán)項(xiàng)范圍定位在樣本數(shù)據(jù)采集的范圍即可，具體在撰寫時(shí)，方法權(quán)要的步驟描述出如何采集樣本數(shù)據(jù)以完整表征改進(jìn)點(diǎn)即可，可以跳出交底書中限定的特定模型下的訓(xùn)練場景，基于此，也可以對方案進(jìn)行場景性擴(kuò)展，以及訓(xùn)練過程中其他環(huán)節(jié)的擴(kuò)展。但在從權(quán)中可以通過名詞限定或者增加方法步驟的方式進(jìn)一步地保護(hù)樣本數(shù)據(jù)應(yīng)用于具體模型訓(xùn)練的方案，以保證交底書中提供的最佳場景應(yīng)用的方案。例如，在從權(quán)中采用功能性限定，如所述樣本數(shù)據(jù)用于某某模型訓(xùn)練，或者利用所述樣本數(shù)據(jù)對某某模型進(jìn)行訓(xùn)練。
　　另一種情況是，有些方案僅僅涉及訓(xùn)練階段中損失函數(shù)部分的改進(jìn)，而此部分也無法作為獨(dú)立的方案，基于此，可以根據(jù)該改進(jìn)點(diǎn)所處的具體環(huán)節(jié)，或者與其直接相關(guān)的環(huán)節(jié)，確定權(quán)項(xiàng)合理的范圍；在機(jī)器學(xué)習(xí)中損失函數(shù)部分會涉及構(gòu)建目標(biāo)函數(shù)以及利用目標(biāo)函數(shù)進(jìn)行模型參數(shù)優(yōu)化環(huán)節(jié)，基于此，可以將權(quán)項(xiàng)范圍定位到這兩個(gè)環(huán)節(jié)相結(jié)合所組成的范圍，而無需站在訓(xùn)練過程全局角度進(jìn)行定位，也不能定位到函數(shù)本身的范圍，即不能盲目縮小范圍至喪失技術(shù)方案本身所需的素材導(dǎo)致不屬于保護(hù)客體，也不能局限于整個(gè)實(shí)際方案實(shí)現(xiàn)的場景，這樣才能夠確定出合理的權(quán)項(xiàng)范圍。
　　（3）、在實(shí)際操作中，大部分涉及機(jī)器學(xué)習(xí)技術(shù)的方案會同時(shí)涉及到模型訓(xùn)練以及模型應(yīng)用兩個(gè)階段的改進(jìn)，針對此情況，考慮到實(shí)際維權(quán)階段的相關(guān)問題，建議先從模型應(yīng)用角度部署相關(guān)權(quán)項(xiàng)，再從模型訓(xùn)練角度部署相關(guān)權(quán)項(xiàng)。這主要是因?yàn)椋环矫婺Ｐ蛻?yīng)用相比模型訓(xùn)練更容易取證，由于模型訓(xùn)練一般僅在后臺完成，而模型應(yīng)用則有可能由前臺完成，供用戶使用。因此，模型應(yīng)用相比模型訓(xùn)練更容易取證。另一方面，模型應(yīng)用的市場價(jià)值也遠(yuǎn)遠(yuǎn)大于模型訓(xùn)練的市場價(jià)值，例如，有時(shí)模型訓(xùn)練可能一次性完成，而一旦模型在訓(xùn)練好之后是會被重復(fù)應(yīng)用，而且很容易被移植應(yīng)用；在實(shí)際應(yīng)用中，有的企業(yè)主要負(fù)責(zé)模型算法研究進(jìn)行模型訓(xùn)練，從而為其他多家企業(yè)提供訓(xùn)練好的模型，則其他多家企業(yè)會同時(shí)應(yīng)用這一模型實(shí)現(xiàn)其產(chǎn)品功能。也就是說，模型應(yīng)用再現(xiàn)的可能性比模型訓(xùn)練再現(xiàn)的可能性要高的多。因此，建議優(yōu)先考慮構(gòu)建模型應(yīng)用的權(quán)利要求，再考慮構(gòu)建模型訓(xùn)練的權(quán)利要求。
　　另外，還考慮到專利申請經(jīng)費(fèi)或者維權(quán)等各種問題，在實(shí)際撰寫過程中，也可以將模型訓(xùn)練過程作為模型應(yīng)用權(quán)項(xiàng)的從屬權(quán)項(xiàng)進(jìn)行部署。例如，權(quán)1是一種模型應(yīng)用方法，而權(quán)2引用權(quán)1，進(jìn)一步增加關(guān)于如何訓(xùn)練權(quán)1中的模型的方案。
　?。?）、在實(shí)際操作中，也會遇到有些案件雖然提及到機(jī)器學(xué)習(xí)技術(shù)，但其僅是利用了已有的模型進(jìn)行相應(yīng)處理，對模型訓(xùn)練以及模型應(yīng)用均為作改進(jìn)，因此，針對這種類型的案件，在撰寫時(shí)，可以不寫模型的訓(xùn)練，也無需關(guān)注模型的具體網(wǎng)絡(luò)結(jié)構(gòu)，可以把模型當(dāng)作能夠?qū)崿F(xiàn)特定數(shù)據(jù)處理的，具有一定輸入輸出映射功能的黑盒處理即可，無需浪費(fèi)過多筆墨，而把重點(diǎn)放在方案的實(shí)際改進(jìn)點(diǎn)。
　?。?）、在實(shí)際操作中，考慮到機(jī)器學(xué)習(xí)技術(shù)本身技術(shù)復(fù)雜性較高，為了提高專利申請文件的可讀性，可以針對方案本身的技術(shù)特點(diǎn)在說明書布局以及說明書附圖特殊處理，例如，針對模型訓(xùn)練和模型應(yīng)用具有改進(jìn)的方案，雖然在權(quán)利要求中先部署的模型應(yīng)用后部署的模型訓(xùn)練，但在說明書中可以先部署模型訓(xùn)練的相關(guān)實(shí)施例，再部署模型應(yīng)用的相關(guān)實(shí)施例，以方便企業(yè)審核人、審查員、法官等在處理案件時(shí)更容易理解方案的實(shí)現(xiàn)。
　　另外，在針對模型網(wǎng)絡(luò)結(jié)構(gòu)本身有改進(jìn)的方案，由于模型的網(wǎng)絡(luò)結(jié)構(gòu)的改進(jìn)本質(zhì)上是對數(shù)據(jù)處理邏輯的改進(jìn)，而數(shù)據(jù)處理邏輯從數(shù)據(jù)層面來講，往往是網(wǎng)絡(luò)參數(shù)矩陣以及其含義的變化，這種變化是很難通過簡單的繪圖來表征，對此，可以將模型內(nèi)部網(wǎng)絡(luò)結(jié)構(gòu)功能模塊化，根據(jù)其對數(shù)據(jù)處理邏輯，確定每個(gè)模塊的輸入輸出，進(jìn)而通過級聯(lián)式方式繪制出由具有特定功能的模塊所組成的模型，尤其是在繪圖中，可以有效結(jié)合實(shí)際研發(fā)過程中的中間結(jié)果圖以及實(shí)際應(yīng)用中產(chǎn)生的效果圖，例如，模型用于對圖像進(jìn)行處理所產(chǎn)生的效果圖，這樣，能夠通過圖文結(jié)合的方式更清楚地表征方案的核心改進(jìn)點(diǎn)和有益效果，也能夠方便企業(yè)審核人、審查員、法官等在處理案件時(shí)更容易理解方案的具體情況。
　　以上主要是筆者根據(jù)個(gè)人經(jīng)驗(yàn)，說明了撰寫涉及機(jī)器學(xué)習(xí)技術(shù)的專利申請文件時(shí)需要考慮的幾點(diǎn)因素，當(dāng)然，在撰寫專利申請文件時(shí)也需要兼顧考慮其他因素。由于，機(jī)器學(xué)習(xí)本身涉及的知識非常廣闊，該技術(shù)還在不斷的發(fā)展更新中，筆者也僅能夠了解其中一角，如有紕漏之處還請批評指正。
此篇文章由北京集佳知識產(chǎn)權(quán)代理有限公司版權(quán)所有,轉(zhuǎn)載請注明出處

涉及機(jī)器學(xué)習(xí)技術(shù)的專利申請文件的撰寫策略

相關(guān)關(guān)鍵詞

公司總部

郵件新聞接收

社交網(wǎng)絡(luò)鏈入

友情鏈接