Ji bo ku di modela meya fêrbûna makîneyê de rastbûna bilindtir bi dest bixin, çend hîperparametre hene ku em dikarin bi wan re ceribandinê bikin. Hîperparametre pîvanên verastkirî ne ku berî destpêkirina pêvajoya fêrbûnê têne danîn. Ew tevgera algorîtmaya fêrbûnê kontrol dikin û bandorek girîng li ser performansa modelê dikin.
Yek hyperparameterek girîng a ku divê were hesibandin rêjeya fêrbûnê ye. Rêjeya fêrbûnê di her dubarekirina algorîtmaya fêrbûnê de mezinahiya gavê diyar dike. Rêjeyek fêrbûnê ya bilind dihêle ku model zûtir fêr bibe lê dibe ku bibe sedema derbaskirina çareseriya çêtirîn. Ji hêla din ve, rêjeyek fêrbûnê ya hindik dibe ku bibe sedema lihevhatina hêdî lê dikare bibe alîkar ku model ji zêdebûnê dûr bixe. Pir girîng e ku meriv rêjeyek fêrbûnê ya çêtirîn bibîne ku danûstandina di navbera leza hevgirtinê û rastbûnê de hevseng dike.
Hîperparameterek din a ku meriv pê biceribîne mezinahiya heviyê ye. Mezinahiya hevîrê hejmara mînakên perwerdehiyê yên ku di her dubarekirina algorîtmaya fêrbûnê de têne hilberandin diyar dike. Pîvanek piçûktir dikare texmînek rasttir a gradientê peyda bike lê dibe ku bibe sedema lihevhatina hêdî. Berevajî vê, mezinahiyek mezin dikare pêvajoya fêrbûnê bileztir bike lê dibe ku deng di texmîna gradientê de bike. Dîtina mezinahiya komê ya rast bi mezinahiya databasê û çavkaniyên hesabker ên berdest ve girêdayî ye.
Hejmara yekîneyên veşartî di tora neuralî de hîperparameterek din e ku meriv dikare were guheztin. Zêdekirina hejmara yekîneyên veşartî dikare kapasîteya modelê ya fêrbûna qalibên tevlihev zêde bike lê heke bi rêkûpêk neyê rêkûpêkkirin dibe ku bibe sedema zêdeperedanê jî. Berevajî vê, kêmkirina hejmara yekîneyên veşartî dibe ku modelê hêsan bike, lê dibe ku bibe sedema kêmbûnê. Girîng e ku meriv hevsengiyek di navbera tevliheviya modelê û şiyana giştîkirinê de çêbike.
Birêkûpêkkirin teknîkek din e ku dikare bi hîperparametran ve were kontrol kirin. Birêkûpêkkirin bi lêzêdekirina termek cezayê li fonksiyona windabûnê dibe alîkar pêşî li zêdebûnê bigire. Hêza rêkûpêkkirinê ji hêla hîperparametreyek ku jê re pîvana rêkûpêkkirinê tê gotin tê kontrol kirin. Parametreyek rêkûpêkkirina bilindtir dê bibe modelek hêsan a ku kêm zêde guncan e lê di heman demê de dibe ku bibe sedema kêmbûnê. Berevajî vê, pîvanek rêkûpêkkirina jêrîn dihêle ku modela daneyên perwerdehiyê ji nêz ve zêde bike lê dibe ku bibe sedema zêdebûnê. Ji bo dîtina pîvanek rêkûpêkkirina çêtirîn dikare were bikar anîn.
Hilbijartina algorîtmaya optimîzasyonê jî hîperparameterek girîng e. Daxistina gradient algorîtmayek optimîzasyonê ya bi gelemperî tê bikar anîn, lê cûrbecûr wekî daketina gradient a stokastîk (SGD), Adam, û RMSprop hene. Her algorîtmayek hîperparametreyên xwe hene ku meriv dikare were guheztin, wek mînak û kêmbûna rêjeya fêrbûnê. Ceribandina bi algorîtmayên optimîzasyonê yên cihêreng û hîperparametrên wan re dikare bibe alîkar ku performansa modelê baştir bike.
Ji bilî van hîperparametran, faktorên din ên ku dikarin werin vekolîn jî mîmariya torê, fonksiyonên çalakkirinê yên ku têne bikar anîn, û destpêkirina pîvanên modelê hene. Mîmarên cihêreng, wekî torên neuralî yên konvolutional (CNN) an torên neuralî yên dubare (RNN), dibe ku ji bo karên taybetî maqûltir bin. Hilbijartina fonksiyonên çalakkirinê yên guncan, wek ReLU an sigmoid, dikare bandorê li performansa modelê jî bike. Destpêkkirina rast a parametreyên modelê dikare bibe alîkar ku algorîtmaya fêrbûnê zûtir li hev bicive û rastbûna çêtir bi dest bixe.
Di modela meya fêrbûna makîneyê de gihîştina rastbûna bilindtir ceribandina bi hîperparametreyên cihêreng pêk tîne. Rêjeya fêrbûnê, mezinahiya hevîrê, hejmara yekîneyên veşartî, pîvana rêkûpêkkirinê, algorîtmaya xweşbîniyê, mîmariya torê, fonksiyonên aktîfkirinê, û destpêkirina parametreyê hemî hîperparametre ne ku dikarin werin sererast kirin da ku performansa modelê baştir bikin. Girîng e ku meriv van hîperparametran bi baldarî hilbijêrin û sererast bikin da ku hevsengiyek di navbera leza hevgirtinê û rastbûnê de çêbike, û her weha pêşî li zêdebûn an kêmbûnek bigire.
Pirs û bersivên din ên vê dawiyê di derbarê EITC/AI/GCML Fêrbûna Makîna Ewr a Google:
- Nivîsar bi axaftinê (TTS) çi ye û ew çawa bi AI-ê re dixebite?
- Di fêrbûna makîneyê de di xebata bi daneyên mezin de çi sînor hene?
- Ma fêrbûna makîneyê dikare hin arîkariya diyalogê bike?
- Qada lîstikê ya TensorFlow çi ye?
- Di rastiyê de danûstendinek mezintir tê çi wateyê?
- Hin mînakên hîperparametreyên algorîtmê çi ne?
- Fêrbûna ensambleyê çi ye?
- Ger algorîtmayek fêrbûna makîneya bijartî ne guncan be û meriv çawa dikare piştrast bike ku ya rast hilbijêrin?
- Ma modelek fêrbûna makîneyê di dema perwerdehiya xwe de hewceyê çavdêriyê ye?
- Parametreyên sereke yên ku di algorîtmayên bingeha tora neuralî de têne bikar anîn çi ne?
Pirs û bersivan bêtir li EITC/AI/GCML Fêrbûna Makîneya Cloud Google-ê bibînin