Di warê fêrbûna makîneyê de, nemaze dema ku platformên wekî Google Cloud Machine Learning bikar tînin, têgihîştina hîperparametran ji bo pêşkeftin û xweşbînkirina modelan girîng e. Hîperparametre mîheng an vesazkirinên derveyî yên modelê ne ku pêvajoya fêrbûnê destnîşan dikin û bandorê li performansa algorîtmayên fêrbûna makîneyê dikin. Berevajî pîvanên modelê, yên ku di pêvajoya perwerdehiyê de ji daneyan têne fêr kirin, hîperparametre beriya destpêkirina perwerdehiyê têne danîn û li seranserê domdar dimînin.
Hîperparametre li ser bingeha rol û fonksiyona wan di xeta fêrbûna makîneyê de bi berfirehî li çend celeban têne categorîze kirin. Van kategoriyan hîperparametreyên modelê, hîperparametreyên optimîzasyonê, û hîperparametreyên hilberandina daneyê vedigirin. Her celeb di şekildana çawaniya modelek ji daneyan fêr dibe û bi daneyên nû, nedîtî re giştî dike, rolek cûda dilîze.
Model Hyperparameters
1. Architecture Hyperparameters: Ev strukturên modelê diyar dikin. Mînakî, di torên neuralî de, hîperparametreyên mîmarî hejmara qatan, hejmara girêkên her qatê, û celebê fonksiyonên çalakkirinê yên ku têne bikar anîn vedihewîne. Mînakî, torgilokek neuralî ya kûr dibe ku hîperparametreyên ku sê qatên veşartî bi rêzê ve bi 128, 64, û 32 girêkan diyar dikin, û ReLU (Yekîneya Rêzika Rastkirî) wekî fonksiyona çalakkirinê diyar dike.
2. Hîperparametreyên birêkûpêkkirinê: Teknîkên birêkûpêkkirinê têne bikar anîn da ku pêşî li zêdebûnê bigirin, ku ev yek çêdibe dema ku modelek di daneya perwerdehiyê de dengek fêr dibe ne ji şêwaza bingehîn. Hîperparametreyên rêkûpêkkirinê yên hevpar hevrêzên rêkûpêkkirina L1 û L2 hene. Van hevkêşan cezayê ku di modelê de li ser giraniyên mezin têne sepandin kontrol dikin. Mînakî, danîna hevrêzek birêkûpêkkirina L2 ya bilind dê giraniyên mezin bêtir ceza bike, bi vî rengî modelê teşwîq dike ku giraniyên piçûktir biparêze û bi potansiyel gelemperîkirinê baştir bike.
3. Rêjeya Dropout: Di torên neuralî de, dev jê berdan teknîkek rêkûpêkkirinê ye ku di dema perwerdehiyê de noyronên ku bi rasthatinî hatine hilbijartin têne paşguh kirin. Rêjeya avêtinê hîperparameterek e ku perçeya neuronên ku di her dubarekirina perwerdehiyê de dakevin diyar dike. Rêjeya avêtinê ya 0.5 tê vê wateyê ku 50% ji neuronan di her dubarekirinê de bi rengek bêserûber têne avêtin, ku di kêmkirina zêdeperdebûnê de dibe alîkar.
Hîperparametreyên Optimîzasyonê
1. Rêjeya Fêrbûnê: Dibe ku ev yek ji hîperparametreyên herî krîtîk di perwerdekirina torên neuralî de ye. Rêjeya fêrbûnê mezinahiya gavên ku ber bi kêmbûna fonksiyona windabûnê ve têne avêtin diyar dike. Rêjeyek fêrbûnê ya bilind dibe sedem ku model pir zû bigihîje çareseriyek nebaş, dema ku rêjeyek fêrbûnê ya kêm dibe ku pêvajoya perwerdehiyê pir hêdî bike an di hindiktirînên herêmî de asê bibe.
2. Mezinahiya Batch: Ev hîperparameter hejmara nimûneyên perwerdehiyê yên ku di yek dubarekirina pêvajoya perwerdehiyê de têne bikar anîn diyar dike. Mezinahiyên piçûktir dikarin bibin sedema texmînek rasttir a gradientê lê dikare dema ku ji bo temamkirina serdemekê hewce dike zêde bike. Berevajî vê, mezinahiyên mezin dikarin perwerdehiyê bilezînin lê dibe ku bibe sedema modelên kêmtir rast.
3. momentum: Di algorîtmayên optimîzasyonê yên wekî Stochastic Gradient Descent bi leza tê bikar anîn, ev hîperparameter arîkariya lezkirina vektorên gradientê di rêça rast de dike, bi vî rengî rê lihevhatina zûtir vedike. Ew di rêça xweşbîniyê de di sivikkirina lehiyan de dibe alîkar.
4. Hejmara Serdeman: Ev hîperparametre hejmara derbasbûnên tam di nav databasa perwerdehiyê de diyar dike. Hejmarek zedetir ji serdeman bi gelemperî dihêle ku modela bêtir fersendê ji daneyan fêr bibe, lê ew di heman demê de dikare xetera zêdebûnê jî zêde bike.
Hîperparametreyên Pêvajoya Daneyê
1. Pîvana Taybetmendiyê: Berî ku modelek perwerde bikin, pêdivî ye ku taybetmendî pir caran bêne pîvan kirin. Hîperparametreyên ku bi pîvandina taybetmendiyê ve girêdayî ne, bijartina awayê pîvandinê, wek pîvandina Min-Max an Standardîzasyonê vedihewîne. Ev vebijark dikare bi girîngî bandorê li performansa modelê bike, nemaze ji bo algorîtmayên ku ji pîvandina taybetmendiyê re mîna Makîneyên Vektora Piştgiriyê û komkirina K-Means hesas in.
2. Parametreyên Zêdekirina Daneyên: Di peywirên hilberandina wêneyê de, zêdekirina daneyê tê bikar anîn da ku bi çêkirina guhertoyên guhêrbar ên wêneyan di databasê de bi awayekî sûnî mezinahiya daneya perwerdehiyê berfireh bike. Hîperparametreyên li vir cûreyên veguhertinên ku têne sepandin, wekî zivirandin, werger, rijandin, û zoomkirin, û îhtîmala ku her veguheztinê were sepandin vedihewîne.
3. Rêbazên Nimûnekirinê: Di rewşên ku dane bêhevseng in, teknîkên wekî zêdekirina çîna hindikahiyê an kêmkirina çîna piraniyê dikare were bikar anîn. Hîperparametreyên li vir rêjeya nimûneyên çîna hindikahî û piraniyê vedihewîne.
Tuning Hyperparameter
Pêvajoya bijartina hîperparametreyên herî baş wekî ahenga hîperparameterê tê zanîn. Ev pêngavek krîtîk e ji ber ku bijartina hîperparametreyan dikare bandorek girîng li performansa modelê bike. Rêbazên hevpar ên ji bo verastkirina hîperparameterê ev in:
1. Grid Search: Ev rêbaz tê de pênasekirina tora nirxên hîperparametre û bi tevahî ceribandina her berhevokê vedihewîne. Digel ku hêsan e, lêgerîna torê dikare ji hêla jimartinê ve biha be, nemaze bi hejmareke mezin a hîperparametreyan.
2. Lêgerîna Random: Li şûna ku hûn her kombînasyona gengaz biceribînin, lêgerîna rasthatî berhevokên hîperparametreyan hildibijêre. Ev nêzîkatî bi gelemperî ji lêgerîna torê bikêrtir e û dikare bibe sedema encamên çêtir, nemaze dema ku tenê çend hîperparametre bandorker in.
3. Optimîzasyona Bayesian: Ev nêzîkatiyek sofîstîketir e ku performansa hîperparameteran wekî fonksiyonek îhtîmalî model dike û bi hevsengkirina vekolîn û îstismarkirinê digere ku komek çêtirîn hîperparameteran bibîne.
4. Fêrbûna Makîneya Xweser (AutoML): Platformên mîna Google Cloud AutoML algorîtmayên pêşkeftî bikar tînin da ku bixweber li hîperparametreyên çêtirîn bigerin. Ev dikare dem û çavkaniyan xilas bike, nemaze ji bo bijîjkên ku dibe ku di fêrbûna makîneyê de ne xwediyê pisporiya kûr bin.
Nimûneyên Pratîk
Senaryoyek bihesibînin ku meriv bi karanîna Fêrbûna Makîneya Cloud Google-ê ji bo dabeşkirina wêneyê torgilokek neuralî ya hevgirtî (CNN) perwerde dike. Hîperparametre dikarin bibin:
- Hejmara qatên hevgirtî û mezinahiyên parzûna wan ên têkildar, ku hîperparametreyên mîmarî ne.
- Rêjeya fêrbûnê û mezinahiya komê, ku hîperparametreyên xweşbîniyê ne.
- Teknolojiyên zêdekirina daneyê yên wekî zivirandin û rijandin, ku hîperparametreyên hilberandina daneyê ne.
Bi birêkûpêk ahengkirina van hîperparametran, mirov dikare bi girîngî rastbûn û kapasîteyên giştîkirina modelê baştir bike.
Di mînakek din de, dema ku dabeşkerek dara biryarê bikar tîne, dibe ku hîperparametre kûrahiya herî zêde ya darê, hejmara hindiktirîn nimûneyên ku ji bo dabeşkirina girêkek hewce ne, û pîvana ku ji bo dabeşkirinê tê bikar anîn vehewîne. Her yek ji van hîperparametran dikare li ser tevliheviya modelê û kapasîteya wê ya giştîkirinê bandor bike.
Di eslê xwe de, hîperparametre ji bo pêvajoya fêrbûna makîneyê bingehîn in, hem bandor û hem jî bandorkeriya perwerdehiya modelê dike. Hilbijartin û ahenga wan a baldar dikare bibe sedema modelên ku ne tenê li ser daneyên perwerdehiyê baş tevdigerin lê di heman demê de bi bandor li daneyên nû, nedîtî jî gelemperî dikin.
Pirs û bersivên din ên vê dawiyê di derbarê EITC/AI/GCML Fêrbûna Makîna Ewr a Google:
- Pîvanên ji bo hilbijartina algorîtmaya rast ji bo pirsgirêkek diyarkirî çi ne?
- Ger yek modelek Google-ê bikar bîne û wê li ser mînaka xwe perwerde bike, gelo Google çêtirkirinên ku ji daneyên perwerdehiyê hatine çêkirin digire?
- Meriv çawa dizane ku kîjan modela ML-ê bikar bîne, berî ku wê perwerde bike?
- Karê regresyonê çi ye?
- Meriv çawa dikare di navbera tabloyên Vertex AI û AutoML de derbas bibe?
- Ma gengaz e ku meriv Kaggle bikar bîne da ku daneyên darayî bar bike û bi karanîna modelên ekonomometrik ên wekî R-squared, ARIMA an GARCH analîz û pêşbînkirina statîstîkî pêk bîne?
- Ma fêrbûna makîneyê dikare ji bo pêşbînkirina xetera nexweşiya dil a koroner were bikar anîn?
- Guhertinên rastîn ên ji ber veavakirina Fêrbûna Makîneya Google Cloud wekî Vertex AI çi ne?
- Metrîkên nirxandina performansê yên modelek çi ne?
- Regression linear çi ye?
Pirs û bersivan bêtir li EITC/AI/GCML Fêrbûna Makîneya Cloud Google-ê bibînin