Amadekirina daneyên perwerdehiyê ji bo Tora Neuralî ya Convolutional (CNN) çend gavên girîng digire da ku performansa modela çêtirîn û pêşbîniyên rast peyda bike. Ev pêvajo pir girîng e ji ber ku kalîte û hêjmara daneyên perwerdehiyê pir bandor li şiyana CNN-ê ya fêrbûn û gelemperîkirina qalibên bi bandor dike. Di vê bersivê de, em ê gavên ku di amadekirina daneyên perwerdehiyê de ji bo CNN ve girêdayî ne lêkolîn bikin.
1. Berhevkirina Daneyê:
Di amadekirina daneyên perwerdehiyê de gava yekem komkirina danehevek cihêreng û nûner e. Ev berhevkirina wêneyan an daneyên din ên têkildar ên ku tevahiya rêza çîn an kategoriyên ku CNN dê li ser bêne perwerde kirin vedihewîne. Girîng e ku meriv pê ewle bibe ku danehev hevseng e, tê vê wateyê ku her pola xwedan hejmarek nimûneyên wekhev e, da ku pêşî li beralîbûna li hember çînek taybetî bigire.
2. Pêşîsazkirina daneyan:
Dema ku databas were berhev kirin, pêdivî ye ku meriv berê daneyê were hilanîn da ku wê standard bike û normal bike. Vê gavê ji bo rakirina her nakokî an cûdahiyên di daneyan de dibe alîkar ku dikare pêvajoya fêrbûna CNN-ê asteng bike. Teknolojiyên pêş-pêvajoyê yên hevpar veguheztina wêneyan bi mezinahiyek domdar, veguhertina wêneyan li cîhek rengînek hevpar (mînak, RGB), û normalîzekirina nirxên pixelê di nav rêzek diyar de (mînak, [0, 1]) vedihewîne.
3. Zêdekirina daneyan:
Zêdekirina daneyan teknîkek e ku ji bo zêdekirina bi sûnî mezinahiya databasa perwerdehiyê bi sepandina veguherînên cihêreng li daneyên heyî tê bikar anîn. Ev gav ji bo danasîna guhertoyên din û kêmkirina zêdeperedanê dibe alîkar. Nimûneyên teknîkên zêdekirina daneyan zivirandinên bêserûber, werger, felqkirin, zoom, û guhertinên di ronahiyê an berevajî de hene. Bi sepandina van veguherînan, em dikarin nimûneyên perwerdehiyê yên nû ku hinekî ji yên orîjînal cûda ne biafirînin, bi vî rengî cihêrengiya databasê zêde bikin.
4. Dabeşkirina daneyan:
Ji bo nirxandina performansa CNN a perwerdekirî û pêşîlêgirtina zêde guncan, pêdivî ye ku databas li sê beşan were veqetandin: koma perwerdehiyê, koma pejirandinê, û koma ceribandinê. Koma perwerdehiyê ji bo perwerdekirina CNN-ê tê bikar anîn, koma erêkirinê ji bo birêkûpêkkirina hîperparametran û şopandina performansa modelê di dema perwerdehiyê de tê bikar anîn, û koma testê ji bo nirxandina performansa dawî ya CNN-a perwerdekirî tê bikar anîn. Rêjeya dabeşkirina pêşniyarkirî bi gelemperî ji bo perwerdehiyê 70-80%, ji bo pejirandinê 10-15% û ji bo ceribandinê 10-15% e.
5. Barkirina daneyan:
Piştî ku databas tê dabeş kirin, pêdivî ye ku daneyên bi bandor li bîranînê were barkirin. Vê gavê hilberkerên daneyê an jeneratoran diafirîne ku dikarin daneyan bi koman bi bandor barkirin û pêşdebirinê bikin. Barkirina hevîrê destûrê dide pêvajoyek paralel, ku pêvajoya perwerdehiyê bilez dike û hewcedariyên bîranînê kêm dike. Digel vê yekê, barkerên daneyê dikarin gavên pêşdibistanê yên din bicîh bînin, wek hejandina daneyan, da ku piştrast bikin ku CNN di her dubarekirina perwerdehiyê de ji cûrbecûr nimûneyan fêr dibe.
6. Hevsengkirina daneyan (Bijarte):
Di hin rewşan de, dibe ku databas bêhevseng be, tê vê wateyê ku hin çîn li gorî yên din nimûneyên girîng kêm in. Ev dikare bibe sedema pêşbîniyên alîgir, li cihê ku CNN mêldarê çîna piraniyê ye. Ji bo çareserkirina vê pirsgirêkê, teknîkên wekî nimûne zêdekirina çîna hindikahiyê an kêmkirina çîna piraniyê dikare were bikar anîn da ku hevsengiya danûstendinê. Nêzîktêdayînek din ev e ku meriv di dema perwerdehiyê de giraniyên polê bikar bîne, bêtir girîngiyê dide dersên ku kêm têne temsîl kirin.
7. Normalkirina daneyan:
Normalîzasyon gavek krîtîk e ji bo ku pê ewle bibe ku daneya têketinê xwedî navgîn û cûdabûna yekîneyê ye. Ev pêvajo dibe alîkar ku pêvajoya perwerdehiyê aram bike û pêşî li girtina CNN di hindiktirînên herêmî de bigire. Teknolojiyên normalîzekirinê yên hevpar jêbirina navgîniyê û dabeşkirina bi veguheztina standard a danûstendinê an pîvandina daneyan li rêzek taybetî vedihewîne (mînak, [-1, 1]). Pêdivî ye ku normalîzekirin hem li ser daneya perwerdehiyê û hem jî ji bo ceribandinê bi domdarî were sepandin da ku pê ewle bibe ku ketin di heman rêzê de ne.
Amadekirina daneyên perwerdehiyê ji bo CNN-ê berhevkirina daneyan, pêşdibistanê, zêdekirin, dabeşkirin, barkirin, û vebijarkî hevsengkirin û normalîzekirinê pêk tîne. Her gav di pêbaweriya ku CNN dikare bi bandor ji daneyan fêr bibe û pêşbîniyên rast bike rolek girîng dilîze. Bi şopandina van gavan, em dikarin ji bo perwerdekirina CNN boriyek perwerdehiyê ya bihêz saz bikin.
Pirs û bersivên din ên vê dawiyê di derbarê Torgiloka neural a konvolution (CNN):
- Tora neuralî ya herî mezin a konvolutional ku hatî çêkirin çi ye?
- Kanalên derketinê çi ne?
- Wateya hejmara Kanalên têketinê (Parametra 1emîn a nn.Conv2d) çi ye?
- Hin teknîkên hevpar ên ji bo baştirkirina performansa CNN-ê di dema perwerdehiyê de çi ne?
- Di perwerdehiya CNN de girîngiya mezinahiya komê çi ye? Ew çawa bandorê li pêvajoya perwerdehiyê dike?
- Çima girîng e ku daneyan li komên perwerdehî û pejirandinê veqetînin? Çiqas dane bi gelemperî ji bo pejirandinê têne veqetandin?
- Armanca optimîzator û fonksiyona windakirinê di perwerdekirina tora neuralî ya pevgirêdayî (CNN) de çi ye?
- Çima girîng e ku meriv di qonaxên cihêreng de di dema perwerdekirina CNN de şeklê daneya têketinê bişopîne?
- Ma qatên konvolutional ji bilî wêneyan ji bo daneyan têne bikar anîn? Mînakekê bidin.
- Meriv çawa dikare mezinahiya guncan ji bo qatên xêzkirî di CNN de diyar bike?
Di tora neuralî ya Convolution (CNN) de bêtir pirs û bersivan bibînin