Qada fêrbûna kûr, nemaze torên neuralî yên hevgirtî (CNN), di van salên dawî de bûye şahidê pêşkeftinên berbiçav, ku rê li ber pêşkeftina mîmariya tora neuralî ya mezin û tevlihev digire. Van torgilokan ji bo ku di naskirina wêneyê, pêvajokirina zimanê xwezayî, û qadên din de karên dijwar bi rê ve bibin hatine çêkirin. Dema ku nîqaşkirina tora neuralî ya herî mezin a pevgirêdayî hatî afirandin, pêdivî ye ku meriv aliyên cihêreng ên wekî hejmara qatan, parametre, hewcedariyên hesabkerî, û serîlêdana taybetî ya ku torgilok ji bo wê hatî sêwirandin were hesibandin.
Yek ji mînakên herî berbiçav ên torgilokek neuralî ya mezin modela VGG-16 e. Tora VGG-16, ku ji hêla Koma Visual Geometry li Zanîngeha Oxfordê ve hatî pêşve xistin, ji 16 qatên giraniyê pêk tê, di nav wan de 13 qatên konvolutional û 3 qatên bi tevahî girêdayî hene. Vê torgilokê ji ber sadebûn û bandoriya xwe di karên naskirina wêneyê de populerbûn bi dest xist. Modela VGG-16 bi qasî 138 mîlyon parametre hene, ku ew di dema pêşkeftina xwe de dike yek ji mezintirîn torên neuralî.
Tora neuralî ya konvolutional a din a girîng mîmariya ResNet (Tora Bermayî) ye. ResNet ji hêla Lêkolîna Microsoft-ê ve di sala 2015-an de hate destnîşan kirin û bi avahiya xwe ya kûr ve tê zanîn, digel hin guhertoyên ku zêdetirî 100 qat hene. Nûbûniya sereke di ResNet de karanîna blokên bermayî ye, ku rê dide perwerdekirina torên pir kûr bi çareserkirina pirsgirêka gradientê ya windabûyî. Mînakî, modela ResNet-152 ji 152 qatan pêk tê û dora 60 mîlyon parametreyên wê hene, ku mezinbûna torên neuralî yên kûr nîşan dide.
Di warê pêvajokirina zimanê xwezayî de, modela BERT (Nûnerên Encodera Dualî ji Transformers) wekî pêşkeftinek girîng derdikeve pêş. Dema ku BERT ne CNNek kevneşopî ye, ew modelek veguherîner-based e ku qada NLP şoreş kiriye. BERT-base, guhertoya piçûktir a modelê, 110 mîlyon parametre dihewîne, dema ku BERT-mezin 340 mîlyon parametre hene. Mezinahiya mezin a modelên BERT wan dihêle ku qalibên zimanî yên tevlihev bigrin û performansa herî pêşkeftî li ser karên cihêreng ên NLP bi dest bixin.
Wekî din, modela GPT-3 (Generative Pre-Trained Transformer 3) ku ji hêla OpenAI ve hatî pêşve xistin di fêrbûna kûr de qonaxek din nîşan dide. GPT-3 modelek zimanî ye ku bi 175 mîlyar parameteran ve ye, ku ew dike yek ji mezintirîn torên neuralî yên ku heya îro hatî afirandin. Vê pîvana girseyî dihêle ku GPT-3 nivîsarek mîna mirovan çêbike û cûrbecûr peywirên bi zimanî ve girêdayî bike, hêza modelên fêrbûna kûr a mezin nîşan bide.
Girîng e ku were zanîn ku mezinahî û tevliheviya torên neuralî yên pevgirêdayî her ku diçe zêde dibe dema ku lêkolîner mîmarî û metodolojiyên nû digerin da ku performansa li ser karên dijwar baştir bikin. Digel ku torên mezin bi gelemperî ji bo perwerdehî û encamdanê hewceyê çavkaniyên hesabker ên girîng in, wan di warên cihêreng de pêşkeftinên girîng nîşan dane, di nav de dîtina komputerê, pêvajokirina zimanê xwezayî, û fêrbûna xurtkirinê.
Pêşkeftina torên neuralî yên mezin ên konvolutional di warê fêrbûna kûr de meylek girîng temsîl dike, ku dihêle ku ji bo karên tevlihev modelên bihêztir û sofîstîke werin afirandin. Modelên mîna VGG-16, ResNet, BERT, û GPT-3 pîvandin û bandorkeriya torên neuralî di birêvebirina kêşeyên cihêreng de li deverên cihêreng nîşan didin.
Pirs û bersivên din ên vê dawiyê di derbarê Torgiloka neural a konvolution (CNN):
- Kanalên derketinê çi ne?
- Wateya hejmara Kanalên têketinê (Parametra 1emîn a nn.Conv2d) çi ye?
- Hin teknîkên hevpar ên ji bo baştirkirina performansa CNN-ê di dema perwerdehiyê de çi ne?
- Di perwerdehiya CNN de girîngiya mezinahiya komê çi ye? Ew çawa bandorê li pêvajoya perwerdehiyê dike?
- Çima girîng e ku daneyan li komên perwerdehî û pejirandinê veqetînin? Çiqas dane bi gelemperî ji bo pejirandinê têne veqetandin?
- Em çawa daneyên perwerdehiyê ji bo CNN amade dikin? Pêngavên tê de rave bikin.
- Armanca optimîzator û fonksiyona windakirinê di perwerdekirina tora neuralî ya pevgirêdayî (CNN) de çi ye?
- Çima girîng e ku meriv di qonaxên cihêreng de di dema perwerdekirina CNN de şeklê daneya têketinê bişopîne?
- Ma qatên konvolutional ji bilî wêneyan ji bo daneyan têne bikar anîn? Mînakekê bidin.
- Meriv çawa dikare mezinahiya guncan ji bo qatên xêzkirî di CNN de diyar bike?
Di tora neuralî ya Convolution (CNN) de bêtir pirs û bersivan bibînin