Birêkûpêkkirina modelek perwerdekirî di warê îstîxbarata hunerî de, bi taybetî di çarçoweya Fêrbûna Makîneya Cloud Google de, gavek girîng e. Ew bi mebesta adaptasyona modelek pêş-perwerdekirî ji karek an databasek taybetî re xizmet dike, bi vî rengî performansa wê zêde dike û wê ji bo serîlêdanên cîhana rastîn maqûltir dike. Ev pêvajo bi eyarkirina parametreyên modela pêş-perwerdekirî ve girêdayî ye ku bi daneyên nû re hevaheng bike, ku dihêle ew çêtir fêr bibe û giştî bike.
Motivasyona bingehîn a li pişt rastkirina modelek perwerdekirî di vê rastiyê de ye ku modelên pêş-perwerdekirî bi gelemperî li ser danehevên mezin ên bi dabeşên daneya cihêreng têne perwerde kirin. Van modelan berê xwedan taybetmendî û şêwazên tevlihev ji van danehevan fêr bûne, ku dikarin ji bo cûrbecûr peywiran werin bikar anîn. Bi birêkûpêkkirina modelek pêş-perwerdekirî, em dikarin zanyarî û têgihîştina ku ji perwerdehiya berê bi dest ketine bi kar bînin, çavkaniyên hesabkerî û wextê girîng ên ku ji bo perwerdekirina modelek ji sifirê hewce bibûya xilas bikin.
Rêzkirin bi cemidandina qatên jêrîn ên modela pêş-perwerdekirî dest pê dike, yên ku berpirsiyar in ji girtina taybetmendiyên nizm ên wekî qerax an tevnek. Van qatan di nav karan de gelemperîtir û veguhêztir têne hesibandin. Bi cemidandina wan re, em piştrast dikin ku taybetmendiyên fêrbûyî di dema pêvajoyek birêkûpêk de têne parastin û nayên guhertin. Ji hêla din ve, tebeqeyên bilind, yên ku bêtir taybetmendiyên peywirê digirin, ji bo ku bi peywira nû an databasê re biguncînin têne qefilandin û xweş têne rêz kirin.
Di dema pêvajoya başbûnê de, model li ser databasa nû tê perwerde kirin, bi gelemperî bi rêjeyek fêrbûna piçûktir ji perwerdehiya destpêkê. Vê rêjeya fêrbûnê ya piçûktir piştrast dike ku model bi giranî ji taybetmendiyên fêrbûyî yên berê dûr nekeve, dihêle ku ew zanyariyên ku di dema pêş-perwerdeyê de hatine bidestxistin bigire. Pêvajoya perwerdehiyê di nav tebeqeyên pêş-perwerdekirî de databasa nû vedihewîne, hesabkirina deran, û nûvekirina parametreyên qatên qeşagirtî ji bo kêmkirina fonksiyona windabûnê. Ev pêvajoya optimîzasyonê ya dubare berdewam dike heya ku model bigihîje asta performansa xwestinê an bigihîje.
Rêzkirina modelek gelek feydeyan peyda dike. Ya yekem, ew dihêle ku em dewlemendiya zanîna ku ji hêla modelên pêş-perwerdekirî ve hatine girtin, yên ku li ser danehevên girseyî hatine perwerde kirin û fêrî nûnertiyên zexm bûne, bi kar bînin. Vê nêzîkatiya fêrbûna veguheztinê rê dide me ku em bi gelemperîkirina ji zanîna pêş-perwerdekirî ve sînorên danehevên piçûk an domain-taybet derbas bikin. Ya duyemîn, baş-aheng çavkaniyên jimartinê yên ji bo perwerdehiyê hewce dike kêm dike, ji ber ku modela pêş-perwerdekirî berê xwe daye gelek taybetmendiyên kêrhatî. Ev dikare bi taybetî di senaryoyên ku perwerdekirina modelek ji sifirê de ji ber çavkaniyên tixûbdar an tengasiyên demê nepraktîk be de bikêrhatî be.
Ji bo ronîkirina nirxa pratîkî ya baş-ahengkirinê, werin em mînakek di warê dîtina kompîturê de bidin ber çavan. Bifikirin ku me modelek pêş-perwerdekirî heye ku li ser danûstendinek mezin a ku tê de tiştên cihêreng, di nav de pisîk, kûçik û otomobîl jî tê de, hatî perwerde kirin. Naha, em dixwazin vê modelê bikar bînin da ku cûreyên taybetî yên kûçikan di danegehek nû de dabeş bikin. Bi rastkirina modela pêş-perwerdekirî ya li ser databasa nû, model dikare taybetmendiyên xwe yên fêrbûyî biguhezîne da ku taybetmendiyên cihêreng ên cûreyên kûçikan çêtir nas bike. Ev modela birêkûpêk îhtîmal e ku li gorî perwerdehiya modelek ji sifirê ve rastbûnek bilindtir û gelemperîkirina çêtir li ser peywira dabeşkirina nîjada kûçik bi dest bixe.
Rêzkirina modelek perwerdekirî di çarçoweya Fêrbûna Makîneya Google Cloud de gavek girîng e ku rê dide me ku em modelên pêş-perwerdekirî li gorî peywirên nû an berhevokên daneyê biguncînin. Bi karanîna zanîna berê ya fêrbûyî û birêkûpêkkirina parametreyên modelê, em dikarin performansa wê zêde bikin, çêtir giştî bikin û çavkaniyên jimartinê xilas bikin. Ev nêzîkatiya fêrbûna veguheztinê bi taybetî dema ku bi daneyên tixûbdar an çavkaniyên sînordar re mijûl dibe bi nirx e.
Pirs û bersivên din ên vê dawiyê di derbarê EITC/AI/GCML Fêrbûna Makîna Ewr a Google:
- Nivîsar bi axaftinê (TTS) çi ye û ew çawa bi AI-ê re dixebite?
- Di fêrbûna makîneyê de di xebata bi daneyên mezin de çi sînor hene?
- Ma fêrbûna makîneyê dikare hin arîkariya diyalogê bike?
- Qada lîstikê ya TensorFlow çi ye?
- Di rastiyê de danûstendinek mezintir tê çi wateyê?
- Hin mînakên hîperparametreyên algorîtmê çi ne?
- Fêrbûna ensambleyê çi ye?
- Ger algorîtmayek fêrbûna makîneya bijartî ne guncan be û meriv çawa dikare piştrast bike ku ya rast hilbijêrin?
- Ma modelek fêrbûna makîneyê di dema perwerdehiya xwe de hewceyê çavdêriyê ye?
- Parametreyên sereke yên ku di algorîtmayên bingeha tora neuralî de têne bikar anîn çi ne?
Pirs û bersivan bêtir li EITC/AI/GCML Fêrbûna Makîneya Cloud Google-ê bibînin