The astengkirin Di pêvajoya xweşbînkirina Makîneyên Vektora Piştgiriyê (SVM) de pêkhateyek bingehîn e, rêbazek populer û hêzdar di warê fêrbûna makîneyê de ji bo karên dabeşkirinê. Ev astengî rolek girîng dilîze di pêbaweriya ku modela SVM rast nuqteyên daneyên perwerdehiyê dabeş dike dema ku marjînal di navbera çînên cihêreng de zêde dike. Ji bo ku bi tevahî girîngiya vê astengiyê binirxînin, pêdivî ye ku meriv mekanîka SVM-ê, şirovekirina geometrîkî ya astengiyê, û encamên wê yên ji bo pirsgirêka xweşbîniyê bihesibîne.
Makîneyên Vektora Piştgiriyê armanc dikin ku hîperplana çêtirîn ku nuqteyên daneyê yên çînên cihêreng bi marjînala herî zêde ji hev vediqetîne bibînin. Hîperplana di qada n-alî de bi hevkêşeyê tê diyarkirin , ku
vektora giraniyê ji hîperplanê re normal e,
vektora taybetmendiya têketinê ye, û
termê alîgiriyê ye. Armanc ew e ku nuqteyên daneyê bi vî rengî dabeş bikin ku xalên ji çînekê li aliyekî hîperplane, û xalên ji pola din jî li aliyê dijber bin.
The astengkirin piştrast dike ku her xala daneyê
rast hatiye tesnîfkirin û li aliyê rast ê marjînalê ye. Vir,
nîşana etîketa sinifa xala daneya i-th, bi
ji bo yek polê û
ji bo çîna din. The term
fonksiyona biryarê ye ku pozîsyona xala daneyê li gorî hîperplanê diyar dike.
Ji bo fêmkirina şiroveya geometrîkî, jêrîn bifikirin:
1. Veqetandina Dersên Erênî û Neyînî: Ji bo xaleke dane girêdayî çîna erênî (
), astengî
hêsan dike
. Ev tê wê wateyê ku xala daneyê
divê li ser an li derveyî sînorê marjînal ku ji hêla ve hatî destnîşan kirin derewan bike
. Bi heman awayî, ji bo xala daneyê
girêdayî çîna neyînî (
), astengî hêsan dike
, piştrast dike ku xala daneyê li ser an li derveyî sînorê marjînalê ku ji hêla hatî destnîşankirî ve ye
.
2. Maximization Margin: Dûr dûrahiya di navbera hîperplane û nuqteyên daneyê yên herî nêz ên ji her du çînan de ye. Texmînan piştrast dikin ku marjînal bi kişandina nuqteyên daneyê bi qasî ku gengaz ji hîperplaneyê dûr tê zêdekirin û hîn jî dabeşkirina rast diparêze. Dûrbûna ji xalekê ji hêla hîperplane ve tê dayîn
. Bi pêkanîna astengiyan
, algorîtmaya SVM bi bandor vê dûrbûnê zêde dike, berbi marjînalek mezintir û performansa giştîkirina çêtir dibe.
3. Vektorên Piştgiriyê: Xalên daneyan ên ku tam li ser sînorên marjînalê ne û
jê re vektorên piştgirî tê gotin. Van xalan di pênasekirina hîperplana optîmal de krîtîk in, ji ber ku ew xalên herî nêzîk ji hîperplanê re ne û rasterast bandorê li pozîsyon û arasteya wê dikin. Texmînan piştrast dikin ku ev vektorên piştgirî rast têne dabeş kirin û li ser sînorên marjînalê ne, bi vî rengî di pirsgirêka xweşbîniyê de rolek bingehîn dileyzin.
Pirsgirêka optimîzasyonê ya ji bo SVM-an dikare wekî pirsgirêkek optimîzasyonê ya tevlihev were formule kirin, ku armanc ew e ku norma vektora giraniyê kêm bike. (ku hevwateya zêdekirina marjînalê ye) li gorî astengiyan
ji bo hemî xalên daneyên perwerdehiyê. Ji hêla matematîkî ve, ev dikare wekî:
Faktora ya ji bo rehetiya matematîkî dema ku hilberê di dema xweşbîniyê de digire tê de. Ev formulasyon wekî forma seretayî ya pirsgirêka xweşbîniya SVM tê zanîn.
Ji bo çareserkirina vê pirsgirêka optimîzasyonê, yek bi gelemperî teknîkên ji xweşbîniya konveks, wekî pirjimarkerên Lagrange bikar tîne. Bi danasîna zêdekerên Lagrange ji bo her astengiyek, pirsgirêka xweşbîniyê dikare di forma xweya dualî de were veguheztin, ku bi gelemperî çareserî hêsantir e, nemaze dema ku bi daneyên pir-dimensî re mijûl dibe. Forma dualî ya pirsgirêka xweşbîniya SVM ji hêla:
ko hejmara xalên daneyên perwerdehiyê ye, û
parametreyek rêkûpêkkirinê ye ku danûstandina di navbera zêdekirina marjînal û kêmkirina xeletiya dabeşkirinê ya li ser daneyên perwerdehiyê de kontrol dike.
Formulasyona dualî fêlbazîya kernelê bi kar tîne, rê dide SVM-an ku daneyên ne-xêzkirî yên veqetandî bi rê ve bibin bi nexşeya daneya têketinê li cîhek taybetmendîyek bilindtir ku veqetandinek xêzikî gengaz e. Ev bi navgîniya fonksiyonên kernelê, wek kernelê pirnomîal, kernelê fonksiyona bingeha radial (RBF) û kernelê sigmoîd, ku bi nepenî hilbera xalê li cîhê-dimensîyona bilindtir hesab dike bêyî ku bi eşkere veguherînê pêk bîne, tê bidestxistin.
Bi çareserkirina pirsgirêka optimîzasyona dualî, meriv pirjimarkerên Lagrange yên çêtirîn bi dest dixe , ku dikare were bikar anîn da ku vektora giraniya çêtirîn diyar bike
û bias term
. Vektorên piştevaniyê bi xalên daneyê re bi pirjimarkerên Lagrange yên ne-sifir re têkildar in, û fonksiyona biryarê ji bo dabeşkirina xalên daneya nû
tê dayîn ji hêla:
The astengkirin Ji ber vê yekê ji pêvajoya xweşbînkirina SVM-ê re yekpare ye, dabîn dike ku model hevsengiyek di navbera birêkûpêk dabeşkirina daneyên perwerdehiyê û zêdekirina marjînal de bi dest dixe, ku rê li ber giştîkirina çêtir a daneyên nedîtî vedike.
Ji bo ku girîngiya vê astengiyê bi mînakek ronî bike, pirsgirêkek dabeşkirina binary a hêsan a bi xalên daneya du-alî re binirxînin. Bifikirin ku em daneyên perwerdehiya jêrîn hene:
Armanc ev e ku meriv hîperplana çêtirîn ku çîna erênî ji hev vediqetîne bibîne () ji çîna neyînî (
). Rêbazên ji bo vê pirsgirêkê dikarin wiha werin nivîsandin:
Bi çareserkirina pirsgirêka xweşbîniya SVM-ê bi van astengan re, em vektora giraniya çêtirîn digirin û bias term
ku hîperplana ku du çînan bi marjîna herî zêde ji hev vediqetîne diyar dike.
The astengkirin ji bo pêvajoya xweşbînkirina SVM-ê girîng e ji ber ku ew dabeşkirina rast a xalên daneya perwerdehiyê piştrast dike dema ku marjînal di navbera çînên cihêreng de zêde dike. Ev dibe sedema performansa giştîkirina çêtir û bihêzbûna modela SVM.
Pirs û bersivên din ên vê dawiyê di derbarê Eytc/AI/MLP Fêrbûna Makîneyê bi Python:
- Parametreya b di regresîyona xêzikî de (Y-navbera rêza herî baş) çawa tê hesibandin?
- Vektorên piştgirî di diyarkirina sînorê biryarê ya SVM de çi rola dilîze, û ew di pêvajoya perwerdehiyê de çawa têne nas kirin?
- Di çarçoveya xweşbîniya SVM de, girîngiya vektora giraniya `w` û bias `b` çi ye, û ew çawa têne destnîşankirin?
- Armanca rêbaza `visualize` di pêkanîna SVM de çi ye, û ew çawa di têgihîştina performansa modelê de dibe alîkar?
- Di pêkanîna SVM de rêbaza `pêşbînîkirin` çawa dabeşkirina xalek daneya nû diyar dike?
- Armanca bingehîn a Makîneyek Vektora Piştgiriyê (SVM) di çarçoveya fêrbûna makîneyê de çi ye?
- Çawa dikarin pirtûkxaneyên wekî scikit-learn bikar bînin da ku dabeşkirina SVM-ê li Python bicîh bikin, û fonksiyonên sereke yên têkildar çi ne?
- Armanca pirsgirêka xweşbîniya SVM çi ye û ew bi matematîkî çawa tête formule kirin?
- Tesnîfkirina komek taybetmendiyek di SVM de çawa bi nîşana fonksiyona biryarê ve girêdayî ye (nivîs{nîşan}(mathbf{x}_i cdot mathbf{w} + b))?
- Rola hevkêşeya hîperplane (mathbf{x} cdot mathbf{w} + b = 0) di çarçoveya Makîneyên Vektora Piştgiriyê (SVM) de çi ye?
Pir pirs û bersivan di Fêrbûna Makîneya EITC/AI/MLP de bi Python re bibînin