Di warê fêrbûna makîneyê de, nemaze dema ku platformên wekî Google Cloud Machine Learning bikar tînin, nirxandina performansa modelek karekî krîtîk e ku bandor û pêbaweriya modelê misoger dike. Metrîkên nirxandina performansê yên modelek cihêreng in û li gorî celebê pirsgirêka ku tête destnîşan kirin têne hilbijartin, gelo ew dabeşkirin, paşveçûn, kombûn, an celebek din a modela pêşdîtinê ye. Van metrîkan têgihiştinê peyda dikin ka model çiqasî baş dimeşe û dikare pêşkeftinên din rêve bike.
Classification Metrics
Ji bo pirsgirêkên dabeşkirinê, li cihê ku peywira veqetandina têketinê li yek ji çend kategoriyên veqetandî ye, bi gelemperî çend metrîkên sereke têne bikar anîn:
1. tamî: Ev yek ji metrîkên herî rast e. Ew rêjeya mînakên bi rêkûpêk hatine senifandin ji tevayî mînakan dipîve. Digel ku sade be, heke ders bêhevseng bin, rastbûn dikare xapînok be, tê vê wateyê ku yek çînek ji yên din pir caran pirtir e.
2. Precision û Recall: Ev metrîk bi taybetî dema ku bi danehevên bêhevseng re mijûl dibin bikêr in. Rêjeya pêşbîniyên erênî yên rastîn bi tevahî erênîyên pêşbînîkirî re ye, ku şiyana modelê destnîşan dike ku nimûneyek neyînî wekî erênî binav neke. Bîranîn, ku wekî hesasiyet an rêjeya erênî ya rastîn jî tê zanîn, rêjeya pêşbîniyên erênî yên rastîn bi erênîyên rastîn dipîve, ku şiyana modelê ya nasandina hemî bûyerên têkildar nîşan dide.
3. Score F1: Ev metrîk navgîna ahengî ya rastbûn û bîranînê ye, ku hevsengiyek di navbera her duyan de peyda dike. Ew bi taybetî bikêr e dema ku dabeşkirina polê neyekser be, ji ber ku ew hem erênîyên derewîn û hem jî neyînîyên derewîn hesab dike.
4. Kêşeya Taybetmendiya Xebatê ya Wergir (ROC) û Qada Di Bin Kevirê (AUC): Kêşeya ROC temsîla grafîkî ya şiyana tespîtkirinê ya modelê ye, ku rêjeya erênî ya rastîn li hember rêjeya erênî ya derewîn di mîhengên cûrbecûr yên bendê de xêz dike. AUC nirxek skalarek yekane peyda dike ku performansa modelê li seranserê hemî bendavan kurt dike, bi nirxek nêzîkê 1-ê performansa çêtir nîşan dide.
5. Confusion Matrix: Ev temsîla tabloyê ye ku destûrê dide dîtina performansa algorîtmayekê. Ew hejmara pêşbîniyên erênî yên rast, neyînî yên rast, erênî yên derewîn, û pêşbîniyên neyînî yên derewîn nîşan dide, ku nêrînek berfireh a kapasîteyên dabeşkirina modelê peyda dike.
Metrics Regression
Ji bo peywirên regresyonê, ku mebest pêşbînîkirina nirxek domdar e, metrîkên cûda têne bikar anîn:
1. Xeletiya Bêkêmasî ya Navîn (MAE): Ev metrîk mezinahiya navînî ya xeletiyan di komek pêşbîniyan de dipîve, bêyî ku arastekirina wan bihesibîne. Ew navînî li ser nimûneya ceribandinê ya cûdahiyên bêkêmasî yên di navbera pêşbînkirin û çavdêriya rastîn de ye.
2. Çewtiya Çargoşeya Navîn (MSE): MSE navîniya çarçikên xeletiyan dipîve, hestek cûdabûna bermayiyan peyda dike. Ew hesas e ku ji derûdora xwe re, ku dikare bi rengek nelirêtî li ser metrikê bandor bike.
3. Çewtiya Çargoşeya Navîn a Root (RMSE): RMSE koka çargoşe ya MSE ye û metrîka xeletiyê di heman yekeyên guhêrbara bersivê de peyda dike, pîvanek şirovekirî ya xeletiya pêşbîniyê pêşkêşî dike.
4. R-çargoşe (Koeficienta Determination): Ev metrîk rêjeya cudabûnê ya di guherbara girêdayî de ku ji guherbarên serbixwe tê pêşbînîkirin nîşan dide. Ew pîvanek peyda dike ka çiqas encamên çavdêrîkirî ji hêla modelê ve têne dubare kirin, digel nirxên ku nêzî 1-ê performansa çêtir nîşan dide.
5. Eyarkirî R-çargoşe: Ev guhertoyek guhertî ya R-squared e ku ji bo hejmara pêşbînkerên modelê rast dike. Ew bi taybetî bikêr e dema ku modelan bi hejmarên cûda yên pêşbînker re berhev dikin.
Clustering Metrics
Clustering, celebek fêrbûna bêserûber, pîvanên nirxandina cihêreng hewce dike ji ber ku rastiyek zemîn tune ku li hember were berhev kirin:
1. Score Silhouette: Ev metrîk dipîve ku çi qas tişt dişibihe koma xwe li gorî komikên din. Ew ji -1 heta 1-ê diguhere, digel nirxên bilindtir kombûna çêtir nîşan dide.
2. Endeksa Davies-Bouldin: Ev îndeks rêjeya wekheviya navîn a her komê bi koma wê ya herî dişibih dinirxîne, bi nirxên jêrîn kombûna çêtir nîşan dide.
3. Indeksa Calinski-Harabasz: Wekî Pîvana Rêjeya Variance jî tê zanîn, ev metrik rêjeya berhevoka belavbûna di navbera komê û belavbûna di nav komê de dinirxîne. Nirxên bilind komên çêtir diyarkirî pêşniyar dikin.
Nirxandina Modelê di pratîkê de
Dema ku meriv modelek dinirxîne, girîng e ku meriv li çarçove û hewcedariyên taybetî yên peywira di dest de binihêre. Mînakî, di senaryoyek teşhîsa bijîjkî de, dibe ku bîranîn li ser rastbûnê were pêşîn kirin da ku pê ewle bibe ku hemî bûyerên potansiyel têne nas kirin, tewra bi bihayê hin erênîyên derewîn. Berevajî vê, di pergalek tespîtkirina spam de, dibe ku rastbûn girîngtir be da ku e-nameyên rewa wekî spam nîşan nedin.
Fêrbûna Makîneya Cloud Google amûrên ku hesabkirina van metrikan hêsantir dike peyda dike, ku dihêle zanyar û endezyarên daneyê bi bandor performansa modelê binirxînin. Bi karanîna van metrîkan re, meriv dikare di derbarê hilbijartina modelê, birêkûpêkkirin û bicîhkirinê de biryarên agahdar bide, dabîn bike ku model standardên rastbûn, pêbawerî û karîgeriyê yên xwestî pêk tîne.
Fêmkirin û bi rêkûpêk sepandina van metrîkên nirxandina performansê ji bo bicîhkirina serketî ya modelên fêrbûna makîneyê pêdivî ye. Ew zengila bersivdayînê ya pêwîst peyda dikin da ku modelan bi domdarî safî bikin, dabîn bikin ku ew nirxê peyda dikin û hêviyên ku ji hêla serîlêdanên mebesta wan ve hatine destnîşankirin pêk tînin.
Pirs û bersivên din ên vê dawiyê di derbarê EITC/AI/GCML Fêrbûna Makîna Ewr a Google:
- Pîvanên ji bo hilbijartina algorîtmaya rast ji bo pirsgirêkek diyarkirî çi ne?
- Ger yek modelek Google-ê bikar bîne û wê li ser mînaka xwe perwerde bike, gelo Google çêtirkirinên ku ji daneyên perwerdehiyê hatine çêkirin digire?
- Meriv çawa dizane ku kîjan modela ML-ê bikar bîne, berî ku wê perwerde bike?
- Karê regresyonê çi ye?
- Meriv çawa dikare di navbera tabloyên Vertex AI û AutoML de derbas bibe?
- Ma gengaz e ku meriv Kaggle bikar bîne da ku daneyên darayî bar bike û bi karanîna modelên ekonomometrik ên wekî R-squared, ARIMA an GARCH analîz û pêşbînkirina statîstîkî pêk bîne?
- Ma fêrbûna makîneyê dikare ji bo pêşbînkirina xetera nexweşiya dil a koroner were bikar anîn?
- Guhertinên rastîn ên ji ber veavakirina Fêrbûna Makîneya Google Cloud wekî Vertex AI çi ne?
- Regression linear çi ye?
- Ma gengaz e ku meriv modelên ML-ya cihêreng bi hev re bike û AI-yek master ava bike?
Pirs û bersivan bêtir li EITC/AI/GCML Fêrbûna Makîneya Cloud Google-ê bibînin