Di warê îstîxbarata hunerî de, nemaze di Fêrbûna Kûr a bi Python û PyTorch de, dema ku bi daneyan û berhevokan re dixebitin, girîng e ku hûn algorîtmaya guncan hilbijêrin da ku têketina hatî dayîn pêvajo û analîz bikin. Di vê rewşê de, têketin ji navnîşek rêzikên numpy pêk tê, ku her yek nexşeyek germahiyê ku hilberîna ViTPose temsîl dike hilîne. Şêweya her pelê numpy [1, 17, 64, 48] ye, ku bi 17 xalên sereke yên laş re têkildar e.
Ji bo destnîşankirina algorîtmaya herî maqûl a ji bo hilanîna vî rengî daneyan, divê em taybetmendî û hewcedariyên peywira di dest de bifikirin. Xalên sereke yên di laş de, wekî ku ji hêla nexşeya germê ve têne destnîşan kirin, destnîşan dikin ku peywir bi texmîn an analîzê ve girêdayî ye. Texmîna pozê armanc dike ku di wêneyek an vîdyoyek de pozîsyonên girêkên laş an nîgarên sereke bibîne û nas bike. Ev di vîzyona komputerê de peywirek bingehîn e û gelek serîlêdanên xwe hene, wek naskirina çalakiyê, pêwendiya mirov-komputer, û pergalên çavdêriyê.
Ji ber cewherê pirsgirêkê, yek algorîtmayek maqûl ji bo analîzkirina nexşeyên germahiyê yên peydakirî Makîneyên Pozê Convolutional (CPM) ye. CPM ji bo peywirên nirxandina pozê vebijarkek populer e ji ber ku ew hêza torên neuralî yên pevgirêdayî (CNN) bikar tînin da ku girêdanên cîhê bigirin û taybetmendiyên cihêreng ji daneyên têketinê fêr bibin. CPM ji gelek qonaxan pêk tê, ku her yek bi pêşkeftî texmîna pozê safî dike. Nexşeya germahiya têketinê dikare wekî qonaxa destpêkê were bikar anîn, û qonaxên paşîn dikarin li gorî taybetmendiyên fêrbûyî pêşbîniyan safî bikin.
Algorîtmayek din a ku dikare were hesibandin algorîtmaya OpenPose ye. OpenPose algorîtmayek texmînkirina pozê ya pir-kesî ya rast-ê ye ku ji ber rastbûn û bikêrhatina xwe populerbûnek girîng bidest xistiye. Ew ji CNN û Zeviyên Têkiliya Beşê (PAF) bi kar tîne da ku xalên sereke yên poza mirovan texmîn bike. Nexşeyên germê yên têketinê dikarin werin bikar anîn da ku PAF-ên ku ji hêla OpenPose ve têne xwestin çêbikin, û dûv re algorîtm dikare li ser daneyên peydakirî texmîna pozê pêk bîne.
Wekî din, heke peywir di nav demê de şopandina xalên sereke yên pozê bi demê re têkildar be, algorîtmayên wekî DeepSort an Simple Online û Şopandina Rastî (SORT) dikarin werin bikar anîn. Van algorîtmayan texmîna pozê bi teknîkên şopandina objektê re berhev dikin da ku şopandina bi hêz û rast a xalên laş di vîdyoyan an rêzikên wêneyan de peyda bikin.
Girîng e ku were zanîn ku bijartina algorîtmayê jî bi hewcedariyên taybetî yên peywirê ve girêdayî ye, wek performansa rast-dem, rastbûn, û çavkaniyên hesabker ên berdest. Ji ber vê yekê, tê pêşniyar kirin ku hûn bi algorîtmayên cihêreng re ceribandin û performansa wan li ser komek pejirandinê an bi metrîkên din ên nirxandinê yên guncan binirxînin da ku algorîtmaya herî maqûl a ji bo peywirê diyar bikin.
Bi kurtasî, ji bo têketina danasîna rêzikên numpy ku nexşeyên germahiyê yên ku nuqteyên sereke yên laş temsîl dikin, hildigirin, algorîtmayên wekî Makîneyên Pose Convolutional (CPM), OpenPose, DeepSort, an SORT dikarin li gorî hewcedariyên taybetî yên peywirê bêne hesibandin. Pêdivî ye ku ceribandin û nirxandina performansa van algorîtmayan were destnîşankirin da ku ya herî maqûl were destnîşankirin.
Pirs û bersivên din ên vê dawiyê di derbarê Jimare:
- Dema ku torgilokek neuralî di fêrbûna kûr de perwerde dike çima pêdivî ye ku meriv danehevek bêhevseng hevseng bike?
- Çima dema ku di fêrbûna kûr de bi databasa MNIST re dixebitin vekêşana daneyan girîng e?
- Daneyên çêkirî yên TorchVision çawa dikarin ji bo destpêka fêrbûna kûr sûdmend bin?
- Armanca veqetandina daneyan di fêrbûna kûr de di perwerdekirin û ceribandina daneyan de çi ye?
- Çima amadekirin û manîpulekirina daneyan wekî beşek girîng a pêvajoya pêşkeftina modelê di fêrbûna kûr de tê hesibandin?
Pirs û bersivên bêtir:
- Erd: Îstîxbaratê ya sûnî
- bernameya: Eytc/AI/DLPP Fêrbûna Kûr a bi Python û PyTorch (biçin bernameya sertîfîkayê)
- Ders: Jimare (biçin dersa têkildar)
- Mijar: Datasets (biçin ser mijara têkildar)