ĪÄÕĀ

�¶Īäŗŗ¹¤³Ģ´óŃ§Ń§±Ø�· 2024Äź04ĘŚ 424-430 ³ö°ęČÕĘŚ£ŗ2024-08-28 ISSN:1674-2869 CN:42-1779/TQ

ĆęĻņ±ßŌµÉč±øµÄĒįĮæ¼¶OpenPose×ĖĢ¬¼ģ²āÄ£ŠĶŃŠ¾æ

Ėę×Å¼ĘĖć»śÓ²¼žÄÜĮ¦µÄĢįÉż£¬ČĖ¹¤ÖĒÄÜŌŚŹÓ¾õĮģÓņµÄ·¢Õ¹ÓČĪŖŃøĖŁ£Ū1£Ż£¬ĘäÖŠ»łÓŚ»śĘ÷ŹÓ¾õµÄÄæ±ź×ĖĢ¬¼ģ²ā·½·ØÕżÖš½�ŹÜµ½ČĖĆĒµÄ¹Ų×¢£¬²¢¹ć·ŗÓ¦ÓĆŌŚø÷ÖÖĮģÓņ£¬ĄżČē¼ģ²ā²Ł×÷¹¤ČĖµÄŅģ³£ŠŠĪŖ£Ū2£Ż�¢¶Ą¾ÓĄĻČĖµÄĖ¤µ¹ŠŠĪŖ£Ū3£Ż�¢¹«¹²»·¾³µÄ±©Į¦ŠŠĪŖ£Ū4£ŻµČ�£ĻÖÓŠ»łÓŚ»śĘ÷ŹÓ¾õµÄČĖĢå×ĖĢ¬¼ģ²āĖć·Ø°üĄØ´«Ķ³µÄĶ¼ĻńĖć·ØŗĶ»łÓŚÉī¶ČŃ§Ļ°µÄ×ĖĢ¬¼ģ²āĖć·Ø�£´«Ķ³µÄĶ¼ĻńĖć·ØĶØ¹żĶ¼Ļń·Öøī�¢ĢŲÕ÷±ä»»µČ·½Ź½ĢįČ�Äæ±źĢŲÕ÷×ö¼ģ²ā£¬ÕāÖÖ·½·ØŹ¶±š×¼Č·ĀŹøß�¢ĖŁ¶Čæģ£¬µ«ŹĒÕė¶Ō²»Ķ¬µÄĢŲÕ÷ŠčŅŖÖŲŠĀŹŹÅä£¬·ŗÓĆŠŌ½Ļ²ī�£»łÓŚÉī¶ČŃ§Ļ°µÄ×ĖĢ¬¼ģ²āĖć·ØÖŠÓ¦ÓĆ×ī¹ć·ŗµÄŹĒOpenPose£Ū5£ŻÄ£ŠĶ½į¹¹£¬ĄżČēRameshµČ£Ū6£ŻŹ¹ÓĆOpenPoseÄ£ŠĶ¶ŌÅÜ²½ŠŠĪŖ½ųŠŠ¶Æ×÷²¶×½£¬µ«øĆĖć·ØÄ£ŠĶµÄ²æŹšŃĻÖŲŅĄĄµøßĖćĮ¦µÄÉč±ø£¬¶ŌŠ�æŖ·¢ĶÅ¶Ó»ņÕßøöČĖæŖ·¢Õß¼«Ęä²»ÓŃŗĆ£»ĄīŅ»·²µČ£Ū7£ŻŹ¹ÓĆĒįĮæ¼¶²Š²īĶųĀē£Øresident networks£¬ResNet£©Ģę»»ŌĶųĀē£¬ÓŠŠ§ĢįÉżĮĖOpenPoseÄ£ŠĶµÄŌĖŠŠĖŁ¶Č£¬½µµĶĮĖÄ£ŠĶ²ĪŹżĮæ£¬µ«ŹĒ·ÖĄąŠ§¹ū²»¼Ń£»Ķõ·ĒµČ£Ū8£ŻŹ¹ÓĆĒįĮæ»ÆµÄŅĘ¶ÆĶųĀē£Ømobile networks£¬MobileNet£©Ģę»»OpenPoseÄ£ŠĶÖŠµÄĢŲÕ÷ĢįČ�ĶųĀē£¬½ųŅ»²½½µµĶĮĖÄ£ŠĶ²ĪŹżĮæ£¬µ«ŹĒ¼ģ²āŠ§¹ū²»¹»ĄķĻė�£

ĪŖĮĖŌŚµĶĖćĮ¦µÄ±ßŌµÉč±øÉĻ²æŹš»łÓŚÉī¶ČŃ§Ļ°µÄ×ĖĢ¬¼ģ²āĶųĀē£¬×ŪŗĻæ¼ĀĒĶųĀēŹ¶±šŠ§¹ūŗĶŹµŹ±ŠŌµÄŠčĒó£¬ŹµĻÖ»łÓŚ×ĖĢ¬¼ģ²āµÄČĖĢåŠŠĪŖŹ¶±š£¬±¾ĪÄŃŠ¾æ²¢Éč¼ĘĮĖŅ»ÖÖĒįĮæ¼¶OpenPoseÄ£ŠĶ�£ŌŚĢŲÕ÷ĢįČ�²ćŹ¹ÓĆøÄ½ųµÄMobileNetĢę»»Ō±¾µÄÖ÷øÉĢŲÕ÷ĶųĀē£¬ĶØ¹żŌŚĒ³²ćŹ¹ÓĆResNet½ųŅ»²½½µµĶÄ£ŠĶŃµĮ·µÄ²ĪŹżĮæ£¬Ķ¬Ź±ĪŖĮĖ±£Ö¤Ä£ŠĶµÄ¼ģ²āŠ§¹ū£¬ŌŚĶųĀēÉī²ćŅżČė¾ķ»żæé×¢ŅāĮ¦Ä£æé£Øconvolutional block attention module£¬CBAM£©£Ū9£Ż£¬ŌŚ×ĖĢ¬¹Ą¼Ę²ćÖŲŠĀÉč¼ĘĶųĀē½į¹¹�£øÄ½ųŗóµÄĒįĮæ¼¶OpenPoseÄ£ŠĶÄÜ¹»ŌŚ±ßŌµÉč±øÉĻŹµŹ±²æŹš£¬²¢×¼Č·Ź¶±šÄæ±ź³�¾°ĻĀµÄČĖĢåŠŠĪŖ�£

1 ŠŠĪŖŹ¶±šĘ½ĢØÉč¼Ę

Ę½ĢØŹ¹ÓĆµÄĒ¶ČėŹ½Éč±øĪŖÓ¢Ī°´ļĘģĻĀµÄ Jetson TX2Éč±ø�£Jetson TX2Éč±ø°üŗ¬256øö²¢ŠŠ¼ĘĖć¼Ü¹¹£Øcompute unified device architecture£¬CUDA£©£¬æÉŅŌ¶ŌÉń¾ĶųĀēÄ£ŠĶ½ųŠŠĶĘĄķ�£Ę½ĢØÓėĶųĀēÉćĻńĶ·Šč½ÓČėĶ¬Ņ»¾ÖÓņĶųÄŚ£¬Ę½ĢØĶØ¹ż½»»»»ś¶ĮČ�ÉćĻńĶ·µÄŹµŹ±ŹÓĘµĮ÷£¬²¢½«ĘäÖšÖ�ŹäČėÄ£ŠĶ£¬ŌĖŠŠŌŚJetson TX2Éč±øµÄCUDA¼ÓĖŁŗĖŠÄÉĻ�£ŌŚĶź³ÉÉń¾ĶųĀēµÄÓÅ»Æ�¢²æŹš¹¤×÷ŗó£¬½«½į¹ūŹä³öÖĮĻŌŹ¾½ēĆę£¬øĆĻµĶ³µÄ¹¤×÷ŌĄķČēĶ¼1ĖłŹ¾�£

<G:\Īäŗŗ¹¤³Ģ´óŃ§\2024\µŚ3ĘŚ\»Ęč¤ŗĄ-1.tif>

Ķ¼1 ĻµĶ³¹¤×÷ŌĄķ

Fig. 1 Operating principle

2 ×ĖĢ¬¼ģ²āĖć·Ø

2.1 OpenPose×ĖĢ¬¼ģ²āÄ£ŠĶ

OpenPoseÄ£ŠĶŹĒ2016ÄźÓÉæØÄĶ»łĆ·Ā�´óŃ§æŖŌ´µÄŅ»ĻīČĖĢå×ĖĢ¬¼ģ²āÄ£ŠĶ£¬ĘäŌŚ¶ąČĖĶ¼ĻńÖŠŹ¹ÓĆ×Ōµ×ĻņÉĻµÄ·½·Ø¶ŌČĖĢå×ĖĢ¬½ųŠŠŹ¶±š�£Ź×ĻČČ·¶Ø¹Ē÷Ą¹Ų¼üµćµÄĪ»ÖĆŠÅĻ¢£¬²¢½«Ęä±ź¼ĒĪŖ¹Ų½ŚČČ¶ČĶ¼£¬Č»ŗóĶØ¹ż¼ĘĖćĆæøö¹Ų½ŚČČ¶ČĶ¼¶ŌÓ¦µÄ¾Ö²æĒ×ŗĶ³�£Øpart affinity fields£¬PAF£©½«ø÷øö¹Ų¼üµćĮ¬½Ó¹¹³ÉĻņĮæ�£´«Ķ³µÄOpenPoseÄ£ŠĶŹ¹ÓĆŹÓ¾õ¼øŗĪ×éĶųĀē£Øvisual geometry group network£¬VGGNet£©£Ū10£Ż×÷ĪŖŹäČė²ć£¬VGGNet°üŗ¬16øö¾ķ»ż²ćŅŌ¼°3øöČ«Į¬½Ó²ć�£ŌŹ¼Ķ¼ĻńŹäČėĶųĀēŗóŌŚĒ°10²ćÉś³ÉĢŲÕ÷Ķ¼F£¬²¢½«ĢŲÕ÷Ķ¼F×÷ĪŖŗóŠųÉń¾ĶųĀēµÄŹäČė�£ŗóŠųĶųĀēÖŠĆæøö½×¶ĪµÄ×ĖĢ¬¼ģ²ā²ć»į·Ö³ö2øö·ÖÖ§²ć£¬ŌŚĆæøö½×¶Ī£¬·ÖÖ§²ć1ÓĆĄ´Ō¤²ā¹Ų½ŚČČ¶ČĶ¼St£¬·ÖÖ§²ć2ÓĆĄ´Ō¤²ā¾Ö²æĒ×ŗĶ³�Lt£¬ĘäÖŠt±ķŹ¾ĶųĀēĶĘĄķ¹ż³ĢÖŠµÄ½×¶ĪŹż£¬¾ßĢåČēŹ½£Ø1£©ĖłŹ¾£ŗ

[St=¦Ńt(F, St-1, Lt-1),?t�Ż2Lt=¦Õt(F, St-1, Lt-1),?t�Ż2] £Ø1£©

Ź½£Ø1£©ÖŠ£ŗ¦ŃtŗĶ¦Õt·Ö±š±ķŹ¾Į½øö·ÖÖ§²ćŌŚµŚt½×¶ĪÓĆÓŚĶĘĄķµÄ¾ķ»żĶųĀē£¬Ćæøö½×¶ĪµÄŹäČėĪŖFŗĶĒ°Ņ»½×¶ĪŌ¤²āµÄ½į¹ū£¬Ź¹ÓĆ±¾½×¶ĪµÄ¾ķ»żĶųĀē·Ö±šŌ¤²ā³ö±¾½×¶ĪµÄ¹Ų½ŚČČ¶ČĶ¼ŗĶPAF�£

VGGNetŌŚÕūøöĶųĀēÖŠČ«²æŹ¹ÓĆ3�Į3´óŠ�µÄ¾ķ»żŗĖ¶ŃµžÉń¾ĶųĀē�£Ź¹ÓĆVGGNetµÄOpenPoseÄ£ŠĶĶųĀē½į¹¹ČēĶ¼2ĖłŹ¾£¬ĘäÖŠ£¬h£¬w·Ö±š±ķŹ¾ŹäČėĶ¼ĻńµÄøßŗĶæķ£»h�ä£¬w�ä·Ö±š±ķŹ¾Źä³öĶ¼ĻńµÄøßŗĶæķ£»C±ķŹ¾¾ķ»ż²Ł×÷£»P±ķŹ¾³Ų»Æ²Ł×÷�£

2.2 øÄ½ųµÄĒįĮæ¼¶OpenPoseÄ£ŠĶ

2.2.1 Éī¶ČæÉ·ÖĄė¾ķ»ż ÓÉÓŚJetson TX2Éč±øµÄĶĘĄķŠŌÄÜ²»øß£¬»łÓŚVGGNetµÄOpenPoseÄ£ŠĶŌŚøĆÉč±øÉĻĪŽ·ØÕż³£ŌĖŠŠ£¬±¾ĪÄ½«Ō±¾µÄÖ÷øÉĢŲÕ÷ĶųĀēČ«²æĢę»»ĪŖMobileNet£Ū11£Ż£¬ŗóÕßŹ¹ÓĆÉī¶ČæÉ·ÖĄė¾ķ»żµÄĖ¼Ļė£¬½«±ź×¼¾ķ»ż²š·Ö³É1øöĘÕĶØ¾ķ»ż²ćŗĶ1øö1�Į1µÄµćÕó�£¼ŁÉčŹäČė²ćĢŲÕ÷¾ŲÕóĪŖDF�ĮDF�ĮM£¬Źä³ö²ćĢŲÕ÷¾ŲÕóĪŖDF�ĮDF�ĮN£¬¾ķ»żŗĖĪŖK�ĮK£¬ĘäÖŠDF±ķŹ¾²š·Ö³É·½ŠĪµÄŹäČėĢŲÕ÷Ķ¼ĻńŗĶŹä³öĢŲÕ÷Ķ¼ĻńµÄ±ß³¤£¬MŗĶN·Ö±š±ķŹ¾ŹäČėĢŲÕ÷ŗĶŹä³öĢŲÕ÷µÄĶØµĄŹż£¬K±ķŹ¾¾ķ»żŗĖ³ß´ē�£±ź×¼¾ķ»żµÄ¼ĘĖćĮæS1ŗĶÉī¶ČæÉ·ÖĄė¾ķ»żµÄ¼ĘĖćĮæS2ČēŹ½£Ø2-3£©ĖłŹ¾£ŗ

[S1=DF�ĮDF�ĮM�ĮN�ĮDF�ĮDF] £Ø2£©

[S2=K�ĮK�ĮM�ĮDF�ĮDF+M�ĮN�ĮDF�ĮDF]

£Ø3£©

¶Ō±ČS1ŗĶS2µÄ²ĪŹżĮææÉÖŖ£¬Éī¶ČæÉ·ÖĄė¾ķ»żµÄ¼ĘĖćĮæ½öĪŖ±ź×¼¾ķ»ż¼ĘĖćĮæµÄ1/N+1/K2£¬NĶØ³£ŹĒŅ»øöŗÜ´óµÄÖµ£¬Ņņ´Ėµ±K=3Ź±£¬Éī¶ČæÉ·ÖĄė¾ķ»żµÄ¼ĘĖćæŖĻś½öĪŖ±ź×¼¾ķ»żµÄ1/9�£

2.2.2 ĢŲÕ÷ČŚŗĻ ŌŚĶųĀēĒ³²ćŹ¹ÓĆµ¹ÖĆ²Š²ī£Øinverted residuals£¬IR£©½į¹¹£¬øĆ½į¹¹¾ßÓŠĘæ¾±Éč¼Ę£¬ČēĶ¼3ĖłŹ¾£¬ĘäÖŠc±ķŹ¾ĶØµĄŹż£¬a±ķŹ¾Ą©ÕÅ±¶ĀŹ£¬Ķ¼3ÖŠ¹«Ź½±ķŹ¾´«µŻ¹ż³ĢÖŠFĶØµĄŹżµÄ±ä»Æ�£ĢŲÕ÷Ķ¼F×÷ĪŖŹäČėŹ×ĻČĶØ¹żŅ»´Ī¾ķ»ż½«ĶØµĄĄ©ÕÅa±¶½ųŠŠÉżĪ¬£¬ŹµĻÖĢŲÕ÷´ÓµĶĪ¬µ½øßĪ¬µÄ±ķÕ÷£¬Č»ŗóŹ¹ÓĆ¼¤»īŗÆŹż·ÖÅäø÷ĶØµĄŠÅĻ¢µÄČØÖµ£¬ŅÖÖĘ·ĒĢŲÕ÷ĶØµĄ£¬ŌŁ¾¹żŅ»´Ī¾ķ»ż½«ĶØµĄĖõ¼õĪŖ1/a½ųŠŠ½µĪ¬£¬½«øßĪ¬ĶØµĄŠÅĻ¢Ó³Éä»ŲµĶĪ¬ĶØµĄ£Ū12£Ż£¬²Š²īæé¾¹ż�°ÉżĪ¬-¾ķ»ż-½µĪ¬�±µÄ²½Öč£¬Ź¹Źä³öĢŲÕ÷Ķ¼F�äĖę×Å¾ķ»ż²ćµÄ¼ÓÉī£¬ŹµĻÖ²ć¼äæēĶØµĄµÄŠÅĻ¢´«µŻ£¬ÓŠŠ§±£ĮōĶØµĄĢŲÕ÷£Ū13-14£Ż�£

Éī¶ČæÉ·ÖĄė¾ķ»żµÄŅżČėĖäČ»ÄÜ¼«´ó¼õÉŁÄ£ŠĶŌĖĖćĮæ£¬µ«Ķ¬Ź±Ņ²ŗÜČŻŅ×µ¼ÖĀ¾ķ»ż¹ż³ĢÖŠĢŲÕ÷ŠÅĻ¢µÄ¶ŖŹ§£¬ĪŖĮĖ±£Ö¤ĶųĀēÉī²ćÖŠ×ĖĢ¬¼ģ²ā²ćPAFµÄĘ´½ÓŠ§¹ū£¬ŌŚĶųĀēµÄÉī²ćĢķ¼ÓCBAM£¬CBAM½į¹¹ČēĶ¼4ĖłŹ¾�£

<G:\Īäŗŗ¹¤³Ģ´óŃ§\2024\µŚ3ĘŚ\»Ęč¤ŗĄ-4.tif>

Ķ¼4 CBAM½į¹¹

Fig. 4 CBAM structure

ŹäČėĢŲÕ÷Ķ¼ĻČŗó¾¹żĶØµĄ×¢ŅāĮ¦Ä£æéŗĶæÕ¼ä×¢ŅāĮ¦Ä£æé£¬ĶØµĄ×¢ŅāĮ¦Ä£æéĶØ¹ż²¢ŠŠµÄ×ī´ó³Ų»Æ²Ł×÷ŗĶĘ½¾ł³Ų»Æ²Ł×÷Éś³ÉĶØµĄ×¢ŅāĶ¼£¬µ÷ÕūFĶØµĄÄŚµÄĢŲÕ÷ŠÅĻ¢£»æÕ¼ä×¢ŅāĮ¦Ä£æéĶØ¹żĻČŗó½ųŠŠµÄ×ī´ó³Ų»Æ²Ł×÷ŗĶĘ½¾ł³Ų»Æ²Ł×÷Éś³ÉæÕ¼ä×¢ŅāĮ¦Ķ¼£¬µ÷ÕūF×ų±ź¼äµÄĢŲÕ÷ŠÅĻ¢�£ĶØ¹żĪŖĶØµĄ×¢ŅāĮ¦Ä£æéŗĶæÕ¼ä×¢ŅāĮ¦Ä£æé·ÖÅä²»Ķ¬µÄČØÖŲ£¬¶Ōø÷ĶØµĄŗĶ²»Ķ¬×ų±źĻĀĢŲÕ÷Ķ¼ÖŠĢŲÕ÷ŠÅĻ¢µÄ±ķÕ÷ÄÜĮ¦½ųŠŠµ÷Õū£¬ÓŠŠ§ĢįøßĶųĀē¶ŌĢŲÕ÷Ķ¼ÖŠĢŲÕ÷µÄ¹Ų×¢¶Č�£

CBAMæÉŅŌ¼ÓĒæĶØµĄŗĶæÕ¼äĢŲÕ÷ŠÅĻ¢µÄ±ķÕ÷£Ū8£Ż£¬Ęä¼ĘĖćĮæ½öÓėĶØµĄŹżŗĶ¾ķ»żŗĖ´óŠ�Ļą¹Ų£¬²»»į´ųĄ´¹ż´óµÄ¼ĘĖćæŖĻś£¬·Ē³£ŹŹŗĻ²æŹšŌŚ±ßŌµÉč±øµÄÉń¾ĶųĀēÖŠ�£

2.2.3 ×ĖĢ¬¹Ą¼Ę²ćµÄøÄ½ų Ō±¾µÄ×ĖĢ¬¼ģ²ā²ćŌŚPAFµÄĘ´½Ó¹ż³ĢÖŠŹ¹ÓĆ¶ąøö7�Į7µÄ¾ķ»żŗĖ£¬±¾ĪÄŹ¹ÓĆ3øö3�Į3µÄ¾ķ»żŗĖµČŠ§Ģę´ś1øö7�Į7µÄ¾ķ»żŗĖ£¬¼ŁÉčŹäČė³ß´ēĻąĶ¬µÄĶ¼Ę¬£¬ŹäČė³ß´ēĪŖM�ĮM£¬¾ķ»żŗĖµÄ´óŠ�ĪŖK�ĮK£¬Ģī³äĪŖP£¬²½³¤ĪŖS£¬ŌņŹä³ö³ß´ēM�äČēŹ½£Ø4£©ĖłŹ¾£ŗ

[M�Æ=(M+2�ĮP-K)/S+1] £Ø4£©

´ÓŹ½£Ø4£©æÉŅŌæ´³ö£¬ŌŚĻąĶ¬µÄĢī³äŗĶ²½³¤ĻĀ£¬Ź¹ÓĆ3øö3�Į3µÄ¾ķ»żŗĖµČŠ§Ģę´ś1øö7�Į7µÄ¾ķ»żŗĖŹ±øŠŹÜŅ°²»±ä£¬Ķ¬Ź±¼õÉŁ¾ķ»ż´ųĄ´µÄ¼ĘĖćĮæ�£

øÄ½ųŗóµÄĒįĮæ¼¶OpenPoseÄ£ŠĶŹ¹ÓĆÉī¶ČæÉ·ÖĄė¾ķ»żMobileNetĢę»»VGGNet£»ŌŚĢŲÕ÷ĢįČ�µÄĒ³²ćŹ¹ÓĆIR½į¹¹£¬Éī²ćĢķ¼ÓCBAM£¬½«Ē³²ćĢŲÕ÷½µ²ÉŃłŗóÓėÉī²ćĢŲÕ÷ČŚŗĻŌŁĖĶČė×ĖĢ¬¼ģ²ā²ćÖŠµÄø÷øö·ÖÖ§²ć£»·ÖÖ§²ćÖŠPAFĘ´½ÓĶųĀēŹ¹ÓĆ3øö3�Į3¾ķ»żŗĖ´śĢę7�Į7¾ķ»żŗĖ¼õÉŁ¼ĘĖćæŖĻś�£ÖŲŠĀÉč¼ĘµÄĶųĀē½į¹¹ČēĶ¼5ĖłŹ¾£¬ĘäÖŠCd±ķŹ¾Éī¶ČæÉ·ÖĄė¾ķ»ż²Ł×÷�£

3 ½į¹ū¼°ĢÖĀŪ

3.1 Źż¾Ż¼Æ

Ź¹ÓĆCOCOŹż¾Ż¼ÆŃéÖ¤øÄ½ųĶųĀēŠ§¹ū£¬ŌŚÓŠČĖĢåµÄĶ¼Ę¬ÖŠ¶ØŅåĮĖ18øö¹Ē÷Ą¹Ų¼üµć�£ĶųĀēŃµĮ·¹ż³ĢÖŠ½«ŗ¬ÓŠČĖĢåµÄ4ĶņÕÅĶ¼Ę¬·Ö±šÉčÖĆĪŖŃµĮ·¼Æ�¢²āŹŌ¼ÆŗĶŃéÖ¤¼Æ£¬±ČĄżĪŖ8�Ć1�Ć1�£

ŌŚ±ßŌµÉč±øÉĻŃéÖ¤»łÓŚ×ĖĢ¬¼ģ²āµÄČĖĢåŠŠĪŖŹ¶±šŠ§¹ūŹ±£¬Ź¹ÓĆ×ŌŠŠĀ¼ÖĘµÄŠŠĪŖŹż¾Ż¼Æ£¬ĶØ¹ż¹Ē÷Ą¹Ų¼üµćµÄæÕ¼äĪ»ÖĆ²īŅģĆčŹö²»Ķ¬µÄŠŠĪŖ£¬Źż¾Ż¼Æ¹²°üĄØ 8ĄąŠŠĪŖ£¬·Ö±šŹĒČ»÷�¢¹ÄÕĘ�¢»ÓŹÖ�¢×ų�¢ÅÜ�¢×ß�¢Õ¾Į¢�¢ĶäŃü�£´ÓŹÓĘµÖŠŅ»¹²ĢįČ�12 000ÕÅĶ¼Ę¬£¬Ę½¾łĆæĄąŠŠĪŖÓŠ1 500ÕÅĶ¼Ę¬£¬ŅŌŌŚCOCOŹż¾Ż¼ÆÉĻŃµĮ·Ķź³ÉµÄÄ£ŠĶĪŖŌ¤ŃµĮ·Ä£ŠĶ¶ŌĆæÕÅĶ¼Ę¬±ź×¢¹Ē÷Ą¹Ų¼üµćÖĘ×÷³ÉŹż¾Ż¼Æ£¬²¢°´ÕÕ8�Ć2µÄ±ČĄżÖĘ×÷ŃµĮ·¼ÆŗĶŃéÖ¤¼Æ�£

3.2 ŃµĮ·½į¹ū·ÖĪö

øÄ½ųŗóµÄĒįĮæ¼¶OpenPoseÄ£ŠĶŌŚPytorch2.1Ę½ĢØÉĻŃµĮ·£¬Ę½ĢØµÄÓ²¼žÅäÖĆ°üĄØÓ¢ĢŲ¶ūæįī£i5-13600KF£¬32 GBÄŚ´ęŗĶŠĶŗÅĪŖÓ¢Ī°´ļRTX4080µÄGPU£¬Python°ę±¾ĪŖ3.9.16�£ŌŚCOCOŹż¾Ż¼ÆÉĻµÄŃµĮ·Š§¹ūŅŌÕżČ·¹Ų¼üµć°Ł·Ö±Č£Øpercentage of correct keypoints£¬PCK£©�¢Ę½¾ł¾«¶Č£Øaverage precision£¬AP£©ŗĶ¾ł·½Īó²īĖšŹ§£Ømean squared error£¬MSE£©×÷ĪŖĘĄ¹ĄÄ£ŠĶŠŌÄÜµÄÖø±ź�£PCKÖøµÄŹĒµ±¼ģ²āµÄ¹Ē÷Ą¹Ų¼üµćĪ»ÖĆÓė±ź×¢µÄČĖĢå¹Ų¼üµćĪ»ÖĆÖ®¼äµÄ¾ąĄėµĶÓŚÄ³øöćŠÖµŹ±£¬ČĻĪŖøĆµć±»ÕżČ·¼ģ²āµ½£¬±¾ĪÄÖŠćŠÖµÉč¶ØĪŖ5ĻńĖŲÖµ£»APŹĒµ�Ąą±š¼ģ²ā¾«¶Č£¬Ęä¼ĘĖć¹«Ź½ČēŹ½£Ø5£©ĖłŹ¾£ŗ

[PA=01TPTP+FP(TPTP+FN)d(TPTP+FN)] £Ø5£©

ĘäÖŠ£¬TP±ķŹ¾µ�Ńł±¾ÖŠPCKÖµĪŖ1µÄŹżĮæ£¬¼´¼ģ²āµ½µÄ¹Ų¼üµćŹżĮæÓė±źĒ©ÖŠ¹Ų¼üµćŹżĮæŅ»ÖĀ£¬ FP±ķŹ¾µ�Ńł±¾ÖŠPCKÖµŌŚ1.0ŅŌĻĀµÄŹżĮæ£¬¼´¼ģ²āµ½µÄ¹Ų¼üµćŹżĮæŠ�ÓŚ±źĒ©ÖŠ¹Ų¼üµćŹżĮæ£¬FN±ķŹ¾µ�Ńł±¾ÖŠPCKÖµŌŚ1.0ŅŌÉĻµÄŹżĮæ£¬¼´¼ģ²āµ½µÄ¹Ų¼üµćŹżĮæ´óÓŚ±źĒ©ÖŠ¹Ų¼üµćŹżĮæ�£

MSE·ÖĪŖ¾Ö²æĒ×ŗĶ³�ĖšŹ§ÖµPLossŗĶČČ¶ČĶ¼ĖšŹ§ÖµHLossĮ½²æ·Ö£¬¼ĘĖć·½·ØČēŹ½£Ø6£©ĖłŹ¾£ŗ

[LMSE=t=1T(PLoss+HLoss)] £Ø6£©

ĘäÖŠ£¬T±ķŹ¾×ÜŹ±¼äÖÜĘŚ£¬PLoss±ķŹ¾ŌŚµŚt½×¶Ī×ĖĢ¬¼ģ²ā²ćÖŠŌ¤²āPAF²śÉśµÄĪó²ī£¬¼ĘĖć¹«Ź½ČēŹ½£Ø7£©ĖłŹ¾£ŗ

[PLoss=W�¤||St-S*t||2] £Ø7£©

HLoss±ķŹ¾ŌŚµŚt½×¶Ī×ĖĢ¬¼ģ²ā²ćÖŠŌ¤²ā¹Ų½ŚČČ¶ČĶ¼²śÉśµÄĪó²ī£¬¼ĘĖć¹«Ź½ČēŹ½£Ø8£©ĖłŹ¾£ŗ

[HLoss=W�¤||Lt-L*t||2] £Ø8£©

Ź½£Ø7-8£©ÖŠ£ŗW±ķŹ¾¶žÖµ»Æ¾ŲÕó£¬µ±Äæ±źÖŠ¹Ų¼üµćµÄ±źĒ©´ęŌŚŹ±£¬WÖµĪŖ1£¬·ńŌņĪŖ0£»StŗĶ[S*t]·Ö±š±ķŹ¾µŚt½×¶Ī×ĖĢ¬¼ģ²ā²ćÖŠ¹Ų½ŚČČ¶ČĶ¼Ō¤²āµÄŗĶŹµ¼ŹµÄ¹Ų¼üµć×ų±źÖµ£¬LtŗĶ[L*t]·Ö±š±ķŹ¾µŚt½×¶Ī×ĖĢ¬¼ģ²ā²ćÖŠPAFŌ¤²āµÄŗĶŹµ¼ŹµÄ¹Ų¼üµć×ų±źÖµ�£

MSE±ķŹ¾Ä£ŠĶÖŠĆæøö·ÖÖ§²ćµÄĖšŹ§ÖµÖ®ŗĶ£¬øĆÖµŌ½µĶ£¬±ķŹ¾Ō¤²ā½į¹ūÓėÄæ±ź½į¹ūŌ½½Ó½ü£¬Ä£ŠĶµÄŌ¤²āŠ§¹ūŌ½ŗĆ�£

ĪŖĮĖÖ¤Ć÷øÄ½ųĖć·ØµÄÓÅŌ½ŠŌ£¬ŌŚĶ¬ŃłµÄŹż¾Ż¼ÆÉĻ½ųŠŠ²»Ķ¬Ö÷øÉĢŲÕ÷ĶųĀēĻĀµÄ¶Ō±ČŹµŃé£¬ŌŚ²æ·ÖĶ¼Ę¬ÉĻµÄ¼ģ²ā½į¹ūČēĶ¼6ĖłŹ¾£¬¶Ō±Č½į¹ūČē±ķ1ĖłŹ¾�£´Ó±ķ1ÖŠæÉŅŌæ´³ö±¾ĪÄ·½·Ø¶Ō±ČŌ·½·ØPCKĢįÉżĮĖ2.8%£¬APĢįÉżĮĖ2.0%£¬MSEÖµ¼õŠ�ĮĖ12.4%£¬ÓŠŠ§ĢįøßĮĖ¹Ē÷Ą¹Ų¼üµćµÄ¼ģ²āŠ§¹ū£¬½µµĶĮĖŌ¤²ā½į¹ūÓėÄæ±ź½į¹ūµÄĖšŹ§£»´ÓĶ¼6ÖŠæÉŅŌæ´³ö±¾ĪÄ·½·ØŌŚ¶ąČĖ³�¾°ĻĀµÄ×ĖĢ¬¹Ą¼ĘŠ§¹ūøüÓÅ�£

±ķ1 ø÷Ä£ŠĶŠŌÄÜĘĄ¹ĄÖø±ź¶Ō±Č½į¹ū

Tab. 1 Comparison results of performance evaluation

indicators for different models

[Ö÷øÉĢŲÕ÷ĶųĀē PCK / % AP / % MSE MobileNetV1 76.8 53.7 146.4 MobileNetV2 77.1 54.4 138.5 MobileNetV1+IR 75.9 54.0 135.7 MobileNetV1+CBAM 77.9 55.2 133.7 ±¾ĪÄ·½·Ø 79.6 55.7 130.2 ]

3.3 Ä£ŠĶŅĘÖ²½į¹ū·ÖĪö

ŅŌŌŚCOCOŹż¾Ż¼ÆÉĻŃµĮ·¹żµÄøÄ½ųÄ£ŠĶĪŖŌ¤ŃµĮ·Ä£ŠĶ£¬¶ŌŠŠĪŖŹż¾Ż¼Æ±ź¼Ē¹Ē÷Ą¹Ų¼üµć×ö·ÖĄąŃµĮ·£¬½«ŃµĮ·Ķź³ÉŗóµÄÄ£ŠĶŅĘÖ²ÖĮJetson TX2Éč±øÉĻ£¬øĆÉč±øŌŚŠŠĪŖŹż¾Ż¼ÆÉĻĶĘĄķ½į¹ūµÄ»ģĻż¾ŲÕóČē±ķ2ĖłŹ¾£¬¾ŲÕó¶Ō½ĒĻßÉĻµÄŹżÖµ±ķŹ¾øĆŠŠĪŖŹ¶±šµÄ×¼Č·ĀŹ£¬¼ĘĖć·½·ØČēĻĀ£ŗÖ»Źä³öŹ¶±šÕżČ·ŠŠĪŖµÄŹżĮæÕ¼×ÜŹżĮæµÄ±ČĄż£¬²»Ķ³¼ĘĀ©¼ģµÄĒéæö�£´Ó±ķ2ÖŠæÉŅŌæ´³öÄ£ŠĶ¶Ō8ĄąŠŠĪŖµÄ×ŪŗĻŹ¶±šĀŹ´ļµ½96.4%�£

±ķ2 ŠŠĪŖŹ¶±š»ģĻż¾ŲÕó

Tab. 2 Behavior recognition confusion matrix

[ŠŠĪŖ

ÖÖĄą Ź¶±šĀŹ / % Č»÷ ¹ÄÕĘ »ÓŹÖ ×ų ÅÜ ×ß Õ¾Į¢ ĶäŃü Č»÷ 99.6 0 0.4 0 0 0 0 0 ¹ÄÕĘ 0 93.4 3.4 0 1.6 0.4 1.2 0 »ÓŹÖ 0.4 1.8 95.6 0 0.2 0.2 1.8 0 ×ų 0 0 0 96.4 0 0.2 0 3.4 ÅÜ 0 1.2 1.6 0 95.4 1.4 0.4 0 ×ß 0 0 0 0 3.2 95.6 1.2 0 Õ¾Į¢ 0 0 1.0 0 0.8 1.6 96.6 0 ĶäŃü 0 0.2 0 0 0 1.2 0 98.6 ]

½«±¾ĪÄµÄøÄ½ų·½·ØÓė°üŗ¬ĻąĶ¬ŠŠĪŖĄą±šµÄĻą¹ŲŠŠĪŖŹ¶±šŃŠ¾æ·½·Ø½ųŠŠ¶Ō±Č£¬½į¹ūČē±ķ3ĖłŹ¾�£´Ó±ķ3ÖŠæÉŅŌæ´³ö±¾ĪÄ·½·Ø¶Ō±ČĻą¹ŲŃŠ¾æ·½·ØŌŚÕ¾Į¢ŗĶ×ßĀ·ŠŠĪŖµÄŹ¶±š×¼Č·ĀŹÉĻĀŌĪ¢²»×ć£¬µ«ŹĒ¶Ō×ųŗĶĶäŃüŠŠĪŖµÄŹ¶±šŠ§¹ūĆ÷ĻŌĢįÉż£Ø�°/�±±ķŹ¾¶ŌÓ¦·½·ØÖŠµÄŠŠĪŖŹ¶±š²»°üĄØøĆĄąŠŠĪŖ£©�£

±¾ĪÄµÄøÄ½ų·½·ØÓėŌŹ¼Ä£ŠĶ¼°Ļą¹ŲŠŠĪŖŹ¶±šŃŠ¾æ·½·ØµÄĘ½¾łŹ¶±šŠ§¹ūČē±ķ4ĖłŹ¾£¬æÉŅŌŃéÖ¤±¾ĪÄøÄ½ų·½·ØŌŚĘ½¾łŹ¶±šŠ§¹ūÉĻµÄÓÅŌ½ŠŌ�£

±ķ3 Ļą¹ŲŠŠĪŖŹ¶±šŃŠ¾æ½į¹ū¶Ō±Č

Tab. 3 Comparison results of research on related behavior recognition

[·½·Ø Ź¶±šĀŹ / % Õ¾Į¢ ×ų ×ß ĶäŃü ²Īæ¼ĪÄĻ×£Ū6£Ż 87.7 83.5 79.3 / ²Īæ¼ĪÄĻ×£Ū15£Ż 100.0 / 97.3 83.3 ²Īæ¼ĪÄĻ×£Ū16£Ż 100.0 89.0 95.3 / ±¾ĪÄ·½·Ø 96.6 96.4 95.6 98.6 ]

±ķ4 Ļą¹ŲŠŠĪŖŹ¶±šŃŠ¾æĘ½¾łŹ¶±šĀŹ¶Ō±Č

Tab. 4 Comparison of average recognition rates in related behavior recognition research

[·½·Ø ŠŠĪŖŹżĮæ Ę½¾łŹ¶±šĀŹ / % MobileNetV1 8 89.25 ²Īæ¼ĪÄĻ×£Ū6£Ż 5 82.56 ²Īæ¼ĪÄĻ×£Ū15£Ż 11 96.04 ²Īæ¼ĪÄĻ×£Ū16£Ż 9 95.05 ±¾ĪÄ·½·Ø 8 96.40 ]

²æ·ÖŠŠĪŖµÄŹ¶±šŠ§¹ūČēĶ¼7ĖłŹ¾£¬æÉŅŌæ´³öŌŚ¼ņµ�³�¾°ĻĀĪŽøÉČÅĪļÕŚµ²Ź±£¬ŠŠĪŖŹ¶±šÄ£ŠĶµÄĶĘĄķ»ł±¾æÉŅŌŹµĻÖ¶Ō¹Ē÷Ą¹Ų¼üµćµÄ¼ģ²ā£¬²¢ĒŅ½Ļ×¼Č·µŲŹ¶±š³öČĖĢåµÄŠŠĪŖ£¬Ę½¾łĖŁ¶ČæÉŅŌ´ļµ½8.8 Ö�/s�£

4 ½į ĀŪ

±¾ĪÄĆęĻņ±ßŌµÉč±øĢį³öĮĖŅ»ÖÖøÄ½ųµÄĒįĮæ¼¶OpenPose×ĖĢ¬¼ģ²āÄ£ŠĶ£¬ŌŚ±ßŌµÉč±øÉĻ¼ę¹ĖŹµŹ±ŠŌŗĶŹ¶±šŠ§¹ū�£ŌŚĢŲÕ÷ĢįČ�²ćŹ¹ÓĆĒįĮæ¼¶µÄMobileNetĢę»»VGGNet£¬½µµĶĶĘĄķŹ±µÄ²ĪŹżĮæ£»ŌŚĶųĀēµÄĒ³²ćŹ¹ÓĆIR½į¹¹£¬Éī²ćĢķ¼ÓCBAM£¬ČŚŗĻĒ³²ćŗĶÉī²ćµÄĢŲÕ÷ŠÅĻ¢£»ŌŚ×ĖĢ¬¹Ą¼Ę²ćŹ¹ÓĆ3øö3�Į3¾ķ»ż´śĢę1øö7�Į7¾ķ»ż£¬±£Ö¤øŠŹÜŅ°²»±äµÄĶ¬Ź±½µµĶŌĖĖćĮæ�£ŌŚCOCOŹż¾Ż¼ÆÉĻµÄŃéÖ¤½į¹ū±ķĆ÷£¬øÄ½ų·½·ØÓėŌ·½·ØĻą±Č£¬PCKĢįÉżĮĖ2.8%£¬APĢįÉżĮĖ2.0%£¬MSEÖµ¼õŠ�ĮĖ12.4%�£

½«øĆÄ£ŠĶ×÷ĪŖŌ¤ŃµĮ·Ä£ŠĶŌŚŠŠĪŖŹż¾Ż¼ÆÉĻ±ź¼Ē¹Ē÷Ą¹Ų¼üµć½ųŠŠ·ÖĄąŃµĮ·£¬Ź¹ÓĆĶź³É·ÖĄąŃµĮ·µÄÄ£ŠĶ²æŹšŌŚ±ßŌµÉč±øÉĻ½ųŠŠĶĘĄķ²āŹŌ£¬æÉŅŌ½Ļ×¼Č·µŲ·Ö±ę³öŹż¾Ż¼ÆÖŠµÄ8ĄąŠŠĪŖ£¬Ę½¾łŹ¶±šĀŹ´ļµ½96.4%£¬Ę½¾łĖŁ¶Č´ļµ½8.8 Ö�/s£¬ÄÜ¹»ŌŚĢįÉżŹ¶±šŠ§¹ūµÄĶ¬Ź±Āś×ćÄ£ŠĶĶĘĄķµÄŹµŹ±ŠŌŠčĒó£¬µ«ŹĒøĆÄ£ŠĶŌŚø´ŌÓ³�¾°ĻĀµÄŠ§¹ū²¢Ī´ŃéÖ¤£¬Ī´Ą´æÉŅŌ×÷½ųŅ»²½µÄŃŠ¾æŗĶÓÅ»Æ�£