ĪÄÕĀ

�¶Īäŗŗ¹¤³Ģ´óŃ§Ń§±Ø�· 2018Äź04ĘŚ 455-461 ³ö°ęČÕĘŚ£ŗ2018-08-23 ISSN:1674-2869 CN:42-1779/TQ

Ņ»ÖÖ»łÓŚÉē½»ĶųĀēÓŃĒé¶ČµÄøöŠŌ»ÆĶĘ¼öĖć·Ø

Ėę×ÅĶųĀē¼¼Źõ·¢Õ¹ŗĶÉē½»ĶųĀē·žĪńµÄĶĘ¹ć£¬ČĖĄą½»ĶłČ«Ćę½ųČėŌŚĻßÉē½»ĶųĀē·žĪń£Øsocial networking services£¬ SNS£©Ź±´ś£Ū1£Ż£¬¹śÄŚĶāÖŖĆūSNSČēĪ¢²©�¢Ī¢ŠÅ�¢FaceBookŗĶTwitterµČ�£SNSÓĆ»§¹ęÄ£³ÖŠųĄ©´ó£¬ŠÅĻ¢½»»�øü¼Óæģ½Ż£¬Ķ¬Ź±ŌŚSNSµÄ»ł´�ÉĻÓÖŃÓÉģ³öŠķ¶ą¹¦ÄÜĒæ´óµÄÓ¦ÓĆ£¬ČēĪ¢ŠÅŌŚĻßÖ§ø¶�¢Š�³ĢŠņ¼°Ī¢ŠÅ¹«ÖŚŗÅµČ£¬Ź¹µĆSNSµÄ·žĪńÄŚČŻŌ½Ą´Ō½·įø»�£ŌŚSNSÖŠ£¬ÓĆ»§µÄ×Ō·¢²ĪÓė²śÉśĮĖ¾ßÓŠŅ»Š©Ć÷ĻŌĢŲÕ÷ŹōŠŌµÄÉē½»´óŹż¾Ż£¬Ö÷ŅŖµÄĢŲÕ÷ŹōŠŌŹĒ�°ÓĆ»§´´½ØµÄÄŚČŻ�±�¢�°½»»�ŠÅĻ¢�±¼°�°¹ŲĻµŠÅĻ¢�±�£ �°ÓĆ»§´´½ØµÄÄŚČŻ�±ŹĒÖøÓĆ»§×Ō¼ŗŌŚSNSÉĻ´´½ØµÄÄŚČŻ¼°ĘäĻą¹ŲŠÅĻ¢£¬Čē²©æĶÉĻµÄĢū×Ó�¢ŠÅĻ¢·¢²¼µÄŹ±¼äŗĶ±źĒ©ŠÅĻ¢µČ£»�°½»»�ŠÅĻ¢�±ŹĒÖøÓĆ»§¼ä½»»�µÄÄŚČŻ£¬ĄżČēĪ¢ŠÅÉĻÓĆ»§Ö®¼äµÄŠÅĻ¢´«Źä�¢ÅóÓŃČ¦µÄµćŌŽ�¢ĘĄĀŪµČ£»�°¹ŲĻµŠÅĻ¢�±¹¹³ÉŅ»øöÉē½»Č¦µÄŠÅĻ¢£¬´ś±ķSNSÓĆ»§Ö®¼äµÄÖ±½Ó»ņ¼ä½Ó¹ŲĮŖ¹ŲĻµ£¬ČēĪ¢ŠÅÉĻÅóÓŃČ¦�¢Ī¢²©µÄŗĆÓŃČ¦µČ�£ÕāĄąÉē½»´óŹż¾ŻŅŃ¾±»Ó¦ÓĆÓŚøöŠŌ»ÆĶĘ¼öĮģÓņµÄŃŠ¾æ£¬ĶŚ¾ņÓĆ»§µÄŠčĒóŗĶĘ«ŗĆ£¬¼°Ź±ĻņÓĆ»§ĶĘ¼öĀś×ćøöŠŌ»ÆŠčĒóµÄŠÅĻ¢£Ū2£Ż�£´«Ķ³µÄøöŠŌ»ÆĶĘ¼öĻµĶ³Ö÷ŅŖ»łÓŚĻąĖĘ¶ČµÄŠĶ¬¹żĀĖ£Øcollaborative filtering£¬ CF£©Ėć·ØĻņÓĆ»§Ģį¹©ĶĘ¼ö�£ĻąĖĘ¶ČµÄĖć·ØÖ÷ŅŖÓŠĘ¤¶ūŃ·Ļą¹ŲĻµŹż£Øpearson correlation coefficient£¬ PCC£©�¢ÓąĻŅĻąĖĘ¶Č£Øcosine similarity£¬ CS£©¼°½ÜæØµĀ¾ł·½²ī£Øjaccard?mean squared difference£¬ JMSD£©µČ·½·Ø£Ū3£Ż�£µ«ŹĒŅŌÉĻĖć·ØÖ»ŹŹŗĻÓŚĄūÓĆĆ÷Č·µÄŹż¾ŻŠÅĻ¢£ØČēÓĆ»§µÄĘĄ·Ö£©¼ĘĖćĻąĖĘ¶Č£¬¶ų´ó¶ąŹżÉē½»Źż¾Ż¶¼ŗ¬ÓŠŠķ¶ąŅžŹ½ŠÅĻ¢£¬ÕāŹ¹µĆ´«Ķ³µÄĶĘ¼öĻµĶ³²»ÄÜĶźČ«ŹŹŗĻ»łÓŚSNSµÄøöŠŌ»ÆĶĘ¼öŠčĒó�£´ĖĶā£¬ÓĆ»§ŌŚÉē½»Č¦ŠÅČĪ¹ŲĻµĆÜĒŠµÄÓĆ»§ŠÅĻ¢ŅŃ±»Šķ¶ąŃŠ¾æÖ¤Źµ¶ŌÓŚĢįÉżøöŠŌ»ÆĶĘ¼ö·žĪń·Ē³£ÓŠÓĆ£Ū4-6£Ż£¬Č»¶ų£¬ĻÖÓŠµÄĻąĖĘ¶ČĖć·Ø²»ŹŹŗĻÓŚŌŚĻßÉē½»ÓĆ»§Ö®¼äĒ×ĆÜ¹ŲĻµµÄ¶ČĮæ£¬ŅņĪŖ³żĮĖÓĆ»§´´½ØµÄÄŚČŻÖ®Ķā£¬ĖüĆĒŗÜÉŁ¹Ų×¢Éē½»´óŹż¾ŻµÄĘäĖü·½ĆęµÄĢŲÕ÷£¬øüĆ»ÓŠæ¼ĀĒÓĆ»§Ö®¼ä¹²ĻķµÄÖ÷ĢāŹżĮæ�£ ±¾ĪÄĢį³öĮĖŅ»ÖÖĆčŹöSNSÓĆ»§Ö®¼äĒ×ĆÜ¶ČµÄŠĀ·½·Ø�Ŗ�ŖÓŃĒé¶Č£¬²¢ĶØ¹ż½»»��¢ČŗĢåŗĶøöČĖČżÖÖĻąĖĘ¶ČĄ´¼ĘĖćÓŃĒé¶Č�£øĆ·½·Øæ¼ĀĒĮĖÉē½»´óŹż¾ŻµÄø÷ÖÖĢŲÕ÷£¬Ģį³öµÄøöŠŌ»ÆĶĘ¼öĻµĶ³³ä·ÖĄūÓĆÓĆ»§¹ŲŠÄµÄÖ÷ĢāŗĶŠĖČ¤¼°½ōĆÜ¹ŲĮŖµÄÓĆ»§µÄŠÅĻ¢£¬ĪŖSNSÓĆ»§ĶĘ¼öĀś×ćøöŠŌ»ÆŠčĒóµÄŠĖČ¤ŗĶÖ÷Ģā�£²¢Ź¹ÓĆø÷ÖÖĘĄ¹ĄÖø±źČēĘ½¾ł¾ų¶ŌĪó²ī£Ømean absolute error£¬MAE£©�¢¾«Č·¶ČPrecision�¢ÕŁ»ŲĀŹRecallŗĶF1ÖµµČ£¬ĘĄ¹ĄĖłĢį³öµÄĶĘ¼öĻµĶ³µÄŠŌÄÜŗĶĶĘ¼öÖŹĮæ£¬ŃéÖ¤ÓŃĒé¶ČŌŚøöŠŌ»ÆĶĘ¼öÖŠµÄÖŲŅŖ×÷ÓĆ£¬Ö¤ŹµĮĖ»łÓŚÓŃĒé¶ČµÄøöŠŌ»ÆĶĘ¼öĻµĶ³±Č»łÓŚPCCŗĶJMSDĖć·ØµÄCFĶĘ¼öĻµĶ³µÄŠŌÄÜŅŖÓÅŌ½£¬ĒŅĶĘ¼ö½į¹ūµÄÖŹĮæŅŖøß�£1��øöŠŌ»ÆĶĘ¼öĻµĶ³1.1��»łÓŚÉē½»ĶųĀē´óŹż¾ŻµÄøöŠŌ»ÆĶĘ¼öĻµĶ³øöŠŌ»ÆĶĘ¼öĻµĶ³ŹÕ¼Æ¹ŲÓŚÓĆ»§¶ŌĻīÄæµÄĘ«ŗĆµÄŠÅĻ¢£¬ĪŖÓĆ»§ĶĘ¼öĻ£Ķū»ńČ�µÄĻīÄæ�£¶ųÉē½»´óŹż¾ŻÖŠ°üŗ¬ĮĖĻŌŹ½»ņŅžŹ½ŠÅĻ¢£¬Čē²©ĪÄ�¢ÅóÓŃČ¦ŠÅĻ¢�¢¹Ų×¢�¢²©ĪÄŹ±¼äŗĶ±źĒ©ŠÅĻ¢µČ£¬ČēÄÜŗĻĄķµÄĄūÓĆÕāŠ©ŠÅĻ¢£¬ŌņæÉŅŌŌöĒæøöŠŌ»ÆĶĘ¼ö�£½üÄźĄ´£¬¹śÄŚĶāŅ»Š©Ń§ÕßŌŚ²»¶ĻÅ¬Į¦£¬ŹŌĶ¼ĄūÓĆŅžŹ½Źż¾ŻŠÅĻ¢Ą´øÄ½ųøöŠŌ»ÆĶĘ¼öĻµĶ³�£ČēÅĖŅ»ĢŚµČ£Ū5£ŻĢį³öŅ»ÖÖ»łÓŚŠÅČĪ¹ŲĻµŅžŗ¬ĻąĖĘ¶ČµÄÉē»į»ÆĶĘ¼öĖć·Ø£¬ĢįøßĮĖÉē»į»ÆĶĘ¼öĖć·ØµÄ¾«¶Č£»Įõ¾²µČ£Ū6£ŻĢį³öĮĖŅ»ÖÖøöŠŌ»ÆµÄ±źĒ©ĶĘ¼öĻµĶ³£¬Ź¹ÓĆÓĆ»§µÄ±ź¼ĒĄśŹ·ŗĶµŲĄķŠÅĻ¢Ą´Éś³É»łÓŚŃ§Ļ°·½·ØµÄĶĘ¼öĻµĶ³£»ÕŌŃĒ»ŌŗĶĮõČš£Ū7£ŻĢį³öĮĖ»łÓŚĘĄĀŪµÄŅžŹ½Éē½»¹ŲĻµ½ųŠŠøöŠŌ»ÆĶĘ¼ö�£µ«ŹĒ£¬Óėæ¼ĀĒSNSÓĆ»§¹ŲĮŖŠÅĻ¢ŅŌ»ńµĆĶĘ¼öµÄ·½·ØĻą±Č£¬ÉĻŹö·½·ØÄŃŅŌ³ä·Ö·´Ó³øöČĖĒćĻņ²¢ĒŅĶĘ¼ö½į¹ūµÄ×¼Č·¶Č½ĻµĶ�£1.2��»łÓŚČĖ¼Ź¹ŲĻµµÄøöŠŌ»ÆĶĘ¼öĻµĶ³»łÓŚČĖ¼Ź¹ŲĻµµÄøöŠŌ»ÆĶĘ¼ö·½Ź½æÉŅŌ·ÖĪŖ»łÓŚÓ°ĻģĮ¦µÄĶĘ¼öŗĶ»łÓŚÅóÓŃČ¦µÄĶĘ¼ö�£ŌŚSNSÉĻ±Ė´ĖĻą¹ŲµÄÓĆ»§µÄĘ«ŗĆĻąĖĘ¶ČŅŖøßÓŚ²»Ļą¹ŲÓĆ»§µÄĘ«ŗĆĻąĖĘ¶Č£¬ĖūĆĒÖ®¼äµÄ¹ŲĮŖŠÅĻ¢ĻŌČ»±Č²»Ļą¹ŲÓĆ»§µÄŠÅĻ¢øü¾ßÓŠĄūÓĆ¼ŪÖµ£Ū8£Ż�£1.2.1��»łÓŚÉē½»Ó°ĻģĮ¦µÄøöŠŌ»ÆĶĘ¼öĻµĶ³��»łÓŚÓ°ĻģĮ¦µÄĶĘ¼öĻµĶ³Ö÷ŅŖÓĆÓŚŠčŅŖ×ØŅµĮģÓņÖŖŹ¶µÄĶĘ¼ö£¬ČēŃ§Źõ»ņŠĀĪÅĮģÓņµÄĶĘ¼öĻµĶ³�£ĄżČē³ĀĮÖµČ£Ū9£Ż¶ØŅåĮĖ¶ŌŠĀĪÅ½ēÓ°Ļģ×Ø¼ŅÄ£ŠĶ£¬Ģį³öŅ»ÖÖŠĀÓ±µÄøöŠŌ»ÆŠĀĪÅĶĘ¼öĖć·Ø£»ĪÄĻ×£Ū10£Ż»łÓŚŃ§ŹõĖŃĖ÷Ę½ĢØArnetMiner£¬ČŚŗĻÉī¶ČŃ§Ļ°·½·Ø�¢Éē»įĶųĀē·ÖĪöŗĶÓļŅåĖŃĖ÷µČĻą¹Ų¼¼Źõ£¬½ųŠŠæēĒųÓņŠ×÷ĶĘ¼öÓėÓĆ»§Ļą¹ŲµÄ×Ø¼ŅŗĶĀŪĪÄ�£ 1.2.2��»łÓŚÅóÓŃČ¦µÄøöŠŌ»ÆĶĘ¼öĻµĶ³��¶ŌÓŚSNSÓĆ»§£¬ČĖĆĒøüĒćĻņÓŚ¹Ų×¢ŹģČĖŗĶÅóÓŃµÄŅā¼ū£¬»łÓŚÅóÓŃÖ®¼äŠÅČĪ½ųŠŠµÄĶĘ¼öøüČŻŅ×±»½ÓŹÜ£¬Ņņ´Ė»łÓŚÅóÓŃµÄŠÅĻ¢Ģį¹©µÄĶĘ¼öŠ§ĀŹøüøß�£µ«ŹĒŌŚSNSÖŠ£¬»łÓŚÅóÓŃµÄøöŠŌ»ÆĶĘ¼ö¶ŌÓŚÓĆ»§¹ŲĻµŹĒ¾łµČæ´´żµÄ£¬Ć»ÓŠæ¼ĀĒµ½ÓĆ»§Ö®¼ä¹ŲĻµŌ¶½üµÄĒ×ĆÜ¶Č£¬´ó¶ąŹżŃŠ¾æ¶¼ŹĒÕė¶ŌŅ»×é¾ßÓŠĻąĖĘŠĖČ¤ŗĶĘ«ŗĆµÄÉē½»ĶųĀē·žĪńÓĆ»§Ģį¹©ĶĘ¼ö£Ū11£Ż�£ČēĮõŗ£·å£Ū12£ŻĢį³öĮĖ»łÓŚŠÅČĪ¹ŲĻµµÄÉĢĘ·ĶĘ¼ö·½·Ø£¬øÄ½ųĮĖĶĘ¼öµÄŠŌÄÜ£¬²¢½ā¾ö¶ąŃłŠŌĶĘ¼öµÄĪŹĢā�£±¾ĪÄ×ŪŗĻ·ÖĪöÖī¶ąŃ§ÕßŃŠ¾æ³É¹ūµÄ»ł´�ÉĻ£¬ŃŠ¾æÓ°ĻģÓĆ»§¼äĒ×ĆÜ¶ČµÄø÷ÖÖŅņĖŲ£¬Ģį³ö»łÓŚÓŃĒé¶ČµÄøöŠŌ»ÆĶĘ¼öĻµĶ³£¬²¢¶ŌŹµŃé¹ż³ĢŗĶŹµŃé½į¹ū½ųŠŠ·ÖĪö£¬ĘĄ¹ĄĖłĢį³öĻµĶ³µÄŠŌÄÜŗĶĶĘ¼öÖŹĮæ�£2��»łÓŚÓŃĒé¶ČµÄøöŠŌ»ÆĶĘ¼öĻµĶ³½üÄźĄ´£¬¹śÄŚĶāŅ»Š©Ń§Õß¶Ō»łÓŚÓĆ»§Ö®¼äĒ×ĆÜ¶ČµÄøöŠŌ»ÆĶĘ¼ö·½·Ø½ųŠŠĮĖŅ»¶ØµÄŃŠ¾æ�£ČēĪÄĻ×£Ū13£Żæ¼ĀĒĮĖÓĆ»§»�¶ÆŗĶÉē½»Č¦ŠÅĻ¢Ą´¼ĘĖćĖūĆĒÖ®¼äµÄĒ×ĆÜ¶Č£¬Ģį³öŅ»ÖÖ»łÓŚĮŖĻµĒæ¶ČµÄøöŠŌ»ÆÄ£ŠĶĄ´ŌöĒæÉē½»·žĪń£¬øų³öĮĖøüøßÖŹĮæµÄĶĘ¼öŠÅĻ¢£»ĪÄĻ×£Ū14£ŻĢį³öŅ»ÖÖ×ŪŗĻŠÅČĪÄ£ŠĶ£¬¹¹½ØĮĖ»łÓŚÉē»įĶųĀē¹ŲĻµ·ÖĪöµÄ×ŪŗĻĶĘ¼öÄ£ŠĶ£¬Ó¦ÓĆ¾ŲÕó·Ö½ā¼¼ŹõĶĘ¶ĻĪ¢²©µÄÖ÷Ģā·Ö²¼ŗĶÓĆ»§µÄŠĖČ¤Č�Ļņ£¬ŹµĻÖĪ¢²©µÄøöŠŌ»ÆĶĘ¼ö�£µ«ŹĒ£¬ĻČĒ°µÄŃŠ¾æĆ»ÓŠæ¼ĀĒµ½Ó°ĻģÓŃĒé¶ČµÄø÷ÖÖŅņĖŲ£¬øüĆ»ÓŠ¶ŌÓ°ĻģŅņĖŲ½ųŠŠ¶ąĪ¬¶Č·ÖĪö£¬µ¼ÖĀĶĘ¼öŠÅĻ¢µÄ×¼Č·ŠŌŗĶ¾«¶Č²»øß£¬Ņņ´ĖŠčŅŖŅ»ÖÖŠĀµÄ·½·Ø·ÖĪöÓ°ĻģÓŃĒé¶ČµÄø÷ÖÖŅņĖŲ£¬ĄūÓĆĖüĆĒ¼ĘĖćÓŃĒé¶Č£¬Éč¼ĘŅ»ÖÖøßŠ§µÄøöŠŌ»ÆĶĘ¼öĻµĶ³�£2.1��ĶĘ¼öĖć·Ø»ł±¾Į÷³Ģ±¾ĪÄĢį³öµÄøöŠŌ»ÆĶĘ¼öĻµĶ³µÄĮ÷³ĢÖ÷ŅŖ·ÖĪŖŅŌĻĀ3øö½×¶Ī9øö²½Öč�£½×¶ĪŅ»£ŗ´¦ĄķĖłŠčµÄŹż¾Ż¼Æ£¬´Ė½×¶Ī·ÖĪŖ5øö²½Öč�£²½Öč1£ŗŌŚÉē½»·žĪńĶųÕ¾ÉĻ×�Č�ĶĘ¼öĮģÓņĻą¹ŲŅā¼ū¼°ĘĄĀŪŹż¾Ż¹¹½ØŹż¾Ż¼Æ£»²½Öč2£ŗŌŚŹż¾Ż¼ÆÖŠĢķ¼ÓÓėĶĘ¼öĮģÓņĻą¹ŲµÄÕżĆę�¢ÖŠŠŌ»ņøŗĆęµÄŅā¼ū´Ź´ŹÓļ£¬¹¹½ØŅā¼ū´Ź´Źµä£»²½Öč3£ŗøł¾ŻŅā¼ū´Źµä£¬·ÖĪöÓĆ»§Éś³ÉµÄÄŚČŻČēĪ¢²©ÉĻµÄ²©ĪÄ�¢´óÖŚµćĘĄĶųµÄĢłĪÄ�¢FaceBookÉĻµÄĢū×ÓµČ£¬øų³öÄŚČŻµÄ¼«ŠŌ£¬ČēÕżĆę�¢øŗĆę»ņÖŠŠŌ£»²½Öč4£ŗĶŚ¾ņ³öÓėĶĘ¼öĮģÓņ¼°ĘäĘĄĀŪŠÅĻ¢Ļą¹ŲµÄÓĆ»§£¬ĢįČ�ÓĆ»§µÄŹż¾ŻČēÓĆ»§IDÖµµČ£¬´´½ØÓĆ»§Éē½»Č¦µÄÓĆ»§¾ŲÕó£»²½Öč5£ŗĄūÓĆĒ°ĆęÄŚČŻµÄ¼«ŠŌ·ÖĪöµĆ·Ö¼°ÓĆ»§µÄ²Īæ¼ĻīÄæµÄ´ĪŹżµĆ·Ö£¬¼ĘĖćÓŃĒé¶Č¼°ĶĘ¼öĻµĶ³ÖŠÓĆµ½µÄŅžŹ½Ę«ŗĆÖµŗĶÖ÷Ģā·Ö²¼Öµ�£½×¶Ī¶ž£ŗ¼ĘĖćSNSÓĆ»§¼äÓŃĒé¶Č£¬·ÖĪŖ3øö²½Öč�£²½Öč6£ŗĄūÓĆSNSÓĆ»§¼äµÄ½»»�ŠÅĻ¢¼ĘĖć½»»�ĻąĖĘ¶Č£¬½»»�ŠÅĻ¢ČēĪ¢ŠÅÅóÓŃČ¦»ņĪ¢²©ÉĻµÄĘĄĀŪ�¢µćŌŽ»ņ×Ŗ·¢µČŠÅĻ¢£»²½Öč7£ŗŹ¹ÓĆÖ÷Ģā·Ö²¼Öµ¼°ŅžŹ½Ę«ŗĆÖµ£¬¼ĘĖćøöČĖĻąĖĘ¶Č£»²½Öč8£ŗŹ¹ÓĆSNSÉē½»Č¦ÓĆ»§ŠÅĻ¢¼ĘĖćÓĆ»§×éµÄĻąĖĘ¶Č�£ČŚŗĻŅŌÉĻ3øöĻąĖĘ¶Č£¬¼ĘĖć³öÓĆ»§¼äµÄÓŃĒé¶Č�£½×¶ĪČż£ŗ¹¹½ØĶĘ¼öĻµĶ³½ųŠŠĶĘ¼ö½×¶Ī�£²½Öč9£ŗĄūÓĆÓĆ»§¼äÓŃĒé¶Č�¢ŅžŹ½Ę«ŗĆÖµ¼°Ē°ĆęĖł¼ĘĖćµÄĻąĖĘ¶ČÖµ£¬¹¹½ØĶĘ¼öĻµĶ³£¬ĪŖÓĆ»§Ģį¹©øßÖŹĮæĶĘ¼ö½į¹ū�£2.2��ÓĆ»§´´½ØÄŚČŻµÄ¼«ŠŌ·ÖĄąÓĆ»§ŌŚSNSÉĻ·¢²¼µÄÄŚČŻÖŠ±ķ´ļĮĖ×Ō¼ŗµÄæ´·Ø£¬´ś±ķĮĖ×Ō¼ŗĒéŠ÷»ņøŠŹÜ�£øł¾ŻŌĻČ½ØĮ¢µÄŅā¼ū´Źµä£¬æÉŅŌ°ŃÓĆ»§Éś³ÉµÄÄŚČŻµÄ¼«ŠŌ£ØOD£©·ÖĄąĪŖÕżĆę�¢ÖŠŠŌ»ņøŗĆęµÄÄŚČŻ£¬·Ö±šŹż×Ö»ÆĪŖ 1£¬0£¬-1�£ 2.3��ÓĆ»§Ę«ŗĆÖµµÄ¼ĘĖć´ÓÓĆ»§Éś³ÉµÄŠÅĻ¢ÖŠĢįČ�¹Ų¼ü×Ö£Ø¼´ĻīÄæ£©ŗĶ°üŗ¬¹Ų¼ü×ÖµÄÖ÷Ģā£¬ÓĆ»§Ę«ŗĆ·ÖĪŖÓĆ»§ĻīÄæĘ«ŗĆŗĶÓĆ»§Ö÷ĢāĘ«ŗĆ�£øł¾ŻÄŚČŻµÄ¼«ŠŌŗĶÓĆ»§Éś³ÉÄŚČŻµÄ×ÜŹż¼ĘĖćĻīÄæĘ«ŗĆ[ru,i]£ŗ[ru,i=D�ŹDu,iODDu,i?] £Ø1£©Ź½£Ø1£©ÖŠ£¬Du£¬i±ķŹ¾ÓĆ»§u¹ŲÓŚĻīÄæiĖł´´½ØµÄÄŚČŻµÄ¼ÆŗĻ�£ÓĆ»§µÄÖ÷ĢāĘ«ŗĆŹĒÓĆ»§øß¼¶Ę«ŗĆ£¬ŌŚÕāĄļŅŌÖ÷Ģā·Ö²¼ÖµĄ´±ķŹ¾£¬±¾ĪÄĶØ¹żŹ¹ÓĆÓėÖ÷ĢātĻą¹ŲĮŖµÄÓĆ»§Éś³ÉµÄÄŚČŻµÄ×ÜŹżµÄ·Ö²¼[¦Ču,t]ÖµĄ´¼ĘĖć�£Ėć·ØČēŹ½£Ø2£©£ŗ[¦Ču,t=|Du,t||Du|] £Ø2£©Ź½£Ø2£©ÖŠ£¬DuŹĒ¹ŲÓŚÓĆ»§uÄŚČŻµÄ¼ÆŗĻ�¢Du£¬tÓėÓĆ»§uĻą¹ŲµÄÖ÷ĢātµÄÄŚČŻµÄ¼ÆŗĻ�£2.4��ÓŃĒé¶ČµÄ¼ĘĖćŌŚSNSÖŠ£¬×ŪŗĻæ¼ĀĒÓ°ĻģÓĆ»§ÓŃĒé¶ČµÄ¶ąÖÖŅņĖŲ£¬ÓĆ3ÖÖĻąĖĘ¶ČĄ´¼ĘĖćÓĆ»§Ö®¼äµÄÓŃĒé¶Č�£Õā3ÖÖĻąĖĘ¶Č·Ö±šŹĒøöČĖĻąĖĘ¶ČP�¢½»»�ĻąĖĘ¶ČIŗĶČŗĢåĻąĖĘ¶ČG£¬Čē±ķ1ĖłŹ¾�£2.4.1��øöČĖĻąĖĘ¶Č øöČĖĻąĖĘ¶Č±ķŹ¾SNSÉĻÓĆ»§Éś³ÉÄŚČŻÖ®¼äµÄĻąĖĘ¶Č£¬æÉŅŌĶØ¹żĻīÄæµÄĘ«ŗĆÖµŗĶÖ÷Ģā·Ö²¼Ą´¼ĘĖć�£ÓĆ»§Éś³ÉµÄÄŚČŻ»įÉę¼°µ½ø÷ÖÖĻ²ŗĆ¼°ŠĖČ¤£¬ĢŲ±šŹĒŌŚĄąĖĘÓŚ´óÖŚµćĘĄ�¢Ī¢²©µČÉē½»ĶųÕ¾ÉĻ£¬ŌŚ¼ĘĖćÓĆ»§¶ŌĻīÄæµÄĘ«ŗĆŹ±£¬¹²Ķ¬ŠĖČ¤µÄ±ČĄż±Č½ö¼ĘĖćÓĆ»§Ę«ŗĆĻąĖĘ¶ČøüĪŖÖŲŅŖ�£Ņņ´Ė£¬±¾ĪÄĄūÓĆJMSDĖć·Ø£¬Ą´¼ĘĖćÓĆ»§Ö®¼äµÄĘ«ŗĆĻąĖĘ¶Č�£[¦ŅJMSD]ĪŖ¾ł·½²ī£Ømean squard difference£¬MSD£©ŗĶJaccardĻµŹżµÄ³Ė»ż�£±¾ĪÄÖŠMSDĻµŹż±ķŹ¾ÓĆ»§uŗĶfµÄĻīÄæĘ«ŗĆÖµÖ®¼äµÄ²īŅģµÄĘ½¾łÖµ£¬ÓĆ[¦ŅMSD]±ķŹ¾£¬JaccardĻµŹż[J(u,f)]ŹĒSNSÉĻÓĆĄ´¼ĘĖćÓĆ»§¹²Ķ¬ŠĖČ¤µÄ±ČĀŹ�£¼ĘĖć·½·Ø·Ö±šČēĻĀ£ŗ[¦ŅMSD(u,f)=i�ŹIdiu,fdu,f] [J(u,f)=|ru?rf||ru?rf|=du,f|ru|+|rf|-|du,f|]ĘäÖŠ[diu,f]±ķŹ¾ÓĆ»§uŗĶf¹ŲÓŚĻīÄæiµÄĘ«ŗĆÖµÖ®²īµÄĘ½·½£¬[du,f]ĪŖŅ»×é[diu,f]�£Čē¹ū[ru,i]ŗĶ[rf,i]½Ō²»null £¬[diu,f=£Øru,i-rf,i)2?]£¬·ńŌņ[diu,f=null]£»[ru]ŗĶ[rf]·Ö±š±ķŹ¾ÓĆ»§uŗĶfµÄŅ»×éĘ«ŗĆÖµ�£ŌņJMSDµÄĖć·ØČēŹ½£Ø4£©ĖłŹ¾£ŗ [¦ŅJMSD(u,f)=¦ŅMSDu,f�ĮJu,f?] £Ø4£©SNSÓĆ»§´´½Ø´óĮæÓėĶĘ¼öĮģÓņÖ÷ĢāĻą¹ŲµÄÄŚČŻ£¬ÓĆ»§¼äµÄ¹ŲĻµŌ½Ē×ĆÜ£¬ÓĆ»§Ö®¼ä½»Į÷µÄµÄÖ÷Ģā·¶Ī§¾ĶŌ½¹ć£¬¶ųĒŅSNSÓĆ»§Ö®¼äµÄÖ÷ĢāµÄĻąĖĘ¶ČŹĒŹµĻÖøöŠŌ»Æ¼ģĖ÷µÄÖ÷ŅŖŌŖĖŲÖ®Ņ»�£Ņņ´Ė£¬øöČĖĻąĖĘ¶ČµÄ¼ĘĖć²»½öæ¼ĀĒĻīÄæŠÅČĪ£¬»¹ŅŖæ¼ĀĒÓĆ»§¹²ĻķµÄÖ÷ĢāŹżĮæ¼°Ö÷ĢāµÄĻąĖĘ¶Č£¬ŅŌ±ćŌŚĶĘ¼öĮģÓņøł¾ŻøöČĖĒćĻņĢį¹©øßÖŹĮæµÄĶĘ¼ö½į¹ū�£ÓĆ»§¼äµÄÖ÷ĢāĻąĖĘ¶ČæÉŅŌĶØ¹żŹ¹ÓĆÉ¢¶Č£Økullback-leibler divergence£¬KL£©¼ĘĖć£Ū15£Ż�£Ėć·ØČēŹ½£Ø5£©ĖłŹ¾£ŗ[QA(u,f)=1¦ÅKL(¦Ču,t||¦Čf,t+1)] £Ø5£©ŌņøöČĖĻąĖĘ¶Č¼ĘĖćŹ½ČēŹ½£Ø6£©£¬Č�ĻīÄæŠÅČĪ¶ČŗĶÖ÷ĢāĻąĖĘ¶ČµÄ¼ÓČØÖ®ŗĶ£¬±ķŹ¾ĻīÄæÓėÓĆ»§Ģį¼°µÄÖ÷ĢāµÄĻąĖĘ¶Č�£[SimP(u,f)=¦ĮP?QT(u,f)+¦ĀP?QA(u,f)] £Ø6£©Ź½£Ø6£©ÖŠ[¦ĮP+¦ĀP=1]�£ 2.4.2��½»»�ĻąĖĘ¶Č��ŌŚSNSÖŠ£¬ÓĆ»§ĶØ¹żŠÅĻ¢µÄ½»»�Ą´·ÖĻķ±Ė´ĖµÄŗĆ¶ń¼°ĒéøŠ£¬ČōÓĆ»§µÄŗĆ¶ń»ņĘ«ŗĆĻąĖĘ£¬ŌņĖūĆĒ»į»ż¼«·ÖĻķŠÅĻ¢�£Ņņ´Ė½»»�ĻąĖĘ¶ČæÉŅŌĶØ¹żÓĆ»§Ö®¼ä�°»�¶ÆµÄ¹ć¶ČŗĶÉī¶Č�±Ą´ŗāĮæ£¬ÓĆ»§Ö®¼äµÄ½»»�ĻąĖĘ¶ČÓÖŹĒ¼ĘĖćÓŃĒé¶ČµÄÖŲŅŖŅņĖŲ�£ŌŚŠķ¶ąÉē½»ĶųÕ¾ÖŠ£¬ÓĆ»§¶¼æÉŅŌĶØ¹ż×Ŗ·¢�¢ĘĄĀŪ�¢¹Ų×¢�¢»Ųø´µČ¹¦ÄÜ½ųŠŠĻą»�½»»�£¬Ņņ´ĖæÉŅŌŹ¹ÓĆÕāŠ©ŠÅĻ¢£¬Óė½»»�ĘµĀŹ�¢½»»�½üŅņµČŹōŠŌ½įŗĻĘšĄ´¹²Ķ¬¼ĘĖć½»»�ĻąĖĘ¶Č�£Ź×ĻČ£¬¼ĘĖćSNSÓĆ»§µÄ½»»�ĘµĀŹ�£ÓĆ»§½»»�ĘµĀŹ·´Ó³ĮĖÓĆ»§Ö®¼äµÄ¹ŲĻµµÄŌ¶½ü£¬¹ŲĻµ½üµÄÓĆ»§»įĘµ·±µÄ»ż¼«½»Į÷£¬½»Į÷µÄŠÅĻ¢Ņ²øüÓŠ¼ŪÖµ�£ÓĆ»§½»»�ĘµĀŹĖć·ØČēŹ½£Ø7£©ĖłŹ¾£¬ĘäÖŠq£Øu£¬f£©±ķŹ¾ÓĆ»§uŗĶfĮŖĻµµÄ´ĪŹż�£[QI(u,f)=lg{1+q(u,f)}????if{q(u,f)<10}1????????????????????????if{q(u,f)«Ń10}] £Ø7£©Ęä´Ī¼ĘĖć½»»�½üŅņŗĶ½»»�Ź±³¤Ņņ×Ó�£½»»�½üŅņŗĶ½»»�Ź±³¤Ņņ×ÓŹĒÓėÓĆ»§Ö®¼äµÄĮŖĻµŹ±¼äĆÜĒŠĻą¹ŲµÄČØÖŲ�£SNS´óŹż¾ŻÖŠ£¬×īŠĀµÄŠÅĻ¢·Ē³£ÖŲŅŖ£¬×ī½üµÄĮŖĻµŅāĪ¶×ÅÓĆ»§·ÖĻķµ±Ē°µÄŠĖČ¤£¬Ņņ´ĖÓĆ»§×ī½üŹĒ·ń½Ó´�¹żŹĒŗāĮæĒ×ĆÜ¹ŲĻµµÄ¹Ų¼üŅņĖŲ�£ÓĆ»§[u]ŗĶ[f]µÄ½»»�½üŅņæÉ±ķŹ¾ĪŖŹ½£Ø8£©ĖłŹ¾£ŗ[QRu,f=Ru,fLu] £Ø8£©R£Øu£¬f£©±ķŹ¾ÓĆ»§uŗĶf×ī½üŅ»´ĪĮŖĻµµ½µ±Ē°Ź±¼äĖł¾¹żµÄŹ±¼ä£¬L£Øu£©±ķŹ¾ŹÕ¼ÆÓĆ»§uµÄŹż¾ŻµÄŹ±¼ä�£Ņ»°ćµŲ£¬ŌŚSNSÖŠÓėĖūČĖ½»»�Ź±¼ä½Ļ³¤µÄČĖµÄŠÅĻ¢±Č½»»�Ź±¼ä½Ļ¶ĢÉõÖĮĆ»ÓŠ¹µĶØµÄČĖµÄŠÅĻ¢øüÖŲŅŖ£¬Čē¹ūÓĆL£Øu£¬f£©±ķŹ¾ÓĆ»§uŗĶfÖ®¼äµÄŅ»´Ī½»»�Ź±³¤£¬Ōņ½»»�Ź±³¤Ņņ×ÓĖć·ØČēŹ½£Ø9£©ĖłŹ¾£ŗ[QLu,f=Lu,fLu] £Ø9£©±¾ĪÄ½»»�ĻąĖĘ¶ČŹĒĶØ¹ż¶Ō[QI(u,f)]£¬[QRu, f]ŗĶ[QLu,f]3øöČØÖŲÖµ½ųŠŠ¼ÓČØĄ´¼ĘĖćµÄ£¬ČēŹ½ £Ø10£©ĖłŹ¾£ŗ[SimI(u,f)=¦ĮI?QI(u,f)?+¦ĀI??QR(u,f)+¦ÖI?QL(u,f)] £Ø10£©ĘäÖŠ[¦ĮI+¦ĀI+¦ÖI=1]�£2.4.3��ČŗĢåĻąĖĘ¶Č��ČŗĢåĻąĖĘ¶ČŹĒÖø²»Ķ¬ÓĆ»§ŌŚSNSÉĻĖłŹōÉē½»Č¦µÄĻąĖĘ¶Č£¬æÉŅŌÓĆĄ´ŗāĮæÓĆ»§ÓėĖūµÄÅóÓŃÖ®¼äµÄĒ×ĆÜ¹ŲĻµ�£ŌŚSNSµÄÉē½»Č¦Ąļ£¬ÓĆ»§ĒćĻņÓŚ½«ÓėĖūĆĒĆÜĒŠ½Ó´�»ņ¾ßÓŠĄąĖĘŠĖČ¤µÄÓĆ»§×÷ĪŖĖūĆĒµÄÅóÓŃ£¬Ņņ´ĖÓµÓŠĄąĖĘÅóÓŃĮŠ±ķµÄ²»Ķ¬ÓĆ»§ĖłŌŚÉē½»Č¦ĻąĖĘ¶Č½Ļøß£¬¼´ČŗĢåĻąĖĘ¶Č½Ļøß�£ĖłŅŌæÉŅŌĶØ¹żÓĆ»§uŗĶf¹²ĻķµÄÅóÓŃµÄ±ČĀŹĄ´¼ĘĖću£¬fĖłŌŚÉē½»Č¦µÄĻąĖĘ¶Č�£ŌŚSNSÉē½»Č¦Ąļ£¬ÓĆ»§ÅóÓŃ¹ŲĻµæÉ·ÖĪŖÖ±½ÓŗĶ¼ä½ÓÅóÓŃ¹ŲĻµ�£ĶØ¹ż¼ä½ÓÅóÓŃ¹ŲĻµ£¬Ņ²æÉŅŌ»ńČ�ÓĆ»§Éē½»Č¦ÖŠÓŠÓĆµÄŠÅĻ¢ŗĶ×ŹŌ´�£±¾ĪÄÓĆÅóÓŃ¼¶±šµÄøÅÄīĄ´ĆčŹöČŗĢåĻąĖĘ¶Č�£ČēĶ¼1ĖłŹ¾£¬½«ÓĆ»§uµÄÖ±½Ó¹ŲĮŖÅóÓŃµÄ¼¶±š¶ØŅåĪŖŅ»¼¶£¬±ķŹ¾ĪŖFu1£¬ÓĆ»§¼ä½Ó¹ŲĮŖ£ØµŚn²ć¼¶£©ÅóÓŃµÄ¼¶±š¶ØŅåĪŖn¼¶£¬ŅŌFun±ķŹ¾£¬ĄżČēFu2±ķŹ¾ÓĆ»§uµÄĮ½øö±ßŌµÄŚĮ¬½ÓµÄŅ»×éÓĆ»§�£ŌŚ´ó¶ąSNSÖŠ£¬¼øŗõĖłÓŠµÄÓĆ»§µÄÅóÓŃÓĆ»§¶¼ŌŚ6²ćŅŌÄŚ£¬¼´n=6�£½įŗĻJaccardĻµŹż£¬ŌņÓĆ»§ČŗĢåĻąĖĘ¶ČµÄĖć·Ø±ķŹ¾Ź½£Ø11£©ĖłŹ¾£ŗ[SimG(u,f)=¦ĮG|F1u?F1f||F1u?F1f|+¦ĀG|F2u?F2f||F2u?F2f|+?+ ¦ÖG|Fnu?Fnf||Fnu?Fnf|] £Ø11£© ĘäÖŠ[(¦ĮG+¦ĀG+...+¦ÖG=1)]�£2.4.4��ÓŃĒé¶ČµÄ¼ĘĖć��ŌŚSNSÖŠ£¬±¾ĪÄÓĆÓŃĒé¶ČĄ´¶ČĮæÓĆ»§Ö®¼äµÄĒ×ĆÜ¹ŲĻµ£¬øł¾ŻĒ°ĪÄ·ÖĪöÓŃĒé¶ČÖ÷ŅŖĢåĻÖŌŚøöČĖĻąĖĘ¶Č�¢½»»�ĻąĖĘ¶ČŗĶČŗĢåĻąĖĘ¶Č¼øøöÖŲŅŖµÄ·½Ćę£¬×ŪŗĻŹ½£Ø6£©�¢Ź½£Ø10£©ŗĶŹ½£Ø11£©3ÖÖĻąĖĘ¶ČĖćŹ½£¬±¾ĪÄSNSÖŠÓŃĒé¶Č[QFu,f]Ėć·ØČēŹ½£Ø12£©ĖłŹ¾£ŗ[QFu,f=¦ÄSimP(u,f)£¬SimI(u,f)£¬SimG(u,f)]£Ø12£©ĘäÖŠ£¬[¦Ä]±ķŹ¾øł¾ŻĆæøöŌŖĖŲµÄÖŲŅŖŠŌĢį¹©ČØÖŲÖµ²īŅģµÄ¼ÓČØŹøĮæ�£ŌŚÉē½»ĶųĀēÖŠ£¬Ö±½Ó»ņ¼ä½Ó¹ŲĮŖµÄÓĆ»§µÄŠÅĻ¢±ČĪ´¹ŲĮŖµÄÓĆ»§µÄŠÅĻ¢øüĪŖÖŲŅŖ£¬øł¾ŻÕāŠ©ÓĆ»§µÄŠÅĻ¢½įŗĻÓĆ»§ÓŃĒé¶ČŗĶÉē½»Č¦ÅóÓŃµÄ¼¶±šµÄ¶ØŅå£¬øų³ö¶ŌÓĆ»§u¹ŲÓŚĻīÄæiµÄĘ«ŗĆÖµŌ¤²āŹ½£¬ČēŹ½£Ø13£©ĖłŹ¾£ŗ[pu,f=ru+f�ŹF1u?Fnu(rf,i-rf)*QF(u,f)f�ŹF1u?FnuQF(u,f)] £Ø13£©Ź½£Ø13£©ÖŠ[ru]ŗĶ[rf]ŹĒÓĆ»§uŗĶf¶ŌĖłÓŠĻīÄæµÄĘ½¾łĘ«ŗĆÖµ£¬[rf,i]ŹĒÓĆ»§f¶ŌĻīÄæiµÄĘ«ŗĆÖµ�£3��½į¹ūÓėĢÖĀŪ3.1��ŹµŃé»·¾³ÓėŹż¾Ż¼ÆµÄŃ�Č�ŹµŃé»·¾³ĪŖIntel Xeon E5-2630*2CPU�¢32 GB DDR4ÄŚ´ę�¢3 TB Sata3Ó²ÅĢ�¢Windwos Server 2008ĻµĶ³·žĪńĘ÷£¬ŹµŃéŹż¾Ż¼ÆĄ´Ō´ÓŚŠĀĄĖĪ¢²©ŅōĄÖ¼°µēÓ°2018Äź1ŌĀ·ŻĄÖĘĄ¼°Ó°ĘĄ²©ĪÄŹż¾ŻµÄ×�Č�£¬¹²28²æŌŚ¹śÄŚÉĻÓ³µÄµēÓ°ŗĶŃĒÖŽŅōĄÖÅÅŠŠ°ń60Ź×ŅōĄÖ�¢8 138 315ĢõĘĄĀŪ²©ĪÄŗĶ2 368 372øöĪ¢²©»įŌ±Ļą¹ŲµÄŠÅĻ¢�£¾¹żÕūĄķ£¬ŹµŃéÖŠ°ŃøĆŹż¾Ż¼Æ·ÖĪŖĘĄĀŪ²©ĪÄŠÅĻ¢�¢Ī¢²©»įŌ±¹ŲĻµŠÅĻ¢ŗĶĘĄĀŪŅā¼ū´Źµä�£²©ĪÄŠÅĻ¢ÓŠ²©ĪÄID�¢²©ĪÄÄŚČŻ�¢·¢±ķŹ±¼ä�¢×Ŗ·¢Įæ�¢»Ųø´Źż�¢¹Ų×¢Įæ�¢µćŌŽĮæ�¢²©Ö÷ID�¢¶Ō²©ĪÄµÄĘĄĀŪ¼°¹Ų×¢ÕßµÄĪ¢²©»įŌ±ID£»Ī¢²©»įŌ±¹ŲĻµŠÅĻ¢°üĄØÓŠĪ¢²©»įŌ±µÄID�¢»įŌ±Ćū¼°»įŌ±¹Ų×¢ÕßµÄID¼°»įŌ±Ćū£»Ņā¼ū´ŹµäÖ÷ŅŖ°üĄØµēÓ°µÄÕżøŗĆę´Ź»ćĮŠ±ķ£¬ÓĆĄ´±źÖ¾µēÓ°ĘĄĀŪ²©ĪÄµÄ¼«ŠŌĒéæö�£3.2��ŹµŃé¹ż³Ģ·ÖĪöŹµŃé¶ŌŹż¾Ż¼Æ½ųŠŠĮĖ½»²ęŹµŃé£¬ÄæµÄŹĒ·ÖĪöĘĄ¹Ą±¾ĪÄĖłĢį³öµÄøöŠŌ»ÆĶĘ¼öĻµĶ³�£ŹµŃéÖŠ£¬°ŃĪ¢²©»įŌ±Źż¾Ż¼Æ·Ö³ÉĮ½²æ·Ö£¬Ęä20%ÓĆÓŚ²āŹŌÓĆ»§¼Æ�¢80%ŹÓĪŖŃµĮ·ÓĆ»§¼Æ£¬²¢½ØĮ¢ĮĖÓĆ»§¶ŌÓĆ»§µÄÓŃĒé¶Č¾ŲÕó£¬»łÓŚ½»»�ĻąĖĘ¶ČµÄæ¼ĀĒ£¬20£�ÓėĘäĖūÓĆ»§»ż¼«»�¶ÆµÄ»īŌ¾ÓĆ»§ŹĒ²āŹŌÓĆ»§�£ŌŚŹż¾Ż¼ÆÖŠ£¬ŹµŃéÖŠŹ¹ÓĆĮĖ28øöµēÓ°ŗĶ60øöŅōĄÖ¹²88øöĻīÄæ£¬µ«µēÓ°ĘĄĀŪ»īŌ¾ÓĆ»§Ģį¼°µÄĻīÄæŹżĮæĘ½¾łÖµ´óŌ¼ĪŖ10øö�¢ŅōĄÖĘĄĀŪ»īŌ¾ÓĆ»§´óŌ¼ĪŖ16øö�£¶Ō²āŹŌ¼ÆŗĻŹ¹ÓĆLeave-One-Out½»²ęŃéÖ¤£Ū16£Ż�£Ź×ĻČ»łÓŚ²āŹŌ¼Æ£¬¼ĘĖćÓĆ»§Ö®¼äµÄÓŃĒé¶Č£¬½ØĮ¢ÓĆ»§-ÓĆ»§ÓŃĒé¶Č¾ŲÕó£¬»łÓŚ´Ė¾ŲÕó¼ĘĖćÓĆ»§¼ä½»»�ŗĶČŗĢåĻąĖĘ¶Č£»Ęä´ĪĄūÓĆ²āŹŌÓĆ»§ÓėŃµĮ·ÓĆ»§Ö®¼äµÄŃµĮ·ĻīÄæµÄĘ«ŗĆÖµ¼°Ö÷Ģā·Ö²æÖµ£¬Ą´¼ĘĖćøöČĖµÄĻąĖĘ¶Č£»×īŗóĄūÓĆÓŃĒé¶Č3øöÖŲŅŖŌŖĖŲ£ŗ½»»�ĻąĖĘ¶Č£ØI£©£¬ČŗĢåĻąĖĘ¶Č£ØG£©ŗĶøöČĖĻąĖĘ¶Č£ØP£©µÄ×éŗĻĄ´¼ĘĖćÓĆ»§Ö®¼äµÄĻąĖĘ¶Č�£3.3��ŹµŃé½į¹ū·ÖĪöŠĶ¬¹żĀĖøöŠŌ»ÆĶĘ¼öĻµĶ³ŹĒ×īŹÜ»¶ÓµÄĶĘ¼ö·½Ź½£¬¶ų»łÓŚPCCŗĶJMSDŹĒŌŚCFĶĘ¼öĻµĶ³ÖŠ³£ÓĆµÄĻµŹż£¬ĖüµÄÓŠŠ§ŠŌŅŃ¾ŌŚ¾µäµÄµÄĶĘ¼öĻµĶ³Źż¾Ż¼Æ£ØČēMovielens£©ÖŠµĆµ½Ö¤Źµ�£±¾ĪÄĖłĢį³öµÄĻµĶ³ĄūÓĆÖ±½Ó»ņ¼ä½ÓĮ¬½Óµ½SNSµÄÓĆ»§µÄŠÅĻ¢½ųŠŠĶĘ¼ö£¬°Ń±¾ĪÄĶĘ¼öĻµĶ³µÄŠŌÄÜÓė»łÓŚPCCŗĶJMSDµÄCFĶĘ¼öĻµĶ³½ųŠŠ±Č½Ļ�£Ź¹ÓĆŗāĮæøöŠŌ»ÆĶĘ¼öĻµĶ³ŠŌÄÜµÄ¼øøöÖ÷ŅŖÖø±źMAE�¢¾«Č·¶Č�¢ÕŁ»ŲĀŹ�¢F1ÖµŃéÖ¤ĮĖĶĘ¼öĻµĶ³µÄĶĘ¼öÖŹĮæ�£3.3.1��IGPŹµŃé½į¹ū·ÖĪö��±¾ĪÄÕė¶Ō¾«Č·¶Č�¢ÕŁ»ŲĀŹŗĶF1Öµ¶ŌÓŃĒé¶Č3øöÖŲŅŖŌŖĖŲI�¢G�¢P¼°Ęä×éŗĻ½ųŠŠŹµŃé�£ŹµŃé½į¹ūČēĶ¼2ĖłŹ¾�£´ÓĶ¼2ÖŠæÉŅŌ·¢ĻÖ£¬ŌŚĖłÓŠµÄ×éŗĻÖŠ£¬IŗĶPµÄ×éŗĻ£ØCIP£©±ķĻÖ³ö×īŗĆµÄŠŌÄÜ�£Ņņ´Ė£¬½įŗĻŹ½£Ø12£©£¬Ń�ŌńCIP×÷ĪŖÓŃĒé¶Č�£3.3.2�� MAEŹµŃé½į¹ū·ÖĪö��MAEÖ÷ŅŖÓĆÓŚŌ¤²āÖµµÄĪó²ī²āĮæ£¬¶ØŅåĪŖ¹«Ź½£Ø14£©£ŗ[¦ÄMAE=1Ii�ŹI1Ou,iu�Źou,i|pu,i-ru,i|] £Ø14£©Ź½£Ø14£©ÖŠ[Ou,i]±ķŹ¾ÓĆ»§¼ÆŗĻ£¬[pu,i]ŗĶ[ru]ŌŚ²āŹŌÓĆ»§¼ÆUÖŠ¶¼²»ĪŖnullÖµ�£MAEĘĄ¹ĄŹµŃéµÄ½į¹ūČēĶ¼3ĖłŹ¾£¬ŹµŃéÖŠ K½üĮŚ£ØK£©µÄ·¶Ī§ŹĒ100µ½2 000Ö®¼ä�£´ÓĶ¼3ÖŠæÉŅŌ·ÖĪö£¬±¾ĪÄĖłĢį³öµÄĶĘ¼öĖć·Ø±Č»łÓŚPCCŗĶJMSDµÄCFĶĘ¼ö¾ßÓŠøüµĶµÄ´ķĪóĀŹ�£»łÓŚÓŃĒé¶ČĶĘ¼öŌ¤²āĘ«ŗĆÖµµÄ×¼Č·ŠŌŌŚÕūĢå·¶Ī§ÄŚ·Ö±ČPCCĢįøß20£�×óÓŅ£¬ÓėJMSDĻą±Č£¬ŌŚK<1 000Ź±£¬ĖüµÄŠŌÄÜĀŌøß£¬µ«K�Ż1 000Ź±£¬ŠŌÄÜĢįøßĮĖ´óŌ¼ÓŠ8£�£¬KµÄŹżĮæŌ½¶ą£¬ŠŌÄÜøÄÉĘŌ½øß�£3.3.3��Õė¶ŌĶĘ¼öÓŠŠ§ŠŌµÄŹµŃé·ÖĪö��MAEæÉÄÜŹĒŗāĮæĶĘ¼öĖć·ØŠŌÄÜµÄŅ»øöŗÜŗĆµÄÖø±ź£¬µ«ŹĒĖü²»ÄÜ×¼Č·ŗāĮæÓĆ»§¶ŌĶĘ¼ö½į¹ūµÄĀśŅā¶Č£¬Ņņ´ĖÓŠ±ŲŅŖŹ¹ÓĆŠĀµÄĖć·Ø²āĮæÓĆ»§¶ŌĶĘ¼ö½į¹ūµÄĀśŅā¶Č¼´ĘĄ¹ĄĶĘ¼öµÄÓŠŠ§ŠŌ�£ĶØ³£¾«Č·¶Čp�¢ÕŁ»ŲĀŹrŗĶ[F1]Öµ±»ÓĆÓŚŗāĮæøöŠŌ»ÆĶĘ¼ö½į¹ūµÄÓŠŠ§ŠŌ£¬±¾ĪÄÖŠ¾«Č·¶Č�¢ÕŁ»ŲĀŹŗĶ[F1]Öµ±ķŹ¾ČēŹ½£Ø15£©~Ź½£Ø17£©£¬ŹµŃé½į¹ūČēĶ¼4ĖłŹ¾�£[p=1Uu�ŹU|{i�ŹZu|ru,i«Ń¦Č}|N] £Ø15£©[r=1Uu�ŹU|{i�ŹZu|ru,i«Ń¦Č}||i�ŹI|ru,i«Ń¦Č|] £Ø16£©[F1=2�Įp�Įr(p+r)] £Ø17£© ĘäÖŠZu±ķŹ¾ÓĆ»§Ģį¹©µÄNøöĶĘ¼öĻīµÄ¼ÆŗĻ£¬[ru,i]�Ź£Ū0£¬1£Ż£¬[¦Č]±ķŹ¾ćŠÖµ�£ĪŖĮĖŗāĮæ¾«Č·¶Č�¢ÕŁ»ŲĀŹŗĶ[F1]Öµ£¬²»½öŅŖøł¾ŻŌ¤²āĘ«ŗĆÖµ¶ŌĶĘ¼öĻīÄæ½ųŠŠÅÅŠņ£¬¶ųĒŅ»¹ŅŖČ·¶ØĶĘ¼öĻīÄæĻą¹ŲŠŌÅŠ¶ĻµÄćŠÖµ�£øł¾ŻŹ½£Ø1£©½ųŠŠ¶ą´Ī¼ĘĖć·¢ĻÖ£¬Ź½£Ø15£©ŗĶŹ½£Ø16£©ÖŠČē¹ū[ru,i]>0.5£¬Ōņ±ķŹ¾ÓĆ»§ŌŚĖłÓŠĖūµÄ²©ĪÄÖŠ¶ŌÓŚĻīÄæiµÄÕżĆęĘĄĀŪ¶¼¶ąÓŚ1´Ī£¬Ņņ´ĖæÉŅŌÅŠ¶ĻĶĘ¼ö½į¹ūÓėiŹĒĻą¹ŲµÄ�£Ņņ´Ė£¬½«ćŠÖµÉčÖĆĪŖ0.5�£´ÓŹµŃé½į¹ūæÉŅŌæ´³ö£¬¾Ķ¾«¶Č¶ųŃŌ£¬ĖłĢį³öµÄĻµĶ³ÓėPCCŗĶJMSDĻą±Č·Ö±šĻŌŹ¾ĢįøßŌ¼8£�ŗĶ5£�£»ŌŚÕŁ»ŲĀŹ·½Ćę£¬ÓėPCCĻą±Č£¬ĖłĢįŅéµÄĻµĶ³ŠŌÄÜĢįøßŌ¼8£�£¬ÓėJMSDĻą±ČŌ¼ĪŖ6£�£»¶ŌÓŚF1Öµ£¬ÓėPCCĻą±Č£¬ĖłĢį³öµÄĻµĶ³ŠŌÄÜĢįøßŌ¼10£�£¬ÓėJMSDĻą±ČŌ¼ĪŖ9£��£æÉ¼ū£¬±¾ĪÄĖłĢį³öµÄĶĘ¼öĻµĶ³ĶĘ¼öÖŹĮæÉĻ±Č»łÓŚPCCŗĶJMSDµÄCFĶĘ¼öĻµĶ³ÕūĢåÉĻ·Ö±šĢįøß8.5%ŗĶ7%×óÓŅ�£4��½į��Óļ»łÓŚSNSĢį³öµÄÓŃĒé¶Č¶ŌÓŚĶĘ¼öÓŠŗÜ´ó°ļÖś£¬Ö»ŅŖĖüÓĆ»§Ö®¼äµÄ½»»�Źż¾Ż�¢ŗĆÓŃĮŠ±ķŠÅĻ¢»ņ¾ßÓŠ¶ąøö¼¶±šµÄĻīÄæ£¬ČēĪ¢ŠÅ�¢Ä°Ä°�¢Ī¢²©µČÉē½»ĶųĀēÓµÓŠÓĆ»§Ö®¼äµÄĮŖĻµŠÅĻ¢ŗĶÓĆ»§Ö®¼äĘĄĀŪµÄŠÅĻ¢£¬ĄūÓĆÕāŠ©ŠÅĻ¢¾ĶæÉŅŌ¼ĘĖć³öÓĆ»§Ö®¼äÓŃĒé¶Č£¬¶ų´ó¶ąŹż»łÓŚSNSµÄĶĘ¼öĻµĶ³¶¼æÉŅŌŹ¹ÓĆÓŃĒé¶Č½ųŠŠĶĘ¼ö�£Ź¹ÓĆ1øöŌĀµÄĪ¢²©µēÓ°�¢ŅōĄÖĘĄĀŪŹż¾Ż£¬Õė¶ŌMAE�¢¾«¶Č�¢ÕŁ»ŲĀŹ�¢[F1]Öµ½ųŠŠĮĖ±Č½ĻŹµŃé�£½į¹ū±ķĆ÷£¬×ŪŗĻæ¼ĀĒSNSÉĻµÄÓĆ»§¼äµÄÓŃĒé¶Č£¬¶ŌÓŚĶĘ¼ö½į¹ūµÄÓŠŠ§ŠŌÓŠŗÜ´óµÄÓ°Ļģ£¬ĖłĢį³öµÄĻµĶ³ŌŚĖłÓŠ¶ČĮæ·½Ćę±Č»łÓŚJMSDŗĶPCCµÄĶĘ¼ö±ķĻÖ³ö½ĻŗĆµÄŠŌÄÜŗĶĶĘ¼öÖŹĮæ£¬¶ŌÓŚĢįøßĶĘ¼öµÄ×¼Č·ŠŌŹĒÓŠÓĆµÄ�£ĖäČ»ĶĘ¼öÖŹĮæµÄ²īŅģ²¢²»Ź®·ÖĻŌÖų£¬µ«ĖłĢį³öµÄĻµĶ³ŌŚĖłÓŠ¶ČĮæÖø±źÖŠÖµ¶¼ŹĒ×īøßµÄ�£