ĪÄÕĀ

�¶Īäŗŗ¹¤³Ģ´óŃ§Ń§±Ø�· 2020Äź05ĘŚ 575-580 ³ö°ęČÕĘŚ£ŗ2021-01-29 ISSN:1674-2869 CN:42-1779/TQ

»łÓŚAtt-iBi-LSTMµÄŠĀĪÅÖ÷Ģā´ŹĢįČ�·½·ØŃŠ¾æ

ŠĀĪÅÖ÷Ģā´ŹĢįČ�ŹĒ½«ŗĖŠÄ´ŹŗĶ¶ĢÓļ´ÓŠĀĪÅĪÄ±¾ÖŠĶŚ¾ņ³öĄ´µÄ¹ż³Ģ�£Ö÷Ģā´Ź°üŗ¬ÓŠÖśÓŚČĖĆĒĄķ½āĪÄ±¾ÄŚČŻµÄÖ÷ŅŖŠÅĻ¢£¬ĶØ¹ż²éæ´Ö÷Ģā´Ź£¬ÓĆ»§æÉŅŌøüĒįĖÉµŲÕŅµ½ĖūĆĒŠčŅŖµÄŠĀĪÅ�£ÓÉÓŚÖ÷Ģā´ŹŹĒ¶ŌĪÄ±¾Ö÷ĢāŠÅĻ¢µÄøß¶ČÄżĮ·£¬ČĖĆĒ»¹æÉŅŌŹ¹ÓĆĖüĆĒŅŌ½ĻµĶµÄø´ŌÓ¶ČĄ´¼ĘĖćĪÄ±¾Ļą¹ŲŠŌ£¬Ņņ´ĖĪŖŠķ¶ą×ŌČ»ÓļŃŌ´¦ĄķÓ¦ÓĆ´ųĄ´ĮĖ±ćĄū£Ū1-3£Ż�£ ´«Ķ³µÄÖ÷Ģā´ŹĢįČ�·½·ØÖ÷ŅŖÓŠĮ½ÖÖ£ŗŅ»ÖÖŹĒøł¾Ż´ŹµÄĶ³¼ĘŠÅĻ¢¶Ō¹Ų¼ü´Ź½ųŠŠÅÅŠņ£¬Čē´ŹĘµ-ÄęĪÄµµĘµĀŹ·½·Ø£Ū4£ŻŗĶTextRank£Ū5£ŻµČ£»ĮķŅ»ÖÖŹĒÓ¦ÓĆ»śĘ÷Ń§Ļ°Ėć·Ø£¬ĢįČ�ø÷ÖÖĢŲÕ÷Ą´ŃµĮ·Ä£ŠĶ£¬ČēŅžĀķ¶ūæÉ·ņÄ£ŠĶ£Ū6£Ż�¢Ö§³ÖĻņĮæ»ś£Øsupport vector machine£¬SVM£©£Ū7£Ż�¢ĘÓĖŲ±´Ņ¶Ė¹Ä£ŠĶ£Ū8£ŻµČ�£´ŹĘµ-ÄęĪÄµµĘµĀŹ·½·ØŌŚ½ųŠŠĪÄµµÖ÷Ģā´ŹĢįČ�Ź±£¬ÓÉÓŚĪÄµµÖ÷Ģā½į¹¹ĢŲÕ÷Č±ÉŁµÄŌŅņ£¬µ¼ÖĀøĆ·½·ØÖ÷Ģā´ŹĢįČ�Š§¹ū²ī�£TextRankæ¼ĀĒĮĖ²æ·ÖĪÄµµÖ÷Ģā½į¹¹ĢŲÕ÷£¬ČēĪÄµµÖŠ´ŹÓė´ŹÖ®¼äµÄ¹ŲĻµ£¬µ«ČŌČ»ĒćĻņÓŚŃ�Č�ĪÄµµÖŠµÄøßĘµ´Ź×÷ĪŖÖ÷Ģā´Ź�£Ó¦ÓĆ»śĘ÷Ń§Ļ°Ėć·Ø½ųŠŠÖ÷Ģā´ŹĢįČ�£¬ĶØ¹żĢįČ�ø÷ÖÖĢŲÕ÷Ą´ŃµĮ·ĘäÄ£ŠĶŅŃ±»Ö¤Ć÷æÉŅŌ»ńµĆ³öÉ«µÄŠŌÄÜ£¬µ«ÕāÖÖ·½·ØŅĄĄµČĖ¹¤¶ØŅåµÄ¹ęŌņ£¬Ć»ÓŠ³ä·Öæ¼ĀĒ´ŹµÄÉĻĻĀĪÄŠÅĻ¢ĒŅ¶ŌĢŲ¶ØµÄŹż¾Ż¼ÆĆōøŠ£Ū9£Ż�£ ½üÄźĄ´£¬³¤¶ĢĘŚ¼ĒŅä£Ølong short-term memory£¬LSTM£©Ä£ŠĶŌŚ¶ąÖÖNLPĪŹĢāÖŠ±»¹ć·ŗŹ¹ÓĆ£¬ČēĒéøŠ·ÖĪö£Ū10£Ż�¢´ŹŠŌ±ź×¢£Ū11£Ż�¢ĆüĆūŹµĢåŹ¶±š£Ū12£Ż�¢¹Ų¼ü´Ź³éČ�£Ū13£ŻµČĪŹĢā�£µ«ŹĒLSTMÄ£ŠĶŌŚ½ųŠŠÖ÷ĢāĢįČ�Ź±´Ó¾ä×ÓæŖĶ·µ½ÖŠŠÄ´Ź½ØÄ££¬Ć»ÓŠæ¼ĀĒ¾ä×ÓĻĀĪÄ¶ŌøĆ´ŹµÄÓ°Ļģ�£ ĪŖĮĖøüŗĆµŲ½ā¾öÕāŠ©ĪŹĢā£¬ĪÄÖŠĢį³öĮĖŅ»ÖÖĖ«ĻņµÄLSTMĶųĀēÄ£ŠĶ£¬ÓĆÓŚÖ÷Ģā´ŹĢįČ�ČĪĪń�£ĪÄÖŠ½«Ö÷Ģā´ŹĢįČ�ČĪĪńŹÓĪŖŅ»øö¶ž·ÖĄąĪŹĢā£¬¶ŌÓŚ¾ä×ÓÖŠøų¶ØµÄ´Ź£¬ŃµĮ·Ņ»øö·ÖĄąĘ÷Ą´Č·¶ØĖüŹĒ·ńĪŖÖ÷Ģā´Ź�£¾ßĢå¶ųŃŌ£¬ŠčŅŖ´ÓĮ½øö·½Ćęæ¼ĀĒŠÅĻ¢£¬¼´ÖŠŠÄ´ŹµÄÄŚČŻ¼°ĘäÉĻĻĀĪÄŠÅĻ¢�£ĶØ¹żĖ«ĻņµÄLSTMŅŌ´Ó¾ä×ÓæŖĶ·µ½ÖŠŠÄ´ŹŗĶ´Ó½įĪ²µ½ÖŠŠÄ´ŹĮ½øö·½Ļņ¶Ōøų¶Øµ�´Ź¼°ĘäÉĻĻĀĪÄ½ØÄ£�£ĶØ¹żÕāÖÖ·½Ź½£¬Ä£ŠĶæÉŅŌ²¶»ńÖŠŠÄ´ŹµÄ¾ä×Ó¼¶ŠÅĻ¢�£ĶØ¹żĄūÓĆÖŠŠÄ´ŹµÄÉĻĻĀĪÄµÄĪÄ±¾ŠÅĻ¢£¬Ä£ŠĶŌņæÉŅŌÅŠ¶ĻĘäŹĒ·ńĪŖÖ÷Ģā´Ź�£ ´ĖĶā£¬µ±øų¶ØŅ»¾ä»°Ź±£¬Ä³Š©´ŹŌŚÖ÷ĢāÖŠ±ČĘäĖū´Źøü¾ßÓŠ´ś±ķŠŌ�£ĄżČē£¬ŌŚ�°ÄæĒ°£¬ĢųÉ�±ČČüŅ»ĒŠÕż³£��±Ņ»¾äÖŠ£¬Čē¹ūĻėČ·¶Ø�°ĢųÉ��±Ņ»´ŹŹĒ·ńĪŖÖ÷Ģā´Ź£¬�°±ČČü�±Ņ»´ŹµÄŠÅĻ¢±ČĘäĖū´Ź¶Ō�°ĢųÉ��±µÄÅŠ¾öÓŠøü´óµÄÓ°Ļģ�£¼´£¬Ó¦øĆĆ÷Č·Ćæøöµ�´ŹµÄÖŲŅŖŠŌ£¬Č»ŗóÉś³Éøų¶Ø´ŹµÄĻņĮæ±ķŹ¾�£Ņņ´Ė£¬ŌŚĖ«ĻņµÄLSTMµÄ»ł´�ÉĻŅżČėĮĖŅ»ÖÖ×Ō×¢ŅāĮ¦»śÖĘ£Ū14-15£Ż£¬ĶØ¹ż×Ō×¢ŅāĮ¦»śÖĘæ¼ĀĒ²»Ķ¬µ�´ŹµÄÖŲŅŖŠŌĄ´Éś³Éøų¶Øµ�´ŹµÄ±ķŹ¾ĻņĮæ£¬´Ó¶ųøüŗĆµŲ´ÓĪÄ±¾ÖŠĢįČ�Ö÷Ģā´Ź�£ ÓÉÓŚÉī¶ČŃ§Ļ°ĶųĀēÄ£ŠĶŠčŅŖ´ó¹ęÄ£µÄŃµĮ·Źż¾Ż£¬²¢ĒŅČĖ¹¤±ź×¢µÄŃµĮ·Źż¾ŻµÄ´óŠ�·Ē³£ÓŠĻŽ£¬ĪŽ·ØĀś×ćÄ£ŠĶµÄŃµĮ·ŅŖĒó�£ĪÄÖŠĢį³öŅ»ÖÖÉś³É´ĖČĪĪńµÄŃµĮ·ÓļĮĻæāµÄ·½·Ø£¬ĶØ¹żøĆ·½·Ø»ńµĆĮĖ´óĮæ´ÖŹż¾Ż¼Æ�£ĪŖĮĖ³ä·ÖĄūÓĆÕāŠ©ŃµĮ·Źż¾Ż£¬ĪÄÖŠĢį³öĮĖŅ»ÖÖĮ½½×¶ĪŃµĮ··½·ØĄ´ŃµĮ·Ä£ŠĶ�£Ź×ĻČ£¬Ź¹ÓĆ´ÖŹż¾Ż¼Æ¶ŌÄ£ŠĶ½ųŠŠŌ¤ŃµĮ·£¬Č»ŗóŹ¹ÓĆČĖ¹¤±ź×¢µÄŹż¾ŻÖŲŠĀŃµĮ·Ä£ŠĶ�£ÕāŃł£¬Óė½öŹ¹ÓĆČĖ¹¤±ź×¢µÄŹż¾ŻĻą±Č£¬Ä£ŠĶ»ńµĆĮĖøüŗĆµÄŠŌÄÜ�£ 1��Ļą¹Ų¹¤×÷ 1.1��LSTMÄ£ŠĶ LSTMĶųĀēÄ£ŠĶŹōÓŚŅ»ÖÖŃ»·Éń¾ĶųĀē£Ørecurrent neural network£¬RNN£©£¬ĶØ¹żŌŚÄ£ŠĶÖŠŅżČėæŲÖĘĆÅ½ā¾öĮĖŅ»°ćµÄRNN´ęŌŚµÄ³¤ĘŚŅĄĄµĪŹĢā£Ū16£Ż�£ĖłÓŠŃ»·Éń¾ĶųĀē¶¼¾ßÓŠÉń¾ĶųĀēµÄÖŲø´Ä£æéĮ´µÄŠĪŹ½£¬LSTMŅ²¾ßÓŠÕāÖÖĮ´Ź½½į¹¹£¬LSTMÄ£ŠĶČēĶ¼1ĖłŹ¾�£ LSTMÄ£ŠĶµÄµ�øöÖŲø´Ä£æéŹĒÓÉtŹ±æĢµÄŹäČė´ŹĻņĮæ[wt]£¬Ļø°ū×´Ģ¬[Ct]£¬ĮŁŹ±Ļø°ū×´Ģ¬[Ct�ä]£¬Ņž²ć×´Ģ¬[ht]£¬ŅÅĶüĆÅ[ft]£¬¼ĒŅäĆÅ[it]£¬Źä³öĆÅ[ot]×é³É�£LSTMµÄŠÅĻ¢øüŠĀ¹ż³ĢŹĒŅ»øöŅÅĶüĪŽÓĆŠÅĻ¢²¢¼ĒŅäŠĀŠÅĻ¢µÄ¹ż³Ģ£¬²¢ŌŚÕāøö¹ż³ĢÖŠµÄČĪŅāŹ±æĢt¾ł»įŹä³öŅ»øöŅž²ć×´Ģ¬[ht]£¬ĘäÖŠŅÅĶü[ft]£¬¼ĒŅä[it]ŗĶŹä³ö[ot]¾łÓėÉĻøöŹ±æĢµÄŅž²ć×´Ģ¬[ht-1]ŗĶµ±Ē°ŹäČė[wt]ÓŠ¹Ų�£ÓŚŹĒtŹ±æĢµÄLSTMµÄ×´Ģ¬øüŠĀĪŖ£Ū16£Ż£ŗ [ft=¦Ņ(Wf[ht-1,wt]+bf)] £Ø1£© [it=¦Ņ(Wi[ht-1,wt]+bi)] £Ø2£© [Ct�ä=tanh(Wc[ht-1,wt]+bc]] £Ø3£© [Ct=ftCt-1+itCt�ä] £Ø4£© [ot=¦Ņ(Wo[ht-1,wt]+bo)] £Ø5£© [ht=ottanh(Ct)] £Ø6£© Ź½£Ø1£©~£Ø6£©ÖŠ£¬[Wf]�¢[Wi]�¢[Wc]ŗĶ[Wo]·Ö±š±ķŹ¾ĘäĻĀ±źĖł¶ŌÓ¦µ�ŌŖµÄČØÖŲ¾ŲÕó£¬[bf]�¢[bi]�¢[bc]ŗĶ[bo]ĪŖĘ«ŅĘĻņĮæ�£[¦Ņ]ŗĶ[tanh]ĪŖĮ½ÖÖ¼¤»īŗÆŹż£¬ČēŹ½£Ø7£©�¢Ź½£Ø8£©ĖłŹ¾�£ [¦Ņ(z)=11+e-z] £Ø7£© [tanh(z)=e2z-1e2z+1] £Ø8£© Ōņ£¬tŹ±æĢŅžŗ¬²ć×´Ģ¬æÉŅŌ±ķŹ¾ĪŖ£ŗ [ht=LSTM(wt,ht-1)] £Ø9£© 1.2��Attention»śÖĘ AttentionÄ£ŠĶ½į¹¹ČēĶ¼2£Øa£©ĖłŹ¾�£ ĶØ¹żAttention»śÖĘ»ńµĆ×¢ŅāĮ¦ČØÖŲ[¦Įij]£¬[¦Įij]±ķŹ¾iŹ±æĢ´Ź[wi]µÄÉĻĪÄ»ņĻĀĪÄÖŠµŚjøö´Ź[wj]¶Ō[wi]µÄÓ°Ļģ�£ĪŖĮĖŹ¹»ńµĆµÄ×¢ŅāĮ¦ČØÖŲ·¢»Ó×÷ÓĆ£¬½«Ņžŗ¬²ć×´Ģ¬[hi]ĶØ¹żÅäÖĆ×¢ŅāĮ¦ČØÖŲµĆµ½[qi]£¬ČēŹ½£Ø10£©ĖłŹ¾£ŗ [qi=j=1k¦Įijhi] £Ø10£© ĘäÖŠ£¬[¦Įij]µÄ¼ĘĖć¹ż³ĢČēŹ½£Ø11£©ĖłŹ¾£ŗ [¦Įij=exp(pij)j=1kexp(pij)] £Ø11£© kĪŖ[wi]ÉĻĪÄ»ņĻĀĪÄÖŠ´ŹµÄŹżĮæ£¬[pij]ĪŖÄæ±ź×¢ŅāĮ¦ČØÖŲ£¬[pij=tanh(hi,hj)]£¬[tanh]ŹĒŅ»ÖÖ×¢ŅāĮ¦Ń§Ļ°ŗÆŹż£¬[ht]ŹĒLSTMĶųĀēŹä³öµÄĢŲÕ÷ĻņĮæ�£ 2��Ė«ĻņLSTMŅżČėAttention»śÖĘÄ£ŠĶ 2.1��Ė«ĻņµÄLSTMÄ£ŠĶ ĪÄÖŠ½«Ö÷Ģā´ŹĢįČ�æ´×÷Ņ»øö¶ž·ÖĄąĪŹĢā£¬²ÉÓĆLSTM¹¹½Ø·ÖĄąĘ÷�£Éčµ±Ē°´ŹĪŖÖŠŠÄ´Ź£¬±¾ĪÄŹÓÖŠŠÄ´Ź¼°ĘäÉĻĪÄ¾ßÓŠĻąĶ¬ÖŲŅŖŠŌ�£µ«ŹĒ£¬ŌŚ´«Ķ³µÄLSTMÄ£ŠĶÖŠ£¬Ö»ÄÜŹ¹ÓĆ´Ó¾ä×ÓæŖĶ·µ½ÖŠŠÄ´Ź£¬´Ó¶ųŗöĀŌĮĖÖŠŠÄ´ŹµÄŗóŠųĪÄ±¾ŠÅĻ¢µÄÓ°Ļģ£¬ÕāŃłÓŠæÉÄÜ¶ŖŹ§ÖŲŅŖŠÅĻ¢�£Ņņ´Ė£¬ĪŖĮĖ³ä·ÖĄūÓĆÖŠŠÄ´ŹµÄÉĻĻĀĪÄŠÅĻ¢£¬Ģį³öøÄ½ųµÄĖ«ĻņLSTMÄ£ŠĶ£ØiBi-LSTM£©½ųŠŠ´Ź·ÖĄą£¬½«ÖŠŠÄ´ŹµÄÉĻĻĀĪÄ±¾ŠÅĻ¢¶¼ŹäČėµ½Ä£ŠĶÖŠ£¬²¢ŌŚĮ½øö·½ĻņÉĻ½«ÖŠŠÄ´ŹÓėĘäÉĻĻĀĪÄŠÅĻ¢Ņ»Ęš½ØÄ££¬ŅŌ±ć¼ĘĖćÖŠŠÄ´ŹµÄøÅĀŹ²¢ÅŠ¶ĻĘäŹĒ·ńĪŖÖ÷Ģā´Ź£¬ČēĶ¼2£Øb£©ĖłŹ¾�£ ŌŚĶ¼2£Øb£©ÖŠ£¬²ÉÓĆĮĖĮ½øöLSTM¶ŌÖŠŠÄ´Ź¼°ĘäÉĻĻĀĪÄŠÅĻ¢½ųŠŠ½ØÄ££¬Ņ»øöŅŌ´Ó×óµ½ÓŅµÄ·½Ź½¶Ō´Ó¾ä×ÓæŖĶ·µ½ÖŠŠÄ´ŹµÄ´Ź½ųŠŠ½ØÄ££ØLSTMl£©£¬ĮķŅ»øö´Ó¾ä×Ó½įĪ²µ½ÖŠŠÄ´ŹµÄŠÅĻ¢½ųŠŠ½ØÄ££ØLSTMr£©�£[wt]±ķŹ¾ĪÄµµÖŠµÄµŚtøö´ŹµÄ´ŹĻņĮæ£¬[hlt]ĪŖtŹ±æĢLSTMlµÄŅž²Ų²ćµÄŹä³ö£¬[hrt]±ķŹ¾tŹ±æĢLSTMrµÄŅž²Ų²ćµÄŹä³ö£¬Ōņ£ŗ [hlt=LSTMl(wt,hlt-1)] £Ø12£© [hrt=LSTMr(wt,hrt-1)] £Ø13£© 2.2��Att-iBi-LSTMÄ£ŠĶ Attention»śÖĘæÉŅŌĶØ¹ż»ńČ�µÄ×¢ŅāĮ¦ČØÖŲĄ´Ēų·Ö´ŹĻņĮæÖŠø÷ÓļŅå±ąĀėµÄÖŲŅŖŠŌ£¬ŌöĒæÄ£ŠĶĢįČ�ĢŲÕ÷µÄÄÜĮ¦£¬Ņņ´ĖøĆ·½·ØæÉŅŌĢįøßÄ£ŠĶ·ÖĄąµÄ×¼Č·ĀŹ�£±¾ĪÄĶØ¹żŅżČėSelf-AttentionĄ´»ńČ�¾ä×ÓÖŠ´ŹÖ®¼äµÄÓļŅå»ņ¾ä·ØĢŲÕ÷£¬ČēĶ¼2£Øc£©ĖłŹ¾�£ ¶ŌÓŚøų¶Ø¾ä×Ó[{w1,w2,?,wm,wt,wt+1?,][wt+n}]£¬ČōŅŖÅŠ¶Ļ[wt]ŹĒ·ńĪŖÖ÷Ģā´Ź£¬ĶØ¹żLSTMlŗĶLSTMr·Ö±š¶Ō[wt]µÄÉĻĪÄŗĶĻĀĪÄ½ØÄ£µĆµ½ĖłÓŠµ�´Ź¶ŌÓ¦µÄŅž²Ų×´Ģ¬ĻņĮæ[{hl1,hl2,?,hl3,hlt,hrt,][hr1,hr2,???,hrn}]£¬ĘäÖŠ[Hl={hl1,hl2,???,hlm,hlt}]£¬[Hr={hrt,hr1,hr2,???,hrn}]�£øł¾ŻÕāŠ©Ņž²Ų×´Ģ¬ĻņĮæ¼ĘĖć×Ō×¢ŅāĮ¦ČØÖŲ¾ŲÕó[Al]ŗĶ[Ar]£¬ČēŹ½£Ø14£©ŗĶŹ½£Ø15£©ĖłŹ¾£ŗ [Al=softmax(Wl2tanh(Wl1H¦³l)] £Ø14£© [Ar=softmax(Wr2tanh(Wr1HTr)] £Ø15£© ĘäÖŠ£¬[W1]ŹĒŅ»øöĪ¬¶ČĪŖ[da�Įu]µÄ²ĪŹż¾ŲÕó£¬[W2]ŹĒŅ»øöĪ¬¶ČĪŖ[r�Įda]µÄ²ĪŹż¾ŲÕó£¬uĪŖŅž²Ų×´Ģ¬ĻņĮæ[hi]µÄĪ¬¶Č£¬rŹĒĖł²ÉÓĆµÄmulti-hop×¢ŅāĮ¦»śÖĘµÄhopŹżĮæ£¬[da]ĪŖÉčÖĆµÄČØÖŲ¾ŲÕóµÄĪ¬¶Č�£×¢ŅāĮ¦ČØÖŲ¾ŲÕó[A]ŹĒmulti-hop×¢ŅāĮ¦¾ŲÕó£¬ĖüÓŠÖśÓŚŌŚ¶Ōµ±Ē°µ�´Ź½ųŠŠ½ØÄ£Ź±ĻŌŹ½²¶»ńÓļŅåŠÅĻ¢�£Óė´«Ķ³µÄsingle-hop×¢ŅāĮ¦»śÖĘĻą±Č£¬multi-hop×¢ŅāĮ¦»śÖĘŹ¹Ä£ŠĶÄÜ¹»×Ø×¢ÓŚÉĻĻĀĪÄµÄ²»Ķ¬²æ·Ö£¬´Ó¶ųæÉ´Ó¶ą·½Ćę²¶»ń¾ä×ÓŠÅĻ¢�£ ½«×¢ŅāĮ¦¾ŲÕó[A]ŗĶŅž²Ų×´Ģ¬ĻņĮæ[H]Ļą³Ė£¬ŅŌÉś³ÉÖŠŠÄ´Ź[wt]µÄ¼ÓČØĻņĮæ±ķŹ¾£ŗ [Cl=AlHl] £Ø16£© [Cr=ArHr] £Ø17£© ×īŗó£¬ĶØ¹ż¶Ō[Cl]ŗĶ[Cr]ÖŠµÄŠŠĻņĮæĒóĘ½¾ł£¬µĆµ½Į½øö·½ĻņÉĻÖŠŠÄ´ŹµÄĻņĮæ±ķŹ¾£¬Č»ŗó½«ÕāĮ½øöĻņĮæĮ¬½ÓĘšĄ´ŅŌÉś³ÉÖŠŠÄ´ŹµÄ×īÖÕĻņĮæ±ķŹ¾[Vt]�£Č»ŗó½«[Vt]ŹäČėsoftmax²ćŅŌÉś³ÉÖŠŠÄ´ŹŹĒ·ńĪŖÖ÷Ģā´ŹµÄøÅĀŹ·Ö²¼£¬ČēŹ½£Ø16£©ĖłŹ¾£ŗ [Pt=softmax(WtVt)] £Ø18£© 2.3��Ä£ŠĶŃµĮ· Ö÷Ģā´ŹĢįČ�ŹµÖŹŹĒŅ»øö¶ž·ÖĄąĪŹĢā£¬¼´ŹĒÖ÷Ģā´Ź»ņÕß²»ŹĒ¹Ų¼ü´Ź�£²ÉÓĆAdam×÷ĪŖÄ£ŠĶµÄÓÅ»ÆĘ÷£¬øĆÄ£ŠĶ½«AdaGradŗĶRMSPropĖć·ØČŚŗĻ£¬æÉ»łÓŚŃµĮ·Źż¾Żµü´śøüŠĀĶųĀēČØÖŲŹµĻÖ×ŌŹŹÓ¦Ń§Ļ°£Ū17£Ż�£ ·ÖĄąŗÆŹżĪŖsoftmaxŗÆŹż�£Ä£ŠĶŃµĮ·Äæ±ź¾ĶŹĒ×īŠ�»ÆĖšŹ§ŗÆŹż£¬±¾ĪÄŹ¹ÓĆŹ½£Ø17£©µÄ½»²ęģŲ×÷ĪŖĖšŹ§ŗÆŹż£ŗ [L=-tytlnPt] £Ø19£© ĘäÖŠ£¬[yt]±ķŹ¾Ńł±¾tµÄ±źĒ©£¬ÕżĄąĪŖ1£¬øŗĄąĪŖ0£¬[Pt]±ķŹ¾Ńł±¾tŌ¤²āĪŖÕżµÄøÅĀŹ�£ ĪŖĮĖøüŗĆµŲŃµĮ·Ä£ŠĶ£¬±¾ĪÄĢį³öŅ»ÖÖĮ½½×¶ĪŃµĮ··½·Ø£ŗŹ×ĻČ£¬Ź¹ÓĆ´ÖŹż¾Ż¼Æ¶ŌÄ£ŠĶ½ųŠŠµŚŅ»½×¶ĪµÄŃµĮ·£¬Č»ŗó£¬Ź¹ÓĆČĖ¹¤±ź×¢µÄŹż¾Ż½ųŠŠµŚ¶ž½×¶ĪµÄÄ£ŠĶŃµĮ·�£ ŃµĮ·Éī¶ČÉń¾ĶųĀēÄ£ŠĶŠčŅŖ´ó¹ęÄ£µÄŃµĮ·Źż¾Ż�£Č»¶ų£¬¶ŌÓŚÖ÷Ģā´ŹĢįČ�µÄČĪĪń£¬ŠčŅŖČĖ¹¤Ą´±ź×¢ŃµĮ·ĖłŠčµÄÓļĮĻ�£ÓÉÓŚČĖ¹¤±ź×¢µÄŹż¾Ż¼ÆµÄŹżĮæÓŠĻŽ£¬ĖłŅŌ±¾ĪÄĢį³öĮĖŅ»ÖÖ×Ō¶Æ±ź×¢ŠĀĪÅĪÄ±¾ÖŠµÄÖ÷Ģā´Ź²¢æÉÉś³É´ó¹ęÄ£´ų±źĒ©µÄŹż¾Ż¼Æ£¬ÓĆ¼ÓČØ´ŹĘµ-ÄęĪÄµµĘµ¶ČÖµ£ŪTidf£¬ČēŹ½£Ø22£©ĖłŹ¾£Ż×÷ĪŖŹż¾Ż¼ÆÖŠÖ÷Ģā´ŹµÄÅŠ¶ĻŅĄ¾Ż�£µ«ŹĒ£¬ÕāÖÖ×Ō¶Æ±ź×¢µÄÖ÷Ģā´Ź²»Ņ»¶Ø×¼Č·£¬Ņņ´Ė½«Éś³ÉµÄŹż¾Ż¼Æ×÷ĪŖµŚŅ»½×¶Ī£ØŌ¤ŃµĮ·½×¶Ī£©ŃµĮ·µÄŹż¾Ż¼Æ£¬¼´´ÖŹż¾Ż¼Æ�£ [Tf=swiN] £Ø20£© [Idf=log(MMwi+1)] £Ø21£© [Tidf=Tf�ĮIdf] £Ø22£© Ź½£Ø20£©ÖŠ£¬[Tf]±ķŹ¾¼ÓČØ´ŹĘµ£¬[Idf]±ķŹ¾ÄęĪÄµµĘµ¶Č£¬[swi=2(s1+s2)s2?s1>0?s1>0]£¬[s1]ŹĒÄ³øö´ŹŌŚ±źĢāÖŠ³öĻÖµÄ´ĪŹż£¬[s2]ŹĒÕāøö´ŹŌŚĪÄÕĀÕżĪÄÖŠ³öĻÖµÄ´ĪŹż£¬ĶØ³£[1«Ńs1«Ń0]£¬Ņņ´ĖŌŚŹµŃéÖŠ´Ź[wi]ŌŚ±źĢāÖŠ³öĻÖŌņ[swi=2(s2+1)]�£Ź½£Ø21£©ÖŠ£¬MŹĒÓļĮĻæāµÄ×ÜĪÄµµŹż£¬[Mwi]ŹĒ°üŗ¬øĆ´ŹµÄĪÄµµŹż�£ 3��ŹµŃé²æ·Ö 3.1��Źż¾Ż¼Æ ±¾ŹµŃé×Ō½ØĮĖŅ»øöŠ�¹ęÄ£Źż¾Ż¼Æ£¬Źż¾ŻĄ´Ō´ÓŚŠĀĄĖŠĀĪÅµÄĢåÓż�¢ÓéĄÖŗĶæĘ¼¼ŠĀĪÅ¹²12 000ĘŖĪÄÕĀ£¬ĘäÖŠĢåÓżŠĀĪÅ�¢ÓéĄÖŠĀĪÅŗĶæĘ¼¼ĄąŠĀĪÅø÷4 000ĘŖ�£·Ö±š´ÓĢåÓż�¢ÓéĄÖŗĶæĘ¼¼ŠĀĪÅÖŠĖę»ś³éČ�1 000ĘŖŠĀĪÅĪÄ±¾½ųŠŠČĖ¹¤±ź×¢£¬Č»ŗóøł¾Ż2.3½ŚµÄ·½·Ø×Ō¶Æ±ź×¢Ź£ÓąµÄ9 000ĘŖŠĀĪÅĪÄ±¾£¬Źż¾Ż¼ÆČē±ķ1ĖłŹ¾�£ ±ķ1��Źż¾Ż¼Æ Tab. 1��Data sets [Źż¾Ż¼Æ\&ČĖ¹¤±ź×¢ĪÄ±¾Źż\&×Ō¶Æ±ź×¢ĪÄ±¾Źż\&ĢåÓż\&1 000\&3 000\&ÓéĄÖ\&1 000\&3 000\&æĘ¼¼\&1 000\&3 000\&] 3.2��ŹµŃé²ĪŹżÉčÖĆ ŌŚŹµŃé¹ż³ĢÖŠ£¬Ź¹ÓĆŌ¤ŃµĮ·µÄ´ŹĻņĮæ£¬²¢ŌŚŃµĮ·¹ż³ĢÖŠŹ¹Ęä±£³Ö²»±ä�£ÕāŠ©´ŹĻņĮæŹĒĶØ¹żŌŚĖŃ¹·ŠĀĪÅŹż¾Ż¼ÆÉĻŹ¹ÓĆWord2VecµÄSkip-gramÄ£ŠĶ£Ū18£Ż½ųŠŠŃµĮ·µĆµ½µÄ£¬Ćæøö´ŹĻņĮæµÄĪ¬¶ČÉčÖĆĪŖ100�£ĆæøöŅž²Ų×´Ģ¬µÄĪ¬¶ČŅ²ÉčÖĆĪŖ100£¬ÓĆÓŚ¼ĘĖć×Ō×¢ŅāĮ¦µÄ²ĪŹż[da]ÉčÖĆĪŖ128£¬batch_sizeÉčÖĆĪŖ128£¬AdamµÄŃ§Ļ°ĀŹÉčÖĆĪŖ0.001�£ 3.3��ĘĄ¼ŪÖø±ź ²ÉÓĆ¾«Č·¶Č£Øprecision£¬P£©�¢ÕŁ»ŲĀŹ£Ørecall£¬R£©ŗĶF1Öµ×÷ĪŖÄ£ŠĶŠŌÄÜµÄĘĄ¼ŪÖø±ź�£½«Ö÷Ģā´ŹĢįČ�æ´×÷ŹĒŅ»øö¶ž·ÖĄąĪŹĢā£¬Ö÷Ģā´ŹĪŖŅ»ĄąA£¬·ĒÖ÷Ģā´ŹĪŖŅ»ĄąB�£¶ŌÓŚĄą±šA£¬Ō¤²ā½į¹ūÓėÕęŹµ½į¹ūĻąĶ¬µÄŃł±¾ŹżĪŖ[Nptrue]£¬Ō¤²ā½į¹ūĪŖAµ«Źµ¼Ź½į¹ū²»ŹĒAµÄŃł±¾ŹżĪŖ[Npfalse]£¬Źµ¼Ź½į¹ūĪŖAµ«Ō¤²ā½į¹ū²»ĪŖAµÄŃł±¾ŹżĪŖ[Nfalse]£¬Ōņ£ŗ [P=NptrueNptrue+Npfalse] £Ø23£© [R=NptrueNptrue+Nfalse] £Ø24£© [F1=2P�ĮRP+R] £Ø25£© 3.4��ŹµŃé½į¹ūÓė·ÖĪö ½«±¾ĪÄµÄiBi-LSTMŗĶAtt-iBi-LSTM·½·ØÓėĻÖÓŠµÄSVM�¢TextRankŗĶLSTMÄ£ŠĶ·½·Ø¶Ō±Č£¬ĘäÖŠŹż¾Ż¼ÆĻąĶ¬�£ ŹµŃé1£ŗ½öŹ¹ÓĆČĖ¹¤±ź×¢µÄŹż¾Ż¼Æ×÷ĪŖÄ£ŠĶŃµĮ·µÄÓļĮĻ£¬ŌŚĢåÓż�¢ÓéĄÖŗĶæĘ¼¼ŠĀĪÅÉĻ·Ö±šŃéÖ¤ø÷ÖÖÖ÷Ģā´ŹĢįČ�·½·Ø£¬ø÷ŠĀĪÅÓļĮĻµÄ80%×÷ĪŖŃµĮ·¼Æ£¬20%×÷ĪŖ²āŹŌ¼Æ£¬´ÓŃµĮ·ÓļĮĻÖŠĖę»ś³éČ�10%×÷ĪŖŃéÖ¤¼Æ�£ŌŚ²āŹŌ¼ÆÉĻ¼ĘĖć³öP�¢RŗĶF1Öµ£¬ŹµŃé½į¹ūČē±ķ2ĖłŹ¾�£ĆæøöĘĄ¼ŪÖø±źÖŠµÄ×īÓÅÖµÓĆ´ÖĢå±ź³ö�£ ´Ó±ķ2æÉŅŌæ´³ö£¬ŌŚĢåÓżŗĶæĘ¼¼ŠĀĪÅŹż¾Ż¼ÆÉĻiBi-LSTMµÄ¾«Č·¶ČĆ÷ĻŌøßÓŚĘäĖū¶Ō±Č·½·Ø£¬Att-iBi-LSTMµÄÕŁ»ŲĀŹŗĶF1ÖµŌŚĖłÓŠ·½·ØÖŠ»ńµĆĮĖ×īÓÅÖµ£¬ŌŚæĘ¼¼ŠĀĪÅŹż¾Ż¼ÆÉĻAtt-iBi-LSTMµÄ¾«Č·¶Č�¢ÕŁ»ŲĀŹŗĶF1Öµ¶¼ŹĒ×īøßµÄ�£ ±ķ2��Ö÷Ģā´ŹĢįČ�½į¹ū Tab. 2��Results of topic words extraction % [Źż¾Ż¼Æ\&·½·Ø\&ĘĄ¼ŪÖø±ź\&P\&R\&F1\&ĢåÓż\&SVM\&65.48\&81.63\&72.67\&TextRank\&67.05\&59.78\&63.21\&LSTM\&80.07\&85.82\&82.85\&iBi-LSTM\&82.83\&86.07\&84.42\&Att-iBi-LSTM\&82.6\&89.32\&85.83\&\&\&\&ÓéĄÖ\&SVM\&63.57\&80.58\&71.07\&TextRank\&60.95\&59.78\&60.36\&LSTM\&79.83\&84.64\&82.16\&iBi-LSTM\&82.30\&85.73\&83.98\&Att-iBi-LSTM\&81.67\&88.26\&84.84\&\&\&\&æĘ¼¼\&SVM\&64.85\&80.41\&71.8\&TextRank\&62.13\&58.64\&60.33\&LSTM\&78.36\&86.33\&82.15\&iBi-LSTM\&82.95\&86.17\&84.53\&Att-iBi-LSTM\&83.77\&88.79\&86.21\&] ø÷·½·ØŌŚ3øöŹż¾ŻÉĻµÄĘ½¾ł½į¹ūČē±ķ3ĖłŹ¾£¬ĆæøöĘĄ¼ŪÖø±źÖŠµÄ×īÓÅÖµÓĆ´ÖĢå±ź³ö�£ ±ķ3��ø÷Źż¾Ż¼ÆÉĻµÄĘ½¾łŹµŃé½į¹ū Tab. 3��Mean experimental results on datasets % [·½·Ø\&ĘĄ¼ŪÖø±ź\&P\&R\&F1\&SVM\&64.63\&80.87\&71.85\&TextRank\&63.38\&59.40\&61.32\&LSTM\&79.42\&85.60\&82.40\&iBi-LSTM\&82.70\&85.99\&84.31\&Att-iBi-LSTM\&82.68\&88.79\&85.63\&] ´Ó±ķ3æÉŅŌæ´³ö×ŪŗĻ3ÖÖŠĀĪÅŹż¾Ż¼ÆµÄÖ÷Ģā´ŹĢįČ�½į¹ū£¬iBi-LSTMÄ£ŠĶµÄ¾«Č·¶ČÖµ×īøß£¬Att-iBi-LSTMµÄÕŁ»ŲĀŹŗĶF1ÖµøßÓŚĘäĖū¶Ō±Č·½·Ø�£iBi-LSTMÄ£ŠĶÓėSVMÄ£ŠĶĻą±ČP�¢RŗĶF1Öµ·Ö±šĢįøßĮĖ17.77%�¢5.12%ŗĶ12.46%£¬ÓėTextRankĻą±ČP�¢RŗĶF1Öµ·Ö±šĢįøßĮĖ19.32%�¢26.59%ŗĶ22.99%£¬ÓėLSTMÄ£ŠĶĻą±ČP�¢RŗĶF1Öµ·Ö±šĢįøßĮĖ3.28%�¢0.39%ŗĶ1.91%�£ŅżČėAttention»śÖĘµÄĖ«ĻņLSTMÄ£ŠĶÓėiBi-LSTMÄ£ŠĶĻą±ČÖ÷Ģā´ŹĢįČ�µÄÕŁ»ŲĀŹŗĶF1Öµ·Ö±šĢįøßĮĖ2.80%ŗĶ1.32%£¬ÓėSVM�¢TextRankŗĶLSTMĻą±ČF1Öµ·Ö±šĢįøßĮĖ13.78%�¢24.31%ŗĶ3.32%�£ĖäČ»ŌŚÖ÷Ģā´ŹĢįČ�ČĪĪńÖŠ£¬Att-iBi-LSTMÄ£ŠĶ±ČiBi-LSTMÄ£ŠĶĻą±ČPÖµĆ»ÓŠĢįÉż£¬µ«ŹĒF1Öµ×÷ĪŖPŗĶRµÄµ÷ŗĶĘ½¾łŹżøüÄÜĖµĆ÷·ÖĄąŠ§¹ū£¬Ņņ´ĖAttention»śÖĘµÄŅżČė¶ŌÄ£ŠĶ½ųŠŠøĆČĪĪńŹĒÓŠŠ§µÄ�£ ŹµŃé2£ŗĻČŹ¹ÓĆ×Ō¶Æ±ź×¢µÄŹż¾Ż½ųŠŠÄ£ŠĶµÄŌ¤ŃµĮ·£¬Č»ŗóŹ¹ÓĆČĖ¹¤±ź×¢Źż¾Ż¼Æ×÷ĪŖÄ£ŠĶµŚ¶ž½×¶ĪŃµĮ·µÄÓļĮĻ£¬ŃµĮ·¼Æ�¢²āŹŌ¼ÆŗĶŃéÖ¤¼ÆµÄ±ČĄżÓėŹµŃé1ĻąĶ¬£¬ŌŚĖłÓŠŠĀĪÅŹż¾Ż¼ÆÉĻµÄ×ÜĢåŹµŃé½į¹ūČē±ķ4ĖłŹ¾£¬iBi-LSTM£Ø2£©ŗĶAtt-iBi-LSTM£Ø2£©ÖŠµÄ£Ø2£©±ķŹ¾Ä£ŠĶŹ¹ÓĆĮ½½×¶ĪŃµĮ··½·Ø�£ ´Ó±ķ4ÖŠæÉŅŌæ´³ö£¬Ź¹ÓĆĮ½½×¶ĪŃµĮ··½·ØµÄiBi-LSTM£Ø2£©ÓėiBi-LSTMĻą±ČÖ÷Ģā´ŹĢįČ�µÄP�¢RŗĶF1Öµ·Ö±šĢįøßĮĖ3.31%�¢0.86%ŗĶ2.12%£¬Ź¹ÓĆĮ½½×¶ĪŃµĮ··½·ØµÄAtt-iBi-LSTM£Ø2£©ÓėAtt-iBi-LSTMĻą±ČP�¢RŗĶF1Öµ·Ö±šĢįøßĮĖ2.48%�¢0.53%ŗĶ1.56%�£±ķ4ÖŠµÄŹµŃé½į¹ūÖ¤Ć÷ĮĖĮ½½×¶ĪŃµĮ··½·Ø¶ŌÄ£ŠĶ½ųŠŠÖ÷Ģā´ŹĢįČ�µÄÓŠŠ§ŠŌ�£ 4��½į��ĀŪ ±¾ĪÄ²ÉÓĆĖ«ĻņLSTMŅżČėAttentionµÄ·½·ØŹµĻÖĮĖŠĀĪÅÖ÷Ģā´ŹµÄĢįČ�£¬²¢ĒŅŌŚ²»Ķ¬ĮģÓņŠĀĪÅÖ÷Ģā´ŹĢįČ�ČĪĪńÖŠ¾łµĆµ½ĮĖ½ĻŗĆµÄĢįČ�Š§¹ū£¬ĖµĆ÷ĮĖøĆ·½·ØµÄ·ŗ»ÆŠŌ�£±¾·½·Ø¹¹½ØĮĖŅ»øöĖ«ĻņµÄLSTMÉī¶ČÉń¾ĶųĀēÄ£ŠĶ£¬¶ŌÖŠŠÄ´ŹĖłŌŚµÄ¾ä×Ó½ØÄ££¬´ÓĮ½øö·½ĻņĢįČ�Õāøö´ŹµÄÉĻĪÄŗĶĻĀĪÄµÄŠÅĻ¢£¬²¢ŌŚøĆĶųĀēÄ£ŠĶÖŠŅżČė×¢ŅāĮ¦»śÖĘ£¬Óėµ�¶ĄµÄLSTMÄ£ŠĶĻą±ČæÉŅŌ»ńČ�øü¶ąµÄĪÄ±¾ŠÅĻ¢�£Ņņ´Ė£¬øĆ·½·ØÓŠĄūÓŚĪÄ±¾·ÖĄą�¢ĪÄ±¾¾ŪĄąµČĘäĖū×ŌČ»ÓļŃŌ´¦Ąķ¹¤×÷µÄ½ųŠŠ�£´ĖĶā£¬ĪÄÖŠ»¹Ģį³öĮĖŅ»ÖÖĄūÓĆ×Ō¶Æ±ź×¢µÄ´ÖŹż¾Ż¼ÆµÄĮ½½×¶ĪÄ£ŠĶŃµĮ··½·Ø£¬´ÓŹµŃé½į¹ūæÉŅŌ·¢ĻÖÕāÖÖÄ£ŠĶŃµĮ··½·Ø¶ŌÖ÷Ģā´ŹĢįČ�µÄČĪĪńÓŠŠ§£¬ĖłŅŌŌŚĘäĖūĄąĖĘµÄ¹¤×÷ÖŠŅ²æÉŅŌĄūÓĆÕāÖÖ·½·Ø�£Att-iBi-LSTM½įŗĻĮĖLSTMÄ£ŠĶŗĶAttention»śÖĘµÄÓÅµć£¬´Ó¶ų»ńµĆĮĖøüŗĆµÄÖ÷Ģā´ŹĢįČ�Š§¹ū£¬µ«ŹĒÕāÖÖ»ģŗĻÄ£ŠĶµÄĶųĀē½į¹¹Óėµ�Ņ»Ä£ŠĶĻą±Čøüø´ŌÓ�¢¼ĘĖćĮæøü´ó£¬ĖłŅŌÄ£ŠĶŃµĮ·µÄŹ±¼äøü³¤�£Ņņ´Ė£¬ŠčŅŖŌŚŅŌŗóµÄ¹¤×÷ÖŠ¶ŌÄ£ŠĶ½ųŠŠÓÅ»ÆŅŌĖõ¶ĢÄ£ŠĶµÄŃµĮ·Ź±¼ä�£