µðÁöÅПÀÓ½º

 


¼¿·ºÆ®½ºÅ¸, Çѱ¹¾î ÀÚ¿¬¾î µ¥ÀÌÅͼ ¡®Å¬·ç¡¯ ±¸Ãà Âü¿©

ÇÁ¸°Æ® ÆäÀ̽ººÏ Æ®À§ÅÍ Ä«Ä«¿À½ºÅ丮
¼¿·ºÆ®½ºÅ¸, Çѱ¹¾î ÀÚ¿¬¾î µ¥ÀÌÅͼ ¡®Å¬·ç¡¯ ±¸Ãà Âü¿©
¼¿·ºÆ®½ºÅ¸ÀÇ ±è¼¼¿±(¿ÞÂÊ), ½ÅÈ£¿í °øµ¿´ëÇ¥ ¼¿·ºÆ®½ºÅ¸ Á¦°ø

Å©¶ó¿ìµå¼Ò½Ì ±â¹Ý AI(ÀΰøÁö´É) ÇнÀµ¥ÀÌÅÍ ±¸Ãà ½ºÅ¸Æ®¾÷ ¼¿·ºÆ®½ºÅ¸(´ëÇ¥ ±è¼¼¿±, ½ÅÈ£¿í)´Â Çѱ¹¾î NLP(ÀÚ¿¬¾îó¸®) µ¥ÀÌÅͼ 'Ŭ·ç(KLUE)' ±¸Ãà¿¡ Âü¿©Çß´Ù°í ¹àÇû´Ù.

Ŭ·ç´Â Çѱ¹¾î ÀÚ¿¬¾î ÀÌÇØ Æò°¡ µ¥ÀÌÅͼÂ(Korean Language Understanding Evaluation Benchmark)ÀÇ ¾àÀÚ·Î, Çѱ¹¾î ¾ð¾î¸ðµ¨ÀÇ °øÁ¤ÇÑ Æò°¡¸¦ À§ÇØ 8°³ Á¾·ùÀÇ Çѱ¹¾î ÀÚ¿¬¾î ÀÌÇØ ¹®Á¦°¡ Æ÷ÇÔµÈ µ¥ÀÌÅÍ ÁýÇÕü´Ù. ´º½º Çìµå¶óÀÎ ºÐ·ù, ¹®Àå À¯»çµµ ºñ±³, ÀÚ¿¬¾î Ãß·Ð, °³Ã¼¸í ÀνÄ, °ü°è ÃßÃâ, ÇüÅÂ¼Ò ¹× ÀÇÁ¸ ±¸¹® ºÐ¼®, ±â°è µ¶ÇØ ÀÌÇØ, ´ëÈ­ »óÅ ÃßÀû µîÀÌ´Ù. ´º¿å´ë, KAIST, ¼­¿ï´ë, ¿¬¼¼´ë, °æÈñ´ë, ¼­°­´ë, Çѹç´ë µîÀÇ Çаè¿Í ¾÷½ºÅ×ÀÌÁö, ³×À̹ö Ŭ·Î¹Ù, īī¿À¿£ÅÍÇÁ¶óÀÌÁî, ½ºÄ³ÅÍ·¦, ·òÀÌµå µîÀÌ ±â°üÀ̳ª °³ÀÎ ¿¬±¸ÀÚ ÀÚ°ÝÀ¸·Î 7°³¿ù°£ Çù¾÷À» ÁøÇàÇß´Ù.

¼¿·ºÆ®½ºÅ¸´Â Àüü µ¥ÀÌÅͼ Áß Àý¹ÝÀÎ ´º½º Çìµå¶óÀÎ ºÐ·ù(Topic Classification,TC), ¹®Àå À¯»çµµ ºñ±³(Semantic Textual Similarity, STS), ÀÚ¿¬¾î Ãß·Ð(Natural Language Inference, NLI), ±â°è µ¶ÇØ ÀÌÇØ(Machine Reading Comprehension, MRC) µ¥ÀÌÅͼÂÀ» ±¸ÃàÇß´Ù. ¼¿·ºÆ®½ºÅ¸ ÁÖ°üÀÇ 'ÀΰøÁö´É µ¥ÀÌÅͼ Áö¿ø»ç¾÷(dataset.or.kr)'À» ÅëÇØ KLUE µ¥ÀÌÅͼ ½ºÆù¼­·Îµµ Âü¿©Çß´Ù.

KLUE µ¥ÀÌÅͼÂÀº ¿µÇÑ ¹ø¿ª¹®ÀÌ ¾Æ´Ñ ÀÏ»ó»ýȰ¿¡¼­ ½Ç»ç¿ëµÇ´Â Çѱ¹¾î ¿ø¹®À¸·Î¸¸ Á¦À۵ŠÇѱ¹¾îÀÇ Á¤È®ÇÑ ÀÌÇØ¿Í Ãß·Ð ´É·ÂÀ» Æò°¡ÇÒ ¼ö ÀÖ´Ù. ƯÈ÷ ´Ù¾çÇÑ Çѱ¹¾î ¾ð¾î¸ðµ¨ÀÌ µ¿ÀÏÇÑ Æò°¡¼±»ó¿¡¼­ Á¤È®ÇÏ°Ô ºñ±³µÉ ¼ö ÀÖ´Â Æò°¡±âÁذú Åä´ë°¡ µÈ´Ù´Â Á¡¿¡¼­ Àǹ̰¡ ÀÖ´Ù. Ŭ·ç´Â ¶ÇÇÑ ´©±¸³ª µ¥ÀÌÅÍ¿¡ Á¢±Ù, Ȱ¿ëÇÒ ¼ö ÀÖ´Â ¶óÀ̼±½º¸¦ ºÎÂøÇÑ ±¹³» ÃÖÃÊ ¿ÀÇ µ¥ÀÌÅͼÂÀ̶ó´Â Á¡¿¡¼­ ÀÇÀǰ¡ ÀÖ´Ù.

±è¼¼¿± ¼¿·ºÆ®½ºÅ¸ ´ëÇ¥´Â "ÄÚÄõµå(KorQuad) 2.0¿¡ ÀÌ¾î ´ëÇ¥ Çѱ¹¾î NLP µ¥ÀÌÅͼ ±¸Ãà¿¡ Âü¿©ÇØ ±â»Ú°í, Ŭ·ç µ¥ÀÌÅͼÂÀÌ Çѱ¹¾î NLP ±â¼ú ¹ßÀü¿¡ Å« µµ¿òÀÌ µÇ±â¸¦ ¹Ù¶õ´Ù"°í ÀüÇß´Ù.

ÇÑÆí, ¼¿·ºÆ®½ºÅ¸´Â ÀÚü ¼öÇÐÀû ¾Ë°í¸®Áò, µö·¯´× ±â¼ú µîÀÇ µ¥ÀÌÅÍ Ç°ÁúÀ» °ü¸®ÇÏ´Â ±â¼ú·Â°ú ¼ºÀ强À» ÀÎÁ¤¹Þ¾Æ ÃÖ±Ù 'Æ÷ºê½º 2021³â ¾Æ½Ã¾Æ 30¼¼ ÀÌÇÏ ¸®´õ'¿¡¼­ ¿£ÅÍÇÁ¶óÀÌÁî Å×Å©³î·ÎÁö ºÐ¾ß ´ëÇ¥·Î ¼±Á¤µÈ ¹Ù ÀÖ´Ù. ¾È°æ¾Ö±âÀÚ naturean@dt.co.kr


[ ÀúÀÛ±ÇÀÚ ¨ÏµðÁöÅПÀÓ½º, ¹«´Ü ÀüÀç ¹× Àç¹èÆ÷ ±ÝÁö ]