¼¿·ºÆ®½ºÅ¸, Çѱ¹¾î ÀÚ¿¬¾î µ¥ÀÌÅͼ ¡®Å¬·ç¡¯ ±¸Ãà Âü¿©
ÀÔ·Â: 2021-05-31 16:24
¾È°æ¾Ö ±âÀÚ

Ŭ·ç´Â Çѱ¹¾î ÀÚ¿¬¾î ÀÌÇØ Æò°¡ µ¥ÀÌÅͼÂ(Korean Language Understanding Evaluation Benchmark)ÀÇ ¾àÀÚ·Î, Çѱ¹¾î ¾ð¾î¸ðµ¨ÀÇ °øÁ¤ÇÑ Æò°¡¸¦ À§ÇØ 8°³ Á¾·ùÀÇ Çѱ¹¾î ÀÚ¿¬¾î ÀÌÇØ ¹®Á¦°¡ Æ÷ÇÔµÈ µ¥ÀÌÅÍ ÁýÇÕü´Ù. ´º½º Çìµå¶óÀÎ ºÐ·ù, ¹®Àå À¯»çµµ ºñ±³, ÀÚ¿¬¾î Ãß·Ð, °³Ã¼¸í ÀνÄ, °ü°è ÃßÃâ, ÇüÅÂ¼Ò ¹× ÀÇÁ¸ ±¸¹® ºÐ¼®, ±â°è µ¶ÇØ ÀÌÇØ, ´ëÈ »óÅ ÃßÀû µîÀÌ´Ù. ´º¿å´ë, KAIST, ¼¿ï´ë, ¿¬¼¼´ë, °æÈñ´ë, ¼°´ë, Çѹç´ë µîÀÇ Çаè¿Í ¾÷½ºÅ×ÀÌÁö, ³×À̹ö Ŭ·Î¹Ù, īī¿À¿£ÅÍÇÁ¶óÀÌÁî, ½ºÄ³ÅÍ·¦, ·òÀÌµå µîÀÌ ±â°üÀ̳ª °³ÀÎ ¿¬±¸ÀÚ ÀÚ°ÝÀ¸·Î 7°³¿ù°£ Çù¾÷À» ÁøÇàÇß´Ù.
¼¿·ºÆ®½ºÅ¸´Â Àüü µ¥ÀÌÅͼ Áß Àý¹ÝÀÎ ´º½º Çìµå¶óÀÎ ºÐ·ù(Topic Classification,TC), ¹®Àå À¯»çµµ ºñ±³(Semantic Textual Similarity, STS), ÀÚ¿¬¾î Ãß·Ð(Natural Language Inference, NLI), ±â°è µ¶ÇØ ÀÌÇØ(Machine Reading Comprehension, MRC) µ¥ÀÌÅͼÂÀ» ±¸ÃàÇß´Ù. ¼¿·ºÆ®½ºÅ¸ ÁÖ°üÀÇ 'ÀΰøÁö´É µ¥ÀÌÅͼ Áö¿ø»ç¾÷(dataset.or.kr)'À» ÅëÇØ KLUE µ¥ÀÌÅͼ ½ºÆù¼·Îµµ Âü¿©Çß´Ù.
KLUE µ¥ÀÌÅͼÂÀº ¿µÇÑ ¹ø¿ª¹®ÀÌ ¾Æ´Ñ ÀÏ»ó»ýȰ¿¡¼ ½Ç»ç¿ëµÇ´Â Çѱ¹¾î ¿ø¹®À¸·Î¸¸ Á¦À۵ŠÇѱ¹¾îÀÇ Á¤È®ÇÑ ÀÌÇØ¿Í Ãß·Ð ´É·ÂÀ» Æò°¡ÇÒ ¼ö ÀÖ´Ù. ƯÈ÷ ´Ù¾çÇÑ Çѱ¹¾î ¾ð¾î¸ðµ¨ÀÌ µ¿ÀÏÇÑ Æò°¡¼±»ó¿¡¼ Á¤È®ÇÏ°Ô ºñ±³µÉ ¼ö ÀÖ´Â Æò°¡±âÁذú Åä´ë°¡ µÈ´Ù´Â Á¡¿¡¼ Àǹ̰¡ ÀÖ´Ù. Ŭ·ç´Â ¶ÇÇÑ ´©±¸³ª µ¥ÀÌÅÍ¿¡ Á¢±Ù, Ȱ¿ëÇÒ ¼ö ÀÖ´Â ¶óÀ̼±½º¸¦ ºÎÂøÇÑ ±¹³» ÃÖÃÊ ¿ÀÇ µ¥ÀÌÅͼÂÀ̶ó´Â Á¡¿¡¼ ÀÇÀǰ¡ ÀÖ´Ù.
±è¼¼¿± ¼¿·ºÆ®½ºÅ¸ ´ëÇ¥´Â "ÄÚÄõµå(KorQuad) 2.0¿¡ ÀÌ¾î ´ëÇ¥ Çѱ¹¾î NLP µ¥ÀÌÅͼ ±¸Ãà¿¡ Âü¿©ÇØ ±â»Ú°í, Ŭ·ç µ¥ÀÌÅͼÂÀÌ Çѱ¹¾î NLP ±â¼ú ¹ßÀü¿¡ Å« µµ¿òÀÌ µÇ±â¸¦ ¹Ù¶õ´Ù"°í ÀüÇß´Ù.
ÇÑÆí, ¼¿·ºÆ®½ºÅ¸´Â ÀÚü ¼öÇÐÀû ¾Ë°í¸®Áò, µö·¯´× ±â¼ú µîÀÇ µ¥ÀÌÅÍ Ç°ÁúÀ» °ü¸®ÇÏ´Â ±â¼ú·Â°ú ¼ºÀ强À» ÀÎÁ¤¹Þ¾Æ ÃÖ±Ù 'Æ÷ºê½º 2021³â ¾Æ½Ã¾Æ 30¼¼ ÀÌÇÏ ¸®´õ'¿¡¼ ¿£ÅÍÇÁ¶óÀÌÁî Å×Å©³î·ÎÁö ºÐ¾ß ´ëÇ¥·Î ¼±Á¤µÈ ¹Ù ÀÖ´Ù. ¾È°æ¾Ö±âÀÚ naturean@dt.co.kr
[ ÀúÀÛ±ÇÀÚ ¨ÏµðÁöÅПÀÓ½º, ¹«´Ü ÀüÀç ¹× Àç¹èÆ÷ ±ÝÁö ]