Ä«Ä«¿À°¡ ÀÚü °³¹ßÇÑ ÀΰøÁö´É(AI) ¾ð¾î¸ðµ¨ÀÌ Çѱ¹¾î ÇнÀ µ¥ÀÌÅÍ 'KorQuAD(The Korean Question Answering Dataset)'¸¦ ¹ÙÅÁÀ¸·Î ÇÑ ±â°è µ¶ÇØ ´É·Â Æò°¡¿¡¼ 91.85Á¡À» ¹ÞÀ¸¸ç 1À§¸¦ Â÷ÁöÇß´Ù°í ¹àÇû´Ù.
LG CNS°¡ ¿î¿µÇÏ´Â ±â°è µ¶ÇØ ´É·Â Æò°¡´Â Ú¸ ½ºÅÄÆ÷µå ´ëÇп¡¼ ½ÃÀÛµÈ AI ¾ð¾îÁö´É ¿¬±¸¿ë ÁúÀÇÀÀ´ä ÇнÀ µ¥ÀÌÅͼÂÀÎ SQuAD(The Stanford Question Answering Dataset)¿Í µ¿ÀÏÇÑ ¹æ½ÄÀ¸·Î ±¸ÇöµÈ´Ù. LG CNS´Â Áö³ÇØ 12¿ù Çѱ¹¾îÇнÀÀ» À§ÇÑ µ¥ÀÌÅÍÀÎ KorQuAD¸¦ ±¸ÃàÇØ ¿ÀǼҽº·Î °ø°³ÇßÀ¸¸ç, ´©±¸³ª À̸¦ ¹ÙÅÁÀ¸·Î ÇнÀÇÑ ÀÚü °³¹ß AI ¾ð¾î¸ðµ¨À» Á¦ÃâÇØ ¼º´ÉÀ» °ø½Ä Æò°¡ ¹ÞÀ» ¼ö ÀÖµµ·Ï Çß´Ù.
Æò°¡´Â µ¥ÀÌÅͼ¿¡¼ ÃßÃâÇÑ ³»¿ëÀ» Áú¹®À¸·Î Á¦½ÃÇÏ°í, ÀÌ¿¡ ´ëÇØ °³¹ß ¸ðµ¨ÀÌ ´äÀ» ã¾Æ³»´Â ¹æ½ÄÀ¸·Î ÀÌ·ç¾îÁø´Ù. ¿¹¸¦ µé¾î “¾ÆÀÌÀ¯´Â 1993³â 5¿ù 16ÀÏ ¼¿ïƯº°½Ã¿¡¼ žÀ¸¸ç, °æ±âµµ Çϳ²½Ã¿Í ÀÇÁ¤ºÎ½Ã¸¦ °ÅÃÄ ¼¿ïƯº°½Ã ±¤Áø±¸¿¡¼ ÀÚ¶ú´Ù. ÃʵîÇб³´Â Çϳ²½ÃÀÇ Çϳ²ÃµÇöÃʵîÇб³¿¡¼ 3Çгâ±îÁö ´Ù´Ï´Ù°¡ ¼¿ï ±¤Áø±¸ÀÇ ¼¿ï¾ç³²ÃʵîÇб³·Î ÀüÇа¡ Á¹¾÷ÇÏ¿´´Ù”¿Í °°Àº Áö¹®ÀÌ ÁÖ¾îÁö°í, “¾ÆÀÌÀ¯°¡ Á¹¾÷ÇÑ ÃʵîÇб³´Â ¾îµðÀΰ¡?”¶ó´Â Áú¹®¿¡ ´ëÇØ “¼¿ï¾ç³²ÃʵîÇб³”¶ó´Â Á¤´äÀ» ã¾Æ³»´Â ½ÄÀÌ´Ù.
À̹ø¿¡ Æò°¡¹ÞÀº Ä«Ä«¿ÀÀÇ AI ¾ð¾î¸ðµ¨(¸ðµ¨¸í: BERT LM fine-tuned (single) + KHAIII)Àº ±¸±ÛÀÇ AI ¾ð¾î¸ðµ¨ BERT(Bidirectional Encoder Representations from Transformers)¿¡ Ä«Ä«¿ÀÀÇ ÇüÅÂ¼Ò ºÐ¼®±â 'khaiii(Kakao Hangul Analyzer III)’¸¦ Á¢¸ñÇÑ °ÍÀ¸·Î, Á¶»çÀÇ »ç¿ë°ú ¾î¹ÌÀÇ ´Ù¾çÇÑ º¯Çü µî Çѱ¹¾îÀÇ °íÀ¯ Ư¼º¿¡ ÃÖÀûÈµÈ °ÍÀÌ´Ù. Ä«Ä«¿À´Â Áö³ÇØ ¸» µö·¯´× ±â¼ú ±â¹ÝÀÇ ÇüÅÂ¼Ò ºÐ¼®±â khaiii¸¦ ±¹³» ÃÖÃÊ ¿ÀǼҽº·Î Á¦°øÇÏ´Â µî ±¹³» AI ±â¹Ý ¾ð¾îÁö´É ¿¬±¸ ¹ßÀüÀ» À§Çؼµµ ³ë·ÂÇÏ°í ÀÖ´Ù.
Ä«Ä«¿À ÀÚ¿¬¾îó¸®ÆÄÆ®ÀÇ ±èÀÀ±Õ ÆÄÆ®ÀåÀº “À̹ø Æò°¡ °á°ú´Â Ä«Ä«¿ÀÀÇ ÀΰøÁö´É ÀÚ¿¬¾î ó¸® ±â¼úÀ» È°¿ëÇØ Àΰ£ÀÇ µ¶ÇØ ´É·ÂÀ» ³Ñ¾î¼´Â ÃÖÃÊÀÇ ¸ðµ¨À» ±¸ÇöÇß´Ù´Â Á¡¿¡¼ ³ôÀÌ Æò°¡¹ÞÀ»¸¸ ÇÏ´Ù”¸ç “±Ý¹ø °³¹ßÇÑ ¾ð¾î¸ðµ¨ ±â¼úÀ» ½º¸¶Æ® ½ºÇÇÄ¿ Ä«Ä«¿À¹Ì´Ï¿¡ Àû¿ëÇϱâ À§ÇÑ ¿¬±¸¸¦ ÁøÇà Áß”À̶ó°í ¹àÇû´Ù. |