½ºÀ§½º Ã븮È÷¿¬¹æ°ø´ë(ETH Zurich) ·Îº¿½Ã½ºÅÛÁî·¦(Robot Systems Lab) ¿¬±¸ÆÀÀÌ »ç´Ù¸®¸¦ ´É¼÷ÇÏ°Ô ¿À¸£´Â 4Á· º¸Çà ·Îº¿ ±â¼úÀ» ±¸ÇöÇß´Ù.
¿¬±¸ÆÀ¿¡ µû¸£¸é, ÃÖ±Ù 4Á· º¸Çà ·Îº¿ÀÌ »ê¾÷ ½Ã¼³ Á¡°Ë¿ë ¼Ö·ç¼ÇÀ¸·Î ÁÖ¸ñ¹Þ°í ÀÖÀ¸³ª, »ê¾÷¿ë ½Ã¼³¿¡ ÈçÈ÷ ¹èÄ¡µÅ ÀÖ´Â »ç´Ù¸® ±¸Á¶¹°À» ´É¼÷ÇÏ°Ô Åë°úÇÏ´Â °ÍÀº ¸Å¿ì µµÀüÀûÀÎ °úÁ¦´Ù. ±×µ¿¾È ¸î¸î ¿¬±¸±â°ü ¶Ç´Â ±â¾÷µéÀÌ »ç´Ù¸®¸¦ ¿À¸£´Â ·Îº¿ ±â¼ú °³¹ß¿¡ ³ª¼¹À¸³ª ¿Ã¶ó°¡´Â ¼Óµµ°¡ ´À¸®°í È¿À²ÀûÀÎ µ¿ÀÛÀ» ±¸ÇöÇÏÁö ¸øÇß´Ù.
Ã븮È÷¿¬¹æ°ø´ë ¿¬±¸ÆÀÀº °ÈÇнÀ ±â¹Ý Á¦¾î Á¤Ã¥À» ±â¹ÝÀ¸·Î, ³¡ºÎºÐÀÌ ±¸ºÎ·¯Á® ÀÖ´Â ¿£µå ÀÌÆåÅ͸¦ ·Îº¿ ´Ù¸®¿¡ ºÎÂøÇØ »ç´Ù¸®¸¦ ´É¼÷ÇÏ°Ô ¿À¸£´Â ±â¼úÀ» ±¸ÇöÇß´Ù. ±¸ºÎ·¯Áø ¿£µå ¿¡ÆåÅÍ´Â ·Îº¿ÀÌ »ç´Ù¸®¸¦ ¿À¸£´Â °úÁ¤¿¡¼ ¹Ì²ô·¯Áö°Å³ª ÈûÀ» Á¦´ë·Î ¹ÞÁö ¸øÇÏ´Â ÇѰ踦 ±Øº¹Çß´Ù.
¿¬±¸ÆÀÀº ‘Ư±Ç ±³»ç-Çлý °ÈÇнÀ Á¢±Ù¹ý(privileged teacher-student reinforcement learning approach)’À» È°¿ëÇØ ½Ã¹Ä·¹ÀÌ¼Ç »ó¿¡¼ ·Îº¿À» ÇнÀ½ÃÄ×´Ù. ÀÌ¾î ½ÇÁ¦ ·Îº¿¿¡ Á¦·Î-¼¦ Á¤Ã¥À» Àû¿ë, 90%ÀÇ »ç´Ù¸® ¿À¸£±â ¼º°ø·üÀ» º¸¿´´Ù. ¿¬±¸ÆÀÀº ±¸ºÎ·¯Áø ¿£µå ¿¡ÆåÅ͸¦ ÀåÂøÇÑ 4Á· º¸Çà ·Îº¿ÀÌ ±âÁ¸ÀÇ 4Á· º¸Çà ·Îº¿¿¡ ºñÇØ ¾ÈÁ¤ÀûÀ¸·Î, ±×¸®°í ºü¸£°Ô »ç´Ù¸®¸¦ ¿À¸£´Â °ÍÀ» È®ÀÎÇß´Ù. ¿¬±¸ÆÀÀº ÇâÈÄ ¿ÜºÎ¿¡ ¼³Ä¡µÅ ÀÖ´Â ºñÀü ½Ã½ºÅÛ¿¡ ÀÇÁ¸ÇÏÁö ¾Ê°í, ½Éµµ Ä«¸Þ¶ó À̹ÌÁö¸¦ È°¿ëÇØ È¯°æÀ» ÀνÄÇÒ ¼ö ÀÖ´Â ±â¼ú °³¹ß¿¡ ³ª¼±´Ù´Â °èȹÀÌ´Ù.
|