KAIST »ý¸íÈÇаøÇаú ÀÌ»ó¿± Æ¯ÈƱ³¼ö¿Í ±èÇö¿í ±³¼öÀÇ Ãʼ¼´ë Çù¾÷¿¬±¸½Ç °øµ¿¿¬±¸ÆÀÀÌ µö·¯´×(deep learning) ±â¼úÀ» ÀÌ¿ëÇØ È¿¼ÒÀÇ ±â´ÉÀ» ½Å¼ÓÇÏ°í Á¤È®ÇÏ°Ô ¿¹ÃøÇÒ ¼ö ÀÖ´Â ÄÄÇ»ÅÍ ¹æ¹ý·Ð DeepEC¸¦ °³¹ßÇß´Ù.
°øµ¿¿¬±¸ÆÀÀÇ ·ùÀç¿ë ¹Ú»ç°¡ 1 ÀúÀÚ·Î Âü¿©ÇÑ À̹ø ¿¬±¸°á°ú´Â ±¹Á¦ÇмúÁö ‘¹Ì±¹ ±¹¸³°úÇпø ȸº¸(PNAS)’ 6¿ù 20ÀÏ ÀÚ ¿Â¶óÀÎÆÇ¿¡ °ÔÀçµÆ´Ù. (³í¹®¸í : Deep learning enables high-quality and high-throughput prediction of enzyme commission numbers)
È¿¼Ò´Â ¼¼Æ÷ ³»ÀÇ »ýÈÇйÝÀÀµéÀ» ÃËÁøÇÏ´Â ´Ü¹éÁú Ã˸ŷΠÀ̵éÀÇ ±â´ÉÀ» Á¤È®È÷ ÀÌÇØÇÏ´Â °ÍÀº ¼¼Æ÷ÀÇ ´ë»ç(metabolism) °úÁ¤À» ÀÌÇØÇÏ´Â µ¥¿¡ ¸Å¿ì Áß¿äÇÏ´Ù. ƯÈ÷ È¿¼ÒµéÀº ´Ù¾çÇÑ Áúº´ ¹ß»ý ¿ø¸® ¹× »ê¾÷ »ý¸í°øÇаú ¹ÐÁ¢ÇÑ ¿¬°üÀÌ ÀÖ¾î ¹æ´ëÇÑ °Ô³ð Á¤º¸¿¡¼ È¿¼ÒµéÀÇ ±â´ÉÀ» ºü¸£°í Á¤È®ÇÏ°Ô ¿¹ÃøÇÏ´Â ±â¼úÀº ÀÀ¿ë±â¼ú Ãø¸é¿¡¼µµ Áß¿äÇÏ´Ù. È¿¼ÒÀÇ ±â´ÉÀ» Ç¥±âÇÏ´Â ½Ã½ºÅÛ Áß ´ëÇ¥ÀûÀÎ °ÍÀÌ EC ¹øÈ£(enzyme commission number)ÀÌ´Ù. EC ¹øÈ£´Â ‘EC 3.4.11.4’ó·³ È¿¼Ò°¡ ¸Å°³ÇÏ´Â »ýÈÇйÝÀÀµéÀÇ Á¾·ù¿¡ µû¶ó ÃÑ 4°³ÀÇ ¼ýÀÚ·Î ±¸¼ºµÅ ÀÖ´Ù.
Áß¿äÇÑ °ÍÀº ƯÁ¤ È¿¼Ò¿¡ ÁÖ¾îÁø EC ¹øÈ£¸¦ ÅëÇؼ ÇØ´ç È¿¼Ò°¡ ¾î¶°ÇÑ Á¾·ùÀÇ »ýÈÇйÝÀÀÀ» ¸Å°³ÇÏ´ÂÁö ¾Ë ¼ö ÀÖ´Ù´Â °ÍÀÌ´Ù. µû¶ó¼ °Ô³ðÀ¸·ÎºÎÅÍ ¾òÀ» ¼ö ÀÖ´Â È¿¼Ò ´Ü¹éÁú ¼¿ÀÇ EC ¹øÈ£¸¦ ºü¸£°í Á¤È®ÇÏ°Ô ¿¹ÃøÇÒ ¼ö ÀÖ´Â ±â¼úÀº È¿¼Ò ¹× ´ë»ç °ü·Ã ¹®Á¦¸¦ ÇØ°áÇÏ´Â µ¥ Áß¿äÇÑ ¿ªÇÒÀ» ÇÑ´Ù.
ÀÛ³â±îÁö ¿©·¯ ÇØ¿¡ °ÉÃÄ EC ¹øÈ£¸¦ ¿¹ÃøÇØÁÖ´Â ÄÄÇ»ÅÍ ¹æ¹ý·ÐµéÀÌ ÃÖ¼Ò 10°³ ÀÌ»ó °³¹ßµÆ´Ù. ±×·¯³ª ÀÌµé ¸ðµÎ ¿¹Ãø ¼Óµµ, ¿¹Ãø Á¤È®¼º ¹× ¿¹Ãø °¡´É ¹üÀ§ Ãø¸é¿¡¼ ¹ßÀü Çʿ伺ÀÌ ÀÖ¾ú´Ù. ƯÈ÷ Çö´ë »ý¸í°úÇÐ ¹× »ý¸í°øÇп¡¼ ÀÌ·ïÁö´Â ¿¬±¸ÀÇ ¼Óµµ¿Í ±Ô¸ð¸¦ °í·ÁÇßÀ» ¶§ ÀÌ·¯ÇÑ ¹æ¹ý·ÐÀÇ ¼º´ÉÀº ÃæºÐÇÏÁö ¾Ê¾Ò´Ù.
|
|
|
¡ã ÀΰøÁö´É ±â¹ÝÀÇ DeepEC¸¦ ÀÌ¿ëÇÑ È¿¼Ò ±â´É EC ¹øÈ£ ¿¹Ãø |
°øµ¿¿¬±¸ÆÀÀº 138¸¸8606°³ÀÇ ´Ü¹éÁú ¼¿°ú À̵鿡°Ô ½Å·Ú¼º ÀÖ°Ô ºÎ¿©µÈ EC ¹øÈ£¸¦ ´ã°í ÀÖ´Â ¹ÙÀÌ¿À ºòµ¥ÀÌÅÍ¿¡ µö·¯´× ±â¼úÀ» Àû¿ëÇØ EC ¹øÈ£¸¦ ºü¸£°í Á¤È®ÇÏ°Ô ¿¹ÃøÇÒ ¼ö ÀÖ´Â DeepEC¸¦ °³¹ßÇß´Ù. DeepEC´Â ÁÖ¾îÁø ´Ü¹éÁú ¼¿ÀÇ EC ¹øÈ£¸¦ ¿¹ÃøÇϱâ À§Çؼ 3°³ÀÇ ÇÕ¼º°ö ½Å°æ¸Á(Convolutional neural network)À» ÁÖ¿ä ¿¹Ãø±â¼ú·Î »ç¿ëÇϸç, ÇÕ¼º°ö ½Å°æ¸ÁÀ¸·Î EC ¹øÈ£¸¦ ¿¹ÃøÇÏÁö ¸øÇßÀ» °æ¿ì ¼¿Á¤·Ä(sequence alignment)À» ÅëÇؼ EC ¹øÈ£¸¦ ¿¹ÃøÇÑ´Ù.
¿¬±¸ÆÀÀº ´õ ³ª¾Æ°¡ ´Ü¹éÁú ¼¿ÀÇ µµ¸ÞÀÎ(domain)°ú ±âÁú °áÇÕ ºÎÀ§ Àܱâ(binding site residue)¿¡ º¯À̸¦ ÀÎÀ§ÀûÀ¸·Î ÁÖ¾úÀ» ¶§, DeepEC°¡ °¡Àå ¹Î°¨ÇÏ°Ô ÇØ´ç º¯ÀÌÀÇ ¿µÇâÀ» °¨ÁöÇÏ´Â °ÍÀ» È®ÀÎÇß´Ù.
±èÇö¿í ±³¼ö´Â “DeepECÀÇ ¼º´ÉÀ» Æò°¡Çϱâ À§Çؼ ÀÌÀü¿¡ ¹ßÇ¥µÈ 5°³ÀÇ ´ëÇ¥ÀûÀÎ EC ¹øÈ£ ¿¹Ãø ¹æ¹ý·Ð°ú ºñ±³Çغ¸´Ï DeepEC°¡ °¡Àå ºü¸£°í Á¤È®ÇÏ°Ô ÁÖ¾îÁø ´Ü¹éÁúÀÇ EC ¹øÈ£¸¦ ¿¹ÃøÇÏ´Â °ÍÀ¸·Î ³ªÅ¸³µ´Ù”¶ó¸ç “È¿¼Ò ±â´É ¿¬±¸¿¡ Å©°Ô À̹ÙÁöÇÒ °ÍÀ¸·Î ±â´ëÇÑ´Ù”¶ó°í ¸»Çß´Ù.
ÀÌ»ó¿± Æ¯ÈƱ³¼ö´Â “À̹ø¿¡ °³¹ßÇÑ DeepEC¸¦ ÅëÇؼ Áö¼ÓÇؼ Àç»ýµÇ´Â °Ô³ð ¹× ¸ÞŸ °Ô³ð¿¡ Á¸ÀçÇÏ´Â ¹æ´ëÇÑ È¿¼Ò ´Ü¹éÁú ¼¿ÀÇ ±â´ÉÀ» º¸´Ù È¿À²ÀûÀÌ°í Á¤È®ÇÏ°Ô ¾Ë¾Æ³»´Â °ÍÀÌ °¡´ÉÇØÁ³´Ù”¶ó°í ¸»Çß´Ù.
À̹ø ¿¬±¸´Â °úÇбâ¼úÁ¤º¸Åë½ÅºÎ°¡ Áö¿øÇÏ´Â ±âÈĺ¯È´ëÀÀ±â¼ú°³¹ß»ç¾÷ÀÇ ¹ÙÀÌ¿À¸®ÆÄÀ̳ʸ®¸¦ À§ÇÑ ½Ã½ºÅÛ´ë»ç°øÇÐ ¿øõ±â¼ú°³¹ß °úÁ¦ ¹× ¹ÙÀÌ¿À·ÀÇ·á±â¼ú °³¹ß Korea Bio Grand Challenge »ç¾÷ÀÇ Áö¿øÀ» ¹Þ¾Æ ¼öÇàµÆ´Ù. |