KAIST´Â »ý¸íÈÇаøÇаú ÀÌ»ó¿± Æ¯ÈƱ³¼ö¿Í ¹Ì±¹ Ķ¸®Æ÷´Ï¾Æ´ëÇб³ »÷µð¿¡ÀÌ°íÄ·ÆÛ½º(UCSD) »ý¸í°øÇаú ¹ö³ªµå ÆȽ¼(Bernhard Palsson) ±³¼ö °øµ¿¿¬±¸ÆÀÀÌ ÀΰøÁö´ÉÀ» ÀÌ¿ëÇØ ´Ü¹éÁú ¼¿·ÎºÎÅÍ Àü»çÀÎÀÚ¸¦ ¿¹ÃøÇÏ´Â ½Ã½ºÅÛÀÎ `µöƼÆÑÅÍ(DeepTFactor)'¸¦ °³¹ßÇß´Ù°í 29ÀÏ ¹àÇû´Ù. À̹ø ¿¬±¸´Â ±¹Á¦ÇмúÁöÀÎ `¹Ì±¹±¹¸³°úÇпøȸº¸(PNAS)' 12¿ù 28ÀÏÀÚ¿¡ °ÔÀçµÆ´Ù. ³í¹®¸íÀº "DeepTFactor: A deep learning-based tool for the prediction of transcription factors"ÀÌ´Ù.
Àü»çÀÎÀÚ(transcription factor)´Â À¯ÀüÀÚÀÇ Àü»ç(À¯Àü Á¤º¸¸¦ º¹»çÇÏ´Â °úÁ¤)¸¦ Á¶ÀýÇÏ´Â ´Ü¹éÁú·Î, ƯÁ¤ DNA ¼¿¿¡ ƯÀÌÀûÀ¸·Î °áÇÕÇØ À¯ÀüÀÚÀÇ Àü»ç¸¦ Á¶ÀýÇÑ´Ù. Àü»çÀÎÀڴ ƯÁ¤ÇÑ DNA ¼¿¿¡ ƯÀÌÀûÀ¸·Î °áÇÕÇØ À¯ÀüÀÚÀÇ Àü»ç¸¦ Á¶ÀýÇÏ´Â ´Ü¹éÁúÀÌ´Ù. Àü»çÀÎÀÚ·Î ÀÎÇÑ À¯ÀüÀÚ Àü»ç¸¦ ºÐ¼®ÇÔÀ¸·Î½á À¯±âü°¡ À¯ÀüÀû ¶Ç´Â ȯ°æÀû º¯È¿¡ ¾î¶»°Ô ¹ÝÀÀÇØ À¯ÀüÀÚÀÇ ¹ßÇöÀ» Á¦¾îÇÏ´ÂÁö ÀÌÇØÇÒ ¼ö ÀÖ´Ù. ÀÌ·¯ÇÑ Á¡¿¡¼ À¯±âüÀÇ Àü»çÀÎÀÚ¸¦ ã´Â °ÍÀº À¯±âüÀÇ Àü»ç Á¶Àý ½Ã½ºÅÛ ºÐ¼®À» À§ÇÑ Ã¹ ´Ü°è¶ó°í ÇÒ ¼ö ÀÖ´Ù.
Áö±Ý±îÁö »õ·Î¿î Àü»çÀÎÀÚ¸¦ ã±â À§Çؼ´Â ÀÌ¹Ì ¾Ë·ÁÁø Àü»çÀÎÀÚ¿ÍÀÇ »óµ¿¼º(À¯»çÇÑ ¼ºÁú)À» ºÐ¼®Çϰųª, ±â°èÇнÀ(¸Ó½Å·¯´×)°ú °°Àº µ¥ÀÌÅÍ ±â¹ÝÀÇ Á¢±Ù ¹æ½ÄÀ» ÀÌ¿ëÇß´Ù. ±âÁ¸ÀÇ ±â°èÇнÀ ¸ðµ¨À» ÀÌ¿ëÇϱâ À§Çؼ´Â ºÐÀÚÀÇ ¹°¸® ÈÇÐÀû Ư¼ºÀ» °è»êÇϰųª, »ý¹°ÇÐÀû ¼¿ÀÇ »óµ¿¼ºÀ» ºÐ¼®ÇÏ´Â µî, ÇØ°áÇÏ°íÀÚ ÇÏ´Â ¹®Á¦¿¡ ´ëÇÑ Àü¹® Áö½Ä¿¡ ÀÇÁ¸ÇØ ¸ðµ¨ÀÇ ÀԷ°ªÀ¸·Î »ç¿ëÇÒ Æ¯Â¡À» ã¾Æ³»´Â °úÁ¤ÀÌ ÇÊ¿äÇÏ´Ù.
ÇÑÆí, ½ÉÃþ ÇнÀ(µö·¯´×)Àº ¹®Á¦ ÇØ°áÀ» À§ÇÑ ÀáÀçÀûÀΠƯ¡À» ³»ÀçÀûÀ¸·Î ÇнÀÇÒ ¼ö Àֱ⿡ ÃÖ±Ù ´Ù¾çÇÑ »ý¹°ÇÐ ºÐ¾ß¿¡¼ È°¿ëµÇ°í ÀÖ´Ù. ÇÏÁö¸¸, ½ÉÃþ ÇнÀÀ» ÀÌ¿ëÇÑ ¿¹Ãø ½Ã½ºÅÛÀÇ °æ¿ì ½Ã½ºÅÛ ³»ºÎÀÇ º¹ÀâÇÑ ¿¬»ê ¶§¹®¿¡ Ãß·Ð °úÁ¤À» Á÷Á¢ È®ÀÎÇÒ ¼ö ¾ø´Â `ºí·¢¹Ú½º(black box)'¶ó´Â Ư¡À» °¡Áö°í ÀÖ´Ù.
°øµ¿¿¬±¸ÆÀÀº ½ÉÃþ ÇнÀ ±â¹ýÀ» ÀÌ¿ëÇØ ÁÖ¾îÁø ´Ü¹éÁú ¼¿ÀÌ Àü»çÀÎÀÚÀÎÁö ¿¹ÃøÇÒ ¼ö ÀÖ´Â ½Ã½ºÅÛÀÎ µöƼÆÑÅÍ(DeepTFactor)¸¦ °³¹ßÇß´Ù. µöƼÆÑÅÍ´Â ´Ü¹éÁú ¼¿·ÎºÎÅÍ Àü»çÀÎÀÚ¸¦ ¿¹ÃøÇϱâ À§ÇØ ¼¼ °³ÀÇ º´·ÄÀûÀÎ ÇÕ¼º°ö ½Å°æ¸Á(convolutional neural network)À» ÀÌ¿ëÇÑ´Ù. °øµ¿¿¬±¸ÆÀÀº µöƼÆÑÅ͸¦ ÀÌ¿ëÇØ ´ëÀå±Õ(Escherichia coli K-12 MG1655)ÀÇ Àü»çÀÎÀÚ 332°³¸¦ ¿¹ÃøÇßÀ¸¸ç, ±×Áß 3°³ÀÇ Àü»çÀÎÀÚÀÇ °Ô³ð Àüü °áÇÕ À§Ä¡(genome-wide binding site)¸¦ ½ÇÇèÀ¸·Î È®ÀÎÇÔÀ¸·Î½á µöƼÆÑÅÍÀÇ ¼º´ÉÀ» °ËÁõÇß´Ù.
|
|
|
¡ã Àü»çÀÎÀÚ ¿¹ÃøÀ» À§ÇÑ ½ÉÃþ ÇнÀ ¸ðµ¨ÀÇ ³×Æ®¿öÅ© ±¸Á¶ |
°øµ¿¿¬±¸ÆÀÀº ³ª¾Æ°¡ µöƼÆÑÅÍÀÇ Ãß·Ð °úÁ¤À» ÀÌÇØÇϱâ À§ÇØ Æ¯Â¡ Áöµµ(saliency map) ±â¹ÝÀÇ ½ÉÃþ ÇнÀ ¸ðµ¨ Çؼ® ¹æ¹ý·ÐÀ» »ç¿ëÇß´Ù. À̸¦ ÅëÇØ µöƼÆÑÅÍÀÇ ÇнÀ °úÁ¤¿¡¼ Àü»çÀÎÀÚÀÇ DNAÀÇ °áÇÕ ¿µ¿ª¿¡ ´ëÇÑ Á¤º¸°¡ ¸í½ÃÀûÀ¸·Î ÁÖ¾îÁöÁö ¾Ê¾ÒÁö¸¸, ³»ÀçÀûÀ¸·Î À̸¦ ÇнÀÇØ ¿¹Ãø¿¡ È°¿ëÇÑ´Ù´Â »ç½ÇÀ» È®ÀÎÇß´Ù.
¿¬±¸ÆÀ °ü°èÀÚ¿¡ µû¸£¸é, ƯÁ¤ »ý¹°±ºÀÇ ´Ü¹éÁú ¼¿¸¸À» À§ÇØ °³¹ßµÆ´ø ÀÌÀü ¿¹Ãø ¹æ¹ý·Ðµé°ú ´Þ¸®, µöƼÆÑÅÍ´Â ¸ðµç »ý¹°±ºÀÇ ´Ü¹éÁú ¼¿¿¡¼ ¿ì¼öÇÑ ¼º´ÉÀ» º¸¿© ´Ù¾çÇÑ À¯±âüÀÇ Àü»ç ½Ã½ºÅÛ ºÐ¼®¿¡ È°¿ë °¡´ÉÇÒ °ÍÀ¸·Î ±â´ëµÈ´Ù.
ÀÌ»ó¿± Æ¯ÈƱ³¼ö´Â “À̹ø ¿¬±¸¿¡¼ °³¹ßÇÑ µöƼÆÑÅ͸¦ ÀÌ¿ëÇؼ »õ·Ó°Ô ¹ß°ßµÇ´Â ´Ü¹éÁú ¼¿°ú ¾ÆÁ÷ Ư¼ºÈµÇÁö ¾ÊÀº ¼ö¸¹Àº ´Ü¹éÁú ¼¿À» ³ôÀº ó¸® ´É·ÂÀ¸·Î ºÐ¼®ÇÒ ¼ö ÀÖ°Ô µÆ´Ù”¸ç “ÀÌ´Â À¯±âüÀÇ ÀüÀÚ Á¶Àý ³×Æ®¿öÅ© ºÐ¼®À» À§ÇÑ ±âÃÊ ±â¼ú·Î½á È°¿ë °¡´ÉÇÒ °Í”À̶ó°í ¹àÇû´Ù.
ÇÑÆí, À̹ø ¿¬±¸´Â °ú±âÁ¤ÅëºÎ°¡ Áö¿øÇÏ´Â ±âÈĺ¯È´ëÀÀ±â¼ú°³¹ß»ç¾÷ÀÇ ¹ÙÀÌ¿À¸®ÆÄÀ̳ʸ®¸¦ À§ÇÑ ½Ã½ºÅÛ´ë»ç°øÇÐ ¿øõ±â¼ú°³¹ß °úÁ¦ Áö¿øÀ» ¹Þ¾Æ ¼öÇàµÆ´Ù. |