디지털 인사이트

인공지능이 생물학의 50년 난제를 풀다: 알파폴드(AlphaFold)의 모든 것

디지털가드너 (Digital Gardener) 2026. 5. 24. 23:29

우리가 숨을 쉬고, 음식을 소화하며, 바이러스와 싸워 이길 수 있는 이유는 무엇일까요? 이 모든 생명 활동의 중심에는 ‘단백질(Protein)’이 있습니다. 그리고 2024년, 과학계 최고의 영예인 노벨 화학상은 이 단백질의 비밀을 인공지능(AI)으로 풀어낸 구글 딥마인드(DeepMind)의 데미스 하사비스(Demis Hassabis)와 존 점퍼(John Jumper)에게 돌아갔습니다.

그들이 개발한 인공지능 ‘알파폴드(AlphaFold)’는 인류가 반세기 동안 매달려온 생물학의 최대 난제를 단숨에 해결하며 과학의 역사를 새로 썼습니다. 단순한 기술적 진보를 넘어, 신약 개발부터 기후 변화 대응까지 인류의 미래를 바꾸고 있는 알파폴드에 대해 아주 깊이 있고 자세하게 파헤쳐 보겠습니다.

1. 생명체의 만능 일꾼, 단백질과 ‘접힘(Folding)’의 비밀

알파폴드가 왜 위대한 발명인지 이해하려면, 먼저 단백질이 우리 몸에서 어떻게 만들어지고 작동하는지 알아야 합니다.

단백질은 생명체를 구성하는 벽돌이자, 생명 현상을 유지하는 기계 장치입니다. 근육을 만드는 액틴과 마이오신, 산소를 운반하는 헤모글로빈, 혈당을 조절하는 인슐린, 침입한 바이러스를 무력화하는 항체 등 우리 몸속에는 수만 종의 단백질이 각자의 역할을 수행하고 있습니다.

아미노산의 1차원 사슬이 3차원 마법을 부리기까지

단백질은 본래 20종류의 ‘아미노산(Amino acid)’이라는 기본 블록들이 일렬로 길게 연결된 1차원 사슬 형태로 만들어집니다. 마치 구슬을 꿴 목걸이와 같습니다. 하지만 이 1차원 사슬 상태로는 아무런 기능도 하지 못합니다.

단백질이 생명력을 얻으려면, 이 긴 사슬이 특정한 규칙에 따라 구불구불하게 접히고 뭉쳐서 ‘고유의 3차원 입체 구조’를 형성해야 합니다. 이를 단백질 접힘(Protein Folding)이라고 부릅니다. 열쇠가 자물쇠의 모양에 딱 맞아야 문을 열 수 있듯이, 단백질은 자신의 3차원 입체 구조에 딱 맞는 물질하고만 결합하여 특정한 화학 반응을 일으킵니다. 즉, 단백질의 ‘구조’가 곧 단백질의 ‘기능’을 결정하는 것입니다.

레빈탈의 역설 (Levinthal's Paradox)

그렇다면 아미노산 서열만 보고 그 단백질이 어떤 3차원 구조로 접힐지 미리 알 수 없을까요? 1969년, 분자생물학자 사이러스 레빈탈(Cyrus Levinthal)은 한 가지 역설을 제시했습니다.

일반적인 단백질 하나가 가질 수 있는 3차원 구조의 경우의 수는 ≈ 10³⁰⁰ 입니다. 이는 관측 가능한 우주에 존재하는 전체 원자의 수 ≈ 10⁸⁰ 보다도 아득히 큰 수치입니다. 만약 단백질이 가능한 모든 구조를 하나씩 시도해 보며 올바른 형태를 찾는다면 우주의 나이보다 더 오랜 시간이 걸릴 것입니다. 하지만 우리 몸속의 단백질은 단 몇 밀리초(1,000분의 1초) 만에 완벽하게 자신의 3차원 구조를 찾아 접힙니다.

자연은 순식간에 해내는 이 작업을 인간은 도무지 흉내 낼 수 없었습니다. 과학자들은 엑스선 결정학(X-ray crystallography)이나 초저온 전자현미경(Cryo-EM) 같은 거대한 장비와 수십억 원의 비용을 들여 수개월에서 수년에 걸쳐 겨우 단백질 하나의 구조를 밝혀내야 했습니다. 이것이 바로 생물학계의 50년 묵은 난제, ‘단백질 접힘 문제’였습니다.

2. 알파폴드의 등장: AI, 생물학의 한계를 돌파하다

이 50년의 벽을 무너뜨린 것이 바로 구글 딥마인드의 알파폴드입니다. 바둑 AI ‘알파고(AlphaGo)’로 세상을 놀라게 했던 딥마인드는 다음 목표를 과학의 근본적인 문제 해결로 잡았고, 그 결과물이 알파폴드였습니다.

구조 예측의 올림픽, CASP를 제패하다

과학계에는 1994년부터 2년마다 열리는 ‘단백질 구조 예측 학력평가’ 격인 CASP(Critical Assessment of protein Structure Prediction)라는 대회가 있습니다. 주최 측이 아미노산 서열만 제시하면, 전 세계의 연구팀이 자신들의 컴퓨터 모델로 3차원 구조를 예측해 제출하고, 실제 실험으로 밝혀낸 구조와 얼마나 일치하는지 평가(GDT 점수, 100점 만점)하는 대회입니다.

  • CASP13 (2018년) - 알파폴드 1의 충격: 오랜 기간 CASP의 우승 점수는 40점대 안팎에 머물러 있었습니다. 그런데 2018년 처음 출전한 알파폴드 1은 압도적인 격차로 약 60점의 점수를 기록하며 우승을 차지했습니다. 딥러닝(Deep Learning) 기술, 특히 이미지 인식에 쓰이는 합성곱 신경망(CNN)을 생물학 데이터에 적용해 이뤄낸 성과였습니다. 하지만 완벽하지는 않았습니다.
  • CASP14 (2020년) - 알파폴드 2, 난제의 종결: 2020년 등장한 알파폴드 2는 그야말로 경악스러웠습니다. 실험 오차를 고려할 때 사실상 '완벽한 예측'으로 간주되는 GDT 90점을 훌쩍 넘긴 것입니다. 과학자들이 실험실에서 수년간 고생해서 얻은 결과물과 AI가 단 며칠 만에 계산해 낸 구조가 오차범위 내에서 똑같았습니다. CASP 창립자인 존 물트 교수는 "단백질 접힘 문제는 마침내 해결되었다"고 선언했습니다.

알파폴드 2의 핵심 기술: 트랜스포머(Transformer)와 진화적 맥락

알파폴드 2가 이토록 정확해진 비결은 언어 모델(LLM)에 쓰이는 트랜스포머(Transformer) 아키텍처를 진화 생물학과 결합한 데 있습니다.

단백질은 수십억 년에 걸쳐 진화해 왔습니다. 특정 아미노산에 돌연변이가 생겼을 때, 3차원 구조를 유지하기 위해 공간상에서 인접한 다른 아미노산도 짝을 맞추어 함께 변이하는 경향이 있습니다. 알파폴드는 방대한 유전자 데이터베이스에서 비슷한 단백질들의 서열을 다중 정렬(Multiple Sequence Alignment, MSA)하여 이러한 '진화적 힌트'를 찾아냈습니다. 그리고 어텐션(Attention) 메커니즘을 이용해 아미노산 블록들이 공간상에서 서로 얼마나 멀리 떨어져 있고 어떤 각도를 이루는지 정교한 공간 그래프를 그려내어 최종 3차원 구조를 완성했습니다.

3. 디지털 생물학의 시대: 2억 개의 단백질 지도를 공개하다

딥마인드의 진정한 위대함은 기술 개발 자체에서 멈추지 않았다는 점입니다. 2021년 7월, 딥마인드는 저명한 학술지 《네이처(Nature)》에 알파폴드 2의 소스 코드와 작동 원리를 전면 공개했습니다. 나아가 유럽생물정보학연구소(EMBL-EBI)와 협력하여 '알파폴드 단백질 구조 데이터베이스(AlphaFold Protein Structure Database)'를 구축했습니다.

초기에는 인간 단백질을 포함한 수십만 개의 구조를 공개했고, 2022년에는 지구상에 존재하는 사실상 모든 생명체(식물, 동물, 박테리아 등)의 단백질 구조 약 2억 개를 전부 예측하여 무료로 개방했습니다.

과거에는 전 세계 과학자들이 반세기에 걸쳐 약 19만 개의 단백질 구조(PDB 데이터베이스)만을 실험으로 밝혀냈을 뿐입니다. 그러나 알파폴드는 단 1년 만에 인류가 아는 단백질 지식을 1,000배 이상 확장해 버렸습니다. 현재 이 데이터베이스는 전 세계 190개국 이상의 과학자 수백만 명이 매일 접속하여 암 연구, 백신 개발, 환경 문제 해결을 위해 사용하는 '생물학계의 구글 검색'이 되었습니다.

4. 알파폴드 3: 단백질을 넘어 생명 현상 전체를 시뮬레이션하다

알파폴드 2가 단백질 혼자만의 형태를 예측하는 데 그쳤다면, 2024년 5월에 발표된 알파폴드 3(AlphaFold 3)는 완전히 다른 차원으로 진화했습니다.

생명체 안에서 단백질은 혼자 둥둥 떠다니며 일하지 않습니다. 다른 단백질과 결합하고, 유전 정보를 담은 DNA나 RNA와 상호작용하며, 우리가 먹는 약(화학 분자, 리간드)과 반응합니다. 알파폴드 3는 바로 이 ‘분자들 간의 상호작용과 결합 구조’를 예측할 수 있게 되었습니다.

확산 모델(Diffusion Model)의 도입

알파폴드 3는 이미지 생성 AI(Midjourney, DALL-E 등)에 쓰이는 확산 모델(Diffusion Model) 기술을 도입했습니다. 분자 구조가 원자 단위의 노이즈(흐릿한 상태)로 흩어져 있는 상태에서 시작해, AI가 점진적으로 노이즈를 제거하며 원자들의 정확한 3차원 좌표를 선명하게 조립해 내는 방식입니다.

신약 개발의 패러다임을 바꾸다

이러한 진화는 제약 산업에 엄청난 폭발력을 가집니다. 신약을 개발한다는 것은 질병을 일으키는 단백질의 특정 부위(주머니)에 딱 들어맞아 그 기능을 억제하는 ‘화학 물질(약물)’을 찾는 과정입니다.

기존에는 수백만 개의 화학 물질을 일일이 실험실에서 단백질과 반응시켜 보아야 했습니다(High-Throughput Screening). 수천억 원의 비용과 10년 이상의 시간이 소요되는 이 과정을, 이제는 컴퓨터 시뮬레이션을 통해 알파폴드 3가 높은 정확도로 예측해 줍니다. "이 단백질에는 A라는 약물 분자가 이 각도로 가장 잘 결합합니다"라고 AI가 알려주는 것입니다.

5. 알파폴드가 만들어가는 놀라운 현실과 활용 분야

알파폴드는 이미 전 세계 연구실과 산업 현장에서 구체적이고 극적인 성과를 만들어내고 있습니다.

1) 치명적인 질병과 난치병 치료제 개발

  • 소외 열대 질환 치료: 세계적 비영리 연구기구인 소외질환신약개발재단(DNDi)은 알파폴드를 활용해 샤가스병, 리슈만편모충증처럼 주로 빈곤국에서 발생해 제약사들이 연구를 꺼리던 치명적인 기생충 질환의 치료제를 설계하고 있습니다. 기생충의 필수 단백질 구조를 파악해 이를 타격하는 약물을 찾는 속도가 비약적으로 빨라졌습니다.
  • 항생제 내성 극복: 항생제가 듣지 않는 '슈퍼 박테리아'는 인류의 큰 위협입니다. 과학자들은 알파폴드를 이용해 박테리아가 어떤 구조적 변화를 통해 항생제를 방어하는지 메커니즘을 파악하고, 이를 우회하는 새로운 항생제 후보 물질을 발굴하고 있습니다.

2) 기후 변화와 환경 오염 해결

  • 플라스틱 분해 효소 설계: 자연계에는 플라스틱을 분해하는 능력이 있는 효소(단백질)를 가진 미생물이 존재합니다. 연구진들은 알파폴드를 이용해 이 효소들의 구조를 분석하고, 플라스틱(PET)을 기존보다 훨씬 빠르고 효율적으로 분해하도록 단백질 구조를 인공적으로 재설계(Engineering)하는 데 성공하고 있습니다.
  • 친환경 농업: 기후 변화로 인한 가뭄이나 병충해에 강한 작물을 만들기 위해, 식물의 면역 및 환경 적응과 관련된 단백질 구조를 분석하여 품종을 개량하는 연구가 활발히 진행 중입니다.

3) 맞춤형 의학과 희귀 유전병 이해

대부분의 희귀 유전병은 DNA 염기서열 단 하나가 잘못되어, 만들어지는 단백질의 3차원 구조가 망가지면서 발생합니다. 알파폴드를 활용하면 특정 환자의 유전자 돌연변이가 단백질 모양을 어떻게 일그러뜨리는지 시각적으로 확인하고 그 원인을 분자 수준에서 정확히 규명할 수 있습니다. 이는 환자 개인에게 꼭 맞는 맞춤형 유전자 치료제를 설계하는 기초가 됩니다.

6. 알파폴드의 한계와 앞으로의 과제

물론 알파폴드가 생물학의 모든 것을 해결한 '마법의 지팡이'는 아닙니다. 여전히 과학자들이 넘어야 할 한계점들이 존재합니다.

  1. 동적인 움직임(Dynamics) 예측의 어려움: 단백질은 사진처럼 멈춰있는 조각상이 아닙니다. 체내 환경(pH, 온도 등)이나 다른 물질과의 상호작용에 따라 끊임없이 구조를 바꾸며 움직입니다. 알파폴드는 주로 '가장 안정적인 정지 상태'의 구조를 예측하는 데 특화되어 있어, 이러한 역동적인 변화 과정을 시뮬레이션하는 데는 아직 한계가 있습니다.
  2. 비정형 단백질(Intrinsically Disordered Proteins): 일부 단백질은 애초에 고정된 3차원 구조가 없고 흐물흐물한 상태로 존재하다가 다른 물질을 만날 때만 형태를 갖춥니다. 생명 현상에서 매우 중요한 역할을 하지만, 일정한 구조가 없기 때문에 AI가 예측하기 매우 까다롭습니다.
  3. 완전한 100%의 정확도 보장 불가: 알파폴드의 예측이 아무리 정확해도 확률에 기반한 추론이므로, 생명을 다루는 신약 개발의 최종 단계에서는 반드시 기존의 물리화학적 실험과 임상 시험을 통해 구조와 효능을 검증해야 합니다.

결론: 생물학의 관점을 바꾼 혁명

알파폴드는 단순히 유용한 도구 하나가 발명된 사건이 아닙니다. 이것은 인류가 생명을 이해하고 다루는 패러다임 자체가 ‘실험실 중심의 관찰 생물학’에서 ‘컴퓨터 중심의 예측 및 설계 생물학(디지털 생물학)’으로 완전히 넘어갔음을 알리는 신호탄입니다.

이제 과학자들의 질문은 "이 단백질은 어떻게 생겼을까?"에서 "이 구조를 알았으니, 이제 무엇을 만들 수 있을까?"로 바뀌었습니다. 자연이 만들어낸 단백질을 이해하는 것을 넘어, 자연계에 존재하지 않는 새로운 기능의 인공 단백질을 창조해 내는 시대(단백질 생성 AI 기술 등)가 이미 열리고 있습니다.

노벨 화학상 수상은 알파폴드라는 위대한 여정의 마침표가 아니라, 생명의 코드를 자유자재로 다루게 될 인류의 새로운 출발점입니다. 암과 같은 난치병이 정복되고, 플라스틱 쓰레기가 미생물에 의해 자연스럽게 분해되는 미래. 먼 공상과학 영화의 이야기 같았던 그 미래의 중심에 바로 인공지능 '알파폴드'가 있습니다.