생명과학 공부노트 1편 | 표현형과 DNA 서열, 그리고 알파폴드

표현형(Phenotype) 연구의 한계

생명과학에서는 오랫동안 표현형(Phenotype), 즉 겉으로 드러나는 특성에 대한 연구가 활발히 이루어졌다. 키, 피부색, 질병 발현 같은 것들이 대표적인 표현형이다.
하지만 표현형만 비교하는 데는 한계가 있다. 왜냐하면 개인마다 가지고 있는 유전자(DNA 서열)가 다르기 때문이다.

고전 유전학에서도 많은 시도가 있었지만, 당시에는 실제 DNA 서열을 알 수 없었기에 연구의 폭이 제한적이었다. 결국 현대 생명과학에서는 정확한 DNA 서열 분석이 필수적이다.


생물정보학(Bioinformatics)이란?

생물정보학은 생명과학과 컴퓨터 과학이 만나는 학문이다.

  • 생명과학 데이터를 문자로 읽고 해석하는 과정
  • 컴퓨터를 활용한 데이터 분석 및 처리
  • 대규모 유전자, 단백질 정보를 효율적으로 다루는 기술

즉, **Wet 실험(실험실 실험)**과 **Dry 분석(컴퓨터 기반 분석)**을 함께 수행하는 것이 생물정보학의 핵심이다.

전형적인 연구 과정

  1. Sample collection (샘플 수집)
  2. DNA extraction (DNA 추출)
  3. Sequencing (서열 분석)
  4. 데이터 처리 및 해석

빅데이터와 생명과학

현대 생물정보학은 단순히 DNA를 읽는 것에서 나아가 Big Data Mining을 한다.

  • DNA, RNA, Protein, Metabolites(대사체) 등 다양한 생체 정보를 다룬다.
  • 연구자가 어떤 데이터를 선택해 분석하느냐가 연구의 방향을 결정한다.

센트럴 도그마(Central Dogma) 정리

생명과학의 기본 개념 중 하나는 **중심원리(Central Dogma)**이다.

  • DNA → RNA → Protein
  • 단백질은 세포에서 다양한 기능을 담당한다.
  • 개념만 이해하면 되고, 세부 과정까지 외울 필요는 없다.

또한 DNA는 RNA보다 안정성이 좋아 장기 보관에 유리하다. 이 과정에서 스플라이싱(splicing) 같은 유전자 조절 현상도 발생한다.


인간 유전체의 유사성

인간은 서로 DNA가 매우 유사하다. 개인 간의 차이는 작은 변이(variation)에서 비롯되며, 이 변이가 곧 표현형의 차이를 만든다.


구조생물학과 단백질 구조 예측

단백질 기능을 이해하려면 그 **구조(Structure)**를 알아야 한다.
최근에는 인공지능(AI)을 이용해 단백질 구조를 예측하는 연구가 활발하다.

  • 알파폴드(AlphaFold): 구글 딥마인드가 개발한 단백질 구조 예측 모델
  • 로제타폴드(RosettaFold): 워싱턴대 연구팀이 개발한 또 다른 예측 시스템

이러한 도구들은 결정학적 실험 없이도 단백질의 3D 구조를 예측할 수 있게 하여, 생명과학 연구에 큰 혁신을 가져왔다.


오늘의 공부 정리

  • 표현형 연구는 한계가 있으며, 결국 DNA 서열 분석이 중요하다.
  • 생물정보학은 Wet 실험과 Dry 분석을 모두 포함하는 학문이다.
  • 빅데이터 분석은 DNA, RNA, 단백질, 대사체까지 확장된다.
  • 센트럴 도그마는 생명과학의 기본 원리로, 개념 이해만 하면 된다.
  • 단백질 구조 예측은 알파폴드·로제타폴드 같은 AI 기반 도구로 혁신 중이다.

댓글 남기기