CTCF는 DNA이다

블로그

홈페이지홈페이지 / 블로그 / CTCF는 DNA이다

Nov 03, 2023

CTCF는 DNA이다

자연 616권, 페이지

Nature 616권, 822~827페이지(2023)이 기사 인용

19,000번의 액세스

2 인용

121 알트메트릭

측정항목 세부정보

진핵생물에서 게놈 DNA는 cohesin1에 의해 루프로 압출됩니다. 이 과정을 억제함으로써 DNA 결합 단백질 CCCTC 결합 인자(CTCF)는 발달 및 질병 동안 유전자 조절 및 재조합에 중요한 역할을 하는 위상학적 연관 도메인(TAD)을 생성합니다1,4,5,6,7. CTCF가 TAD 경계를 설정하는 방법과 이것이 코헤신에 어느 정도 침투할 수 있는지는 불분명합니다8. 여기에서는 이러한 질문을 해결하기 위해 시험관 내 DNA에서 단일 CTCF와 코헤신 분자의 상호 작용을 시각화합니다. 우리는 CTCF가 확산성 코헤신을 차단하는 데 충분하며 응집성 코헤신이 TAD 경계에 어떻게 축적되는지를 반영할 수 있으며 루프 압출 코헤신을 차단하는 데에도 충분하여 CTCF가 TAD 경계를 설정하는 방법을 반영한다는 것을 보여줍니다. CTCF는 예상대로 비대칭적으로 기능합니다. 그러나 CTCF는 DNA 장력에 의존합니다. 또한 CTCF는 방향을 변경하고 루프 수축을 유도하여 코헤신의 루프 압출 활동을 조절합니다. 우리의 데이터는 CTCF가 이전에 가정한 것처럼 단순히 코헤신 매개 루프 압출에 대한 장벽이 아니라 이 과정의 활성 조절자이므로 TAD 경계의 투과성이 DNA 장력에 의해 조절될 수 있음을 나타냅니다. 이러한 결과는 CTCF가 루프 압출 및 게놈 구조를 제어하는 ​​방법에 대한 기계적 원리를 보여줍니다.

코헤신에 의한 게놈 DNA의 접힘은 염색질 구성, 유전자 조절 및 재조합에 중요한 역할을 합니다1. 코헤신은 DNA를 루프로 압출할 수 있는 ATPase 복합체의 염색체 구조 유지(SMC) 계열에 속하며, 이 활성은 코헤신, 콘덴신 및 SMC5/SMC6에 대해 시험관 내에서 재구성되었습니다(참조 9,10,11,12, 13,14). Cohesin은 또한 자매 염색분체 응집을 매개하여 두 번째 기능을 수행합니다.

개별 셀에서 루프는 가변 위치에 위치하며, 이는 루프가 대부분 압출되는 과정에 있는 동적 구조임을 시사합니다. 그러나 세포 집단 측정에서는 대부분의 루프가 TAD 내에 형성된다는 것을 나타내는 패턴이 나타납니다. CTCF는 TAD 경계18,19에 위치하고 있으며 이러한 사이트2,3,20에서 형성 및 코헤신 축적에 필요합니다. CTCF는 11개의 아연 핑거 옆에 있는 구조화되지 않은 N- 및 C-말단 영역을 가지고 있으며, 그 중 일부는 비대칭 DNA 서열을 인식하여 CTCF를 DNA21,22에 방향적으로 배치합니다. 대부분의 CTCF 결합 부위는 CTCF의 N 말단이 TAD의 내부를 향하도록 수렴 방향으로 지향되어 있으며, 이는 CTCF가 코헤신 매개 루프 압출에 대한 비대칭 경계로 기능함을 시사합니다. 이러한 가능성에 따라 CTCF의 N 말단은 cohesin26에 결합할 수 있으며 이러한 사이트26,27,28,29에서 TAD 절연 및 루프 고정에 필요합니다.

CTCF가 TAD 경계(이전 검토8)를 넘어 루프 돌출을 방지할 수 있는 방법, 즉 물리적 장벽(로드블록)으로서 여러 메커니즘이 제안되었습니다. 코헤신에 결합함으로써; DNA에서 코헤신의 방출을 방지하고, 코헤신의 ATPase 활성화 서브유닛 NIPBL을 비활성 대응물인 PDS5로 대체하는 것을 촉진함으로써; 코헤신의 ATPase 활성을 직접적으로 억제함으로써; 그리고 3개의 코헤신 서브유닛에 의해 형성된 고리 구조 내부에 DNA의 포획을 촉진함으로써 가능합니다. 또한 CTCF가 CTCF 결합 부위에서 루프 압출을 지연시키면서 코헤신이 TAD 내부에서만 루프로 DNA를 계속 감아올리도록 함으로써 코헤신을 비대칭 압출 효소로 전환시키는 것이 제안되었습니다26,31,32. 그러나 제안된 메커니즘 중 CTCF가 사용하는 메커니즘과 CTCF가 코헤신에 의한 루프 압출을 차단하는 데 충분한지는 아직 해결되지 않았습니다. CTCF는 인핸서-프로모터 상호작용1, 핵 재프로그래밍6, 항원 수용체 유전자 재조합4,5 및 DNA 복제 타이밍33을 제어하고 CTCF 돌연변이가 종양 형성7에 연루되어 있기 때문에 이러한 질문에 대답하는 것은 매우 중요합니다. CTCF 경계는 또한 복제된 DNA 분자가 응집을 중재하는 코헤신 복합체에 의해 연결되는 부위이기도 합니다.

<), tandem (>> and <<), and divergent (<>) manner. The percentages were obtained by multiplying the blocking probability of N- and C-terminal encounters in the force range 0.04-0.08 pN, as depicted in Fig. 2e, and normalizing to 100% (see Supplementary Note). Bar heights denote mean values. Error bars denote the error propagation after multiplication, given the 95% binomial confidence interval as depicted in Fig. 2e. The relative fraction of CTCF-anchored loops that we obtained from the single-molecule experiments are compared to published values extracted from Hi-C data3,63,64,65. b, Stalling force of cohesin. horizontal line median; boxes extend to the quartiles and the whiskers show the range of the data (median-1.5* interquartile range (IQR); median+1.5*IQR). Data from 2 independent experiments. c, The DNA tension measured at encounters of loop-extruding cohesin with the N- and C-terminus of CTCF and dCas9. The stalling force values from panel (b) is shown for comparison. N = 297, 184, 37, 66 for CTCF (N), CTCF (C), dCas9 and the stalling force measurements, respectively. d, The empirical survival function (1-CDF) of the data shown in panel c. Thick line represents the mean; shaded areas represent 95% confidence intervals. At the DNA tension of complete stalling at the CTCF N-terminus, 0.14 pN, the survival function decays to 53 \(\pm \) 16%, i.e. if loops would be halted by reaching the stalling force alone, one would expect ~53% of loops to exceed the DNA tension of 0.14 pN, which was not observed (compare blue line for stalling at the CTCF N-terminus and Fig. 2g). e, Ratio of the N-terminal and C-terminal blocking probabilities. N-terminal encounters block loop extrusion 3.6 ± 0.8 -fold (The bar height denotes the mean, error bars denote the error propagation after multiplication, given the 95% binomial confidence interval as depicted in Fig. 2g) more often than encounters from CTCF's C-terminal side, independently of DNA tension. N per bin for N-terminal (n) and C-terminal (c) encounters: 0.025-0.0415 pN: 70 (n), 72 (c); 0.0415-0.058 pN: 81 (n), 67 (c); 0.058-0.075 pN: 84 (n), 30 (c); 0.075-0.091 pN: 20 (n), 14 (c); 0.091-0.1075 pN: 40 (n), 6 (c); 0.119-0.142 pN: 3 (n), 0 (c). Sample sizes refer to biological replicates. f, Fraction of blocked molecules in the cohesin diffusion assay as a function of DNA tension (note that the DNA tension is constant in diffusion assays since no DNA loop is being extruded). The bar height denotes the mean, error bars denote the error propagation after multiplication, given the 95% binomial confidence interval. g, DNA tension of DNA molecules on which diffusing cohesin was blocked by N-terminally oriented CTCF (left; N = 74 from 2 independent experiments) or by C-terminally oriented CTCF (right; N = 27 from 5 independent experiments). Statistical significance was assessed by a 2-sided 2-sample Kolmogorov-Smirnoff test. h, Violin plot of DNA tension for DNA molecules on which diffusing cohesin was blocked by CTCF (left; N = 161 from 7 independent experiments) or repeatedly passed CTCF (right; N = 88 from 7 independent experiments). Statistical significance was assessed by a 2-sample Kolmogorov-Smirnoff test. Thick horizontal lines on boxplots denote median values, the box extends from the lower to upper quartile values and whisker limits denote the range of data within 1.5 times the interquartile range from the median./p>

 0.05, 2-sided 2-sample Kolmogorov–Smirnov test). i, Loop shrinkage rate, in comparison to cohesin loop extrusion rate (grey), and j, distribution of shrinkage time spans. Black dots represent step-wise shrinkage events that happen within one imaging time interval, i.e. 0.4 s. k, Absolute and l, relative loop size decrease for N- and C-terminal encounters in blue and red, respectively. Thick horizontal lines on boxplots denote median values, the box extends from the lower to upper quartile values and whisker limits denote the range of data within 1.5 times the interquartile range from the median. Data for N-/C-terminal encounters were collected from 13 and 3 independent measurements, respectively./p>