【正文】
icting protein functions at the level of ligand binding and catalytic activity. There have also been many studies on proteinprotein interaction interfaces to understand biological functions of proteins in cellular contexts 。 然而,大部分研究都是針對于一些特殊的相互作用本身和不明確機理的相互作用如何調控蛋白質的生物學功能的。 文中思想 為了明確原子水平上蛋白質相互作用的模式與其功能的關系,在這里我們采用一個非常詳盡的 allagainstall structural parisons of binding site structures at atomic level using all structures available in the Protein Data Bank (PDB) 。 1. Identification of elementary and posite motifs 首先,我們找到 PDBML file 中所有有注釋的生物學單元,然后從中提取出 197690個蛋白質亞基(這些亞基均至少包含一個配體結合位點) 這里,我們把一個亞基的配體結合位點定義為一個亞基的原子集(與配體原子的距離在 5A之內)。然而我們不用已知的基于序列相似性的非冗余數(shù)據(jù)庫,我們的冗余在相似結構聚類之后再清理。通過這種方式,確定在后續(xù)的分析中當結構冗余條件移除后高度相似的蛋白質結構差異或相同的氨基酸序列是否能夠 preserved。 Kinjo AR, Nakamura H (2021) Similarity search for local protein structures at atomic resolution by exploiting a database management system. Allagainstall structure用 GIRAF結構搜索和排列程序比 對 410254小分子結合位點, 346288蛋白質結合位點和 20388核酸結合位點。完全連鎖聚類后各自輸出 5869, 7678和 398簇(至少有十個成員)。我們把這些簇看做 elementary elementary motifs 的集稱為亞基的 posite 兩個亞基有共同的 elementary motifs 可以推斷他們有共 同的 posite motif。 2. Characterization of posite motifs 組成 posite motif的 elementary motifs的數(shù)目由 120不等。 To characterize the diversity of posite motifs, the average and minimum seque