第二节HLA抗原分子结构和基因结构
一、HLA抗原的分子结构
1987年Bjorkman等首先借助X射线衍射法弄清了HLA-A2的三维空间结构,其后已有多种HLA-I类分子的空间结构得到阐明。除了MHC-II类分子以外,Stern等通过构建HLA-DR1和抗原的单链融合分子,首先阐明了人类MHC-II类分子的晶体结构。Premont等也用类似的方法阐明了小鼠MHC-II类分子I-Ek三维空间结构。
(一)HLA-I类分子
所有的HLA-I类分子均由1条穿越细胞膜的重链(又称α链,44kDa)和一条可溶性的微球蛋白分子轻链(又称β链,12kDa)通过非共价键连接成的双聚体(5512kDa)。α链由位于第6号染色体上的MHC基因编码,β链由位于第15好染色体上的非MHC基因编码,属于免疫球蛋白超家族成员,其结构可分为四个区:氨基端胞外多肽结合区,胞外免疫球蛋白(Ig)样区,跨膜区和胞内区。使用X光衍射晶体分析技术,揭示晶体的HLA-I类分子看上去像驼鹿的角,在角枝上有1个凹槽状结构,称为结合槽,该槽宽12A,长约30A,是由重链分子在细胞外的α1和α2活性区形成的一个链内双聚体,2条平行的螺旋状肽链组成槽的边缘。在所有表达的HLA-I类分子中,大约60%氨基酸序列是保守的。HLA抗原特异性取决于α1和α2区氨基酸的序列,提示每种HLA分子具有独特的结合槽。结合槽两端是“封闭”的,具有高度保守的氨基酸序列。α1和α2活性区的长度约为100个氨基酸。每条重链从其氨基酸终端的前导肽开始合成,在运送到细胞表面后该前导肽被去除,因此,在成熟的蛋白上并不表现。胞外Ig样区又称重链的α3片段,包括90个氨基酸残基,与免疫球蛋白的恒定区具有同源性。I类分子与Tc细胞表面CD8分子的结合部位即在α3片段。I类分子的β链又称为β微球蛋白,也结合于该区,并且它不插入细胞膜而游离于细胞外。β微球蛋白与α1、α2、α3片段的相互作用对维持I类分子天然构型的稳定性及其分子表达有重要意义。跨膜区氨基酸残基形成螺旋状穿过细胞膜的脂质双层,将I类分子锚定在膜上。胞浆区位于胞浆中,可能参与调节HLA-I类分子与其他膜蛋白或细胞骨架成分的相互作用,也与细胞内外信号传递有关。以上是膜型HLA-I类分子的结构,在人类体液中还存在另一种HLA-I类分子,称可溶性HLA(sHLA)-I类分子。其结构与膜型HLA-I类分子相似,只是缺乏跨膜区和胞内区。
(二)HLA-Ⅱ类分子
HLA-Ⅱ类分子抗原分子是膜糖蛋白,由1条α多肽链(34kDa)和1条β多肽链(28kDa)通过共价链连接组成。α和β链又可分为4个区域:2个细胞外活性区,即肽结合区(α1和β1)和免疫球蛋白样区,跨膜区和胞浆区。每条链从其氨基终端的前导肽开始合成,在运送到细胞表面后该前导肽被去除,因此在成熟的蛋白质上并不表现。X光衍射分析表明HLA类分子与类分子有类似的立体结构,肽结合槽又称裂隙,是由α1和β1区域组成,既相当于Ⅰ类分子α2区;与Ⅰ类分子不同,Ⅱ类分子结合槽两端是开放的,说明它们结合的肽要比Ⅰ类分子结合的肽长,大约可容纳14个氨基酸残基。Ⅱ类分子的多态性残基主要集中在α1和β1片段,这种多态性决定了肽结合部位的生化结构,也决定了与肽类结合以及T细胞识别的特异性和亲和力。Ig样区同α2和β2片段组成,两者均含有链内二硫键,并属于Ig基因超家族。在抗原呈递过程中,TH细胞的CD4分子与Ⅱ类分子结合的部位即该Ig样非多态区域。跨膜区和胞浆区结构与Ⅰ类分子α链的相应区域结构相似(见图1)
使用化学方法从天然存在的HLA-肽复合物中分离并分析肽的序列,发现HLA-Ⅱ类分子结合的肽来源于细胞内的蛋白和酶,如核糖体蛋白,细胞色素C、氧化酶2、HLA-Ⅰ或Ⅱ类分子。HLA-Ⅱ类分子结合的肽一般多于11个氨基酸残基,有3-4个锚残基,如DR17锚残基位置在第1、4、6、9位置上,相应氨基酸是亮氨酸,天冬氨酸、精氨酸和酪氨酸。
二、HLA基因结构
HLA基因们于人第六号染色体的短臂上P232105区段。目前发现在3。6MB区域内包含224个基因座位,其中已发现了128个功能性基因,有产物表达,约占人类基因组的0。1%。HLA基因区域一般分为三类。
(1)HLA-Ⅰ类基因区,位于最远端(端粒侧),
大约2000KB,主要有HLA-A,B,C,E,F,G,H,J,K,L。其中HLA-A、HLA-B、HLA-C基因发现的最早,基因产物表达量最高,称为经典HLA-I类基因。其编码HLA-A,B,C分子的重链,其轻链由15号染色体编码,非经典HLA-I类基因有HLA-E,F,G,其等位基因数量有限、产物分布较局限。F基因尚未报道有多态性,HLA-E,G基因可能在胎母免疫中起重要作用,另外,E基因也参与调节T细胞功能。
(2)HLA-Ⅱ类基因位于着丝点端,大约
1000kb,目前认为有以下基因座位:DR,DQ,DP,DOA,DOB,DM。前三个为经典HLA-Ⅱ类基因,后三个为非经典HLA分子。非经典的HLA分子等位基因不多,表达量少,细胞颁布不广泛,表达的分子不在膜上,而在细胞浆内,它们与抗原加工和递呈有关。与移植和输血关系不大。
(3)HLA-Ⅱ类基因,主要编码补体系统蛋白,
包括:C2,C4A,F,热休克蛋白基因等。传统上,只把编码补体基因称为3类基因。
(一)HLA-Ⅰ类基因
HLA-Ⅰ类基因位于靠第6号染色体顶端,从中心侧开始依次为HLA-A、B、C、E、A、G、F及Ⅰ类样似基因或基因片段HLA-17、-X,MHCⅠ类链相关基因C(MHCclassⅠeC,MICC)共21个基因。其中HLA-A、B位点所编码的分子被称为经典HLA-Ⅰ类(classicalHLA-Ⅰ,HLA-Ⅰα)分子,特点是基因具有高度表达多态性和高度重视表达式在各种有核细胞表面。而HLA位点所编码的分子被称为非经典HLA-Ⅰ类分子(non-classicalHLA-Ⅰ,HLA-Ⅰb),这些基因的多态性程度不高,等位基因相互间差异不大,相应的氨基酸序列变化更小,HLA在多种胚胎和成人组织表达,HLA-G特异性地高表达于母胎界面的滋养层。
经典的HLA-Ⅰ类抗原分子由非共价键连接的2个多肽链α链和β链组成,α链由第6号染色体上Ⅰ类基因编码,β链由第15号染色体上的基因编码。编码HLA-Ⅰaα链的基因具有俱的基因结构,均含7个内含子和8个外显子,其大小约为3。5kb。第1外显子编码主导序列,第2、3、4外显子编码α链的α1、α2、α3区,第5外显子编码连接多肽和膜贯通蛋白,又称跨膜区,余下的第6、7、8外显子主要编码细胞内区域和非翻译区域蛋白。HLA-Ⅰa类分子的多态性主要由编码α1、α2区的第2、第3外显子决定。HLA-Ⅰa分子分为膜结合型HLA-Ⅰ类分子(mHLA-Ia)和可溶性HLA-I分子(sHLA-Ia)。由mHLA-Ia分子分泌到体液中形成sHLA-Ia,其调节可能宏观世界DNA,RNA和蛋白质3个水平的作用。编码跨膜区的外显子5在基因水平由于基因自身的调控或变异而不表达或丢失跨膜区的基因信息;在RNA水平由于RNA的拼接,可能使成熟的RNA失去编码跨膜区的外显子5的转录部分,使翻译成的多肽失去连接细胞膜的跨膜区;蛋白质的水解或细胞的破裂导致HLA-Ia脱落到体液中形成HLA-Ia分子。
总之,HLA-I类基因的多态性非常高,到2006年,已发现HLA-A等位基因(alleles)有429个,HLA-B有748个,HLA-C有217个,HLA-E有8个,HLA-G有23个,新的等位基因还在不断地被发现。除了HLA-A、B、C、E、G基因外,HLA-I类区还有大量高度同源性的基因,包括假基因、断裂基因及基因片段,它们与A、B、C基因有许多相同的顺序,HLA-A、B、C基因分型的困难。
(二)HLA-Ⅱ基因
HLA-Ⅱ基因靠染色体着丝点,从中心侧开始依次为KP、DNA(A代表编码α链的基因)、DMA、DMB(B代表编码β的基因)、LMP(大分子蛋白酶体)、TAP(抗原处理相关蛋白)、DOB、DQ和DR基因亚区域。其中HLA-DR、DQ、DP位点所编码的分子称为经典的HLA-Ⅱ分子,而LMP、TAP和DM为与抗原加工和提呈有关的基因,这类基因编码的分子称为非经典HLA-Ⅱ分子。
HLA-Ⅱ类抗原分子是由第6号染色体上级类基因编码的α链与β链以非共价链形式结合的异源二聚体分子。α和β基因分别编码元α链与β链,α基因和β基因相邻,每个座位上的基因结构高度类似。编码α链的Ⅱ类基因有5个外显子,大小约6kb。第1个外显子编码主导序列和第1活性区(α1区)的最初的几个氨基酸,第2、3外显子编码α链的α1、α2区,第4外显子编码连接多肽和膜贯通蛋白的1部分,第5个外显子主要编码细胞内区域和非翻译区域蛋白。编码β链的Ⅱ类基因有6个外显子,大小约为8,其编码的顺序与α链相同。DR、DQ和DP的HLA特异性由β基因所决定,确切地讲是由β1区的第2外显子决定。在DR基因亚区域中,存在DRB1、DRB25、DRB6、DRB7、DRB3、DRB4、DRB5、DEB9和DRA等基因。DRA基因编码DR抗原的α链,包括DR51、DR52、DR53抗原的α链。DRB1基因编码DR抗原β链,DRB3、DRB4、DRB5基因编码DR51、DR52、DE53抗原的链。但DRB5只编码DR2(DR15、DE16)抗原β链的一部分。DRB2、DRB6、DRB7、DRB8、DRB9均为伪基因。DRB9存在于任何一种杂合体中,但杂合体不同其存在方式也不同。总之,DR基因结构的一个特点是每种单体型带有不同数量的DR基因,而且排列的相对位置也不一样。目前至少检出5种单体型,DR1单体型表达DR1、DE10和DE103血清学特异性,偶见表达DR15特异性。DR51单体型表达DR15、DR16和超型特异性DR51,偶尔有DR1特异性。DR52单体型表达DR3、DE11、DE12、DR14、DE1403、DR1404和DR52特异性。DR8单体型只表达DR8特异性。DR53单体型表达DR4、DR7、DR9及DR53特异性,它们可能是一个单独的等位基因系统,因为它们基本上不出现在同一条单体型上,显示出等位基因的遗传方式。直到2005年,已发现DRA等位基因3个,DQA1(32),DQB1(69),DRB1等位基因273个,DRB3等位基因11个,DRB4等位基因9个,DRB5等位基因12个,DRB6等位基因3个,DRB7等位基因2个。