小島生物学御研究室
〜利己的遺伝因子の世界〜トランスポゾン、ウイルス、プラスミド〜

現代用語の基礎知識〜利己的遺伝因子編

転移因子

 転移因子(トランスポゾン)はゲノム上を動き回る塩基配列である。転移因子には自分の元のコピーを切り出して、ゲノム中の別の位置に挿入する(厳密な意味での転移)ものと、自分の元のコピーを残したまま、別の位置にもコピーを増やす(複製とも言える)ものの両種が存在する。前者は主にDNA型のトランスポゾンがとる機構であり、後者は主にレトロトランスポゾンのとる機構である。
 古典的に転移因子は2つのグループに分けられてきた。すなわち、逆転写酵素をコードし、自身のDNAから転写されたRNAを逆転写して、ゲノム中の別の位置に挿入する「レトロトランスポゾン」(クラスI)と、自身のDNAをゲノム中から切り出して別の位置に挿入する「DNA型トランスポゾン」(クラスII)である。最近発見されたPolinton、Helitronなどをこれらとは別のクラスとして分類する場合もあるが、これらも上記2つのいずれかに分類することが可能である。
 DNAトランスポゾン、レトロトランスポゾン共に多くには原核生物にその親類が存在する。例えば、真核生物のMariner/Tc1 superfamilyのDNAトランスポゾンは原核生物のIS630ファミリーのDNAトランスポゾンと類似した転移酵素をコードしている。一方厳密な意味でのレトロトランスポゾンは原核生物には存在しない。原核生物にも逆転写酵素をコードする可動性遺伝因子(レトロエレメント)は多く存在する。しかし、ほとんどはゲノム中に1コピーあるいは数コピー程度しか存在せず、転移もしない。ただし、group II intronの一部はレトロトランスポゾンに近い挙動を示す。逆転写酵素をコードするgroup II intronは全体の一部であり、しかもほとんどはホーミング(有性生殖の際に対立遺伝子座に自身のコピーを挿入する)ことにより増殖するが、低頻度でゲノム中の別の位置に転移することがある。

DNAトランスポゾン

 DNAトランスポゾンのコードする転移に必要な酵素は、転移酵素(transposase)と呼ばれる。ほとんどのDNAトランスポゾンはDDEタイプの転移酵素をコードしている。これは活性残基が2つのアスパラギン酸(D)と1つのグルタミン酸(E)から構成される、RNase H foldの立体構造を持つタンパク質である。一部のもの(Mariner/Tc1の一部、Solaなど)では活性残基の3つ全てがアスパラギン酸である。既知のDNAトランスポゾンのSuperfamilyの内、DDEタイプの転移酵素を持っていないことが明らかなものは、Crypton、Helitronの2つのみである。3つのSuperfamily、すなわちAcadem、Novosib、ZisuptonはDDEタイプの転移酵素を持っているかどうか明らかではない。面白いことに、DDEタイプの転移酵素はLTRレトロトランスポゾンやレトロウイルスがコードするintegraseと相同である。このことから、LTRレトロトランスポゾン(とLTRレトロトランスポゾンから派生したレトロウイルス)はnon-LTRレトロトランスポゾンとDNAトランスポゾンとが合体した転移因子であるとする説が提唱されている。また、LTRレトロトランスポゾンのintegraseと特に近縁な転移酵素を持つDNAトランスポゾンとしてGinger1、Ginger2/TDDが見つかっている。
 Polintonもintegraseと近い転移酵素を持つが、DNAポリメラーゼをもコードしている。従って自己複製可能であり、原核生物のファージのように染色体外DNAとして存在し、場合によってゲノムに挿入されるタイプの特殊な生活環を持つと考えられている。これもまたプラスミド(あるいはウイルス)と転移因子が合体したものと捉えられる。
 CryptonはDDEタイプの転移酵素を持たない代わりに、tyrosine recombinase(YR)をコードする。YRを持つ転移因子は原核生物には普通に見られ、IS200がその代表である。複製中間体は環状染色体外DNAになると考えられている。
 HelitronはReplication initiator(Rep)あるいはY2 transposaseと呼ばれるタイプの転移酵素を持つ。これは原核生物の転移因子IS91などが持つ酵素でチロシン2つとヒスチジン2つが保存残基である。

レトロトランスポゾン

 レトロトランスポゾンは古典的に2つあるいは3つのグループに分けられてきた。すなわち、「non-LTRレトロトランスポゾン(non-LTR retrotransposon)」、「LTRレトロトランスポゾン(LTR retrotransposon)」、そしてLTRレトロトランスポゾンの一部ともされる「内在性レトロウイルス(endogenous retrovirus)」である。レトロウイルスはLTRレトロトランスポゾンから派生したことが明らかであり、内在性レトロウイルスはレトロウイルスから派生したことが明らかなので内在性レトロウイルスはLTRレトロトランスポゾンの1グループと見なすことが可能である。Non-LTRレトロトランスポゾンは発見の経緯からLINE(Long INterspersed Element)と呼ばれることがある。一方でLINEという表記をnon-LTRレトロトランスポゾンの一部に使う場合もあり、その場合には通常哺乳類に見られるnon-LTRレトロトランスポゾンとそれに類似のnon-LTRレトロトランスポゾンだけを指す。
 LTRレトロトランスポゾンと内在性レトロウイルスはDDEタイプの転移酵素の1種であるintegraseをコードする。一方、non-LTRレトロトランスポゾンは転移酵素をコードしていない。代わりにエンドヌクレアーゼ(endonuclease)をコードしている。non-LTRレトロトランスポゾンのコードするエンドヌクレアーゼとしては、APE(apurinic-like endonuclease)とRLE(restriction-like endonuclease)が知られており、APEはDNA修復系の酵素であるapurinic/apyrimidinic endonucleaseによく似ており、おそらくこれに由来する。RLEはII型制限酵素と2つの活性残基が共通するが、II型制限酵素に類似のエンドヌクレアーゼは多く報告されており、それらに比べると制限酵素との類似性は低い。RLEを持つnon-LTRレトロトランスポゾンの方が起源が古く、APEを持つものは比較的新しい。従ってnon-LTRレトロトランスポゾンは進化の過程でエンドヌクレアーゼを交換したと考えられる。実際、両方のエンドヌクレアーゼを持つ中間的なものとしてDualenが知られている。
 DIRS、Ngaro、VIPERなどは逆転写酵素の系統的にはLTRレトロトランスポゾンなのだが、DDEタイプのintegraseをコードしない。代わりにtyrosine recombinase(YR)をコードしている。このため、YRレトロトランスポゾンと総称される場合がある。このtyrosine recombinaseはDNAトランスポゾンのCryptonのものと近縁であり、YRレトロトランスポゾンはCryptonとLTRレトロトランスポゾンの合体により誕生したと考えられている。
 逆に、PLE(Penelople-like elements)はLTRを持つが逆転写酵素の系統的にはLTRレトロトランスポゾンに属さない。PLEの多くはnon-LTRレトロトランスポゾンとはまた異なるエンドヌクレアーゼであるGIY-YIG(Uri)エンドヌクレアーゼをコードしている。エンドヌクレアーゼをコードしないPLEも知られており、これらはテロメアに転移することからテロメラーゼとの関連が示唆されている。PLEは逆転写酵素の系統的にもテロメラーゼに近縁であり、テロメラーゼの起源の有力候補である。

自律性因子と非自律性因子

 DNAトランスポゾンの多くは両末端を認識する転移酵素をコードしている。このため、両末端だけを共有し内部に別の配列を持った非自律性(non-autonomous)の転移因子が存在する。機能する転移酵素を持つトランスポゾンは自律性(autonomous)因子と呼ばれる。非自律性の転移因子の一部はMITE(Miniature Inverted-Repeat Transposable Elements)という別名を持つ。MITEは主にTouristとStowawayという2つのグループに分けられる。TouristはHarbinger/PIF superfamilyの、StowawayはMariner/Tc1 superfamilyのDNAトランスポゾンの非自律性因子である。別のDNAトランスポゾンに対応する非自律性因子もMITEと呼ばれる場合がある。
 レトロトランスポゾンにも非自律性の因子が存在する。LTRレトロトランスポゾンにはLTRを両末端に持ちながら中央部にタンパク質をコードしない、あるいは一部しかコードしないものが存在する。Non-LTRレトロトランスポゾンでは3’末端配列が転移に重要であるため、3’末端を持つ非自律性の因子が存在する。非自律性の因子は大きく2つのグループに分けられる。一つは自律性の因子の両側の配列だけを持つものである。更にこれらはORF1タンパク質をコードするものとコードしないものに分けられる。非自律性因子にコードされたORF1タンパク質は自律性因子のORF1タンパク質と相互作用することで転移効率を上げていると考えられる。ORF1タンパク質をコードするものには、Jockey、L1に由来するもの(それぞれHeT-A、HAL1)など、ORF1をコードしないものとしてはBovB、Vingi、Ingiなどに由来する非自律性の因子が含まれる。
 もう一つのグループは特にSINE(Short INterspersed Elements)と呼ばれ、5’側にnon-LTRレトロトランスポゾンに由来しない配列を持つ。これはプロモーター配列であり、その種類によりSINE1(7SL RNA)、SINE2(tRNA)、SINE3(5S rRNA)に分けられる。3’末端の配列はnon-LTRレトロトランスポゾンに由来する。

non-LTRレトロトランスポゾンの分類

 non-LTRレトロトランスポゾンの分類は1999年にMalikらにより提唱されたものが基本となっている。Malikらはそれまでに知られていたnon-LTRレトロトランスポゾンを11個の”Clade”に分類した。その際Cladeの条件として
(1)構造上共通する特徴を持つ
(2)逆転写酵素を用いた系統解析で単系統性が十分支持される
(3)系統の起源が先カンブリア時代まで遡る
の3つが導入された。この際に導入されたCladeは、CRE、R2、R4、L1、RTE、I、R1、LOA、Tad1、Jockey、CR1の11種である。
 しかし、その後次々と新しいCladeが報告されるようになった。これはnon-LTRレトロトランスポゾンの起源が真核生物の進化の初期まで遡ることが出来るのに対して、(3)の条件で定められた先カンブリア時代という基準が新しすぎるためであった。このような事態に、2002年にMalikらは上位の分類単位として”Group”を導入した。Groupは便宜的にコードされるタンパク質の特徴を大きくまとめたものでCladeほどのはっきりとした定義はない。その時点ではR2、L1、RTE、I、Jockeyの5つが導入された。その後の研究の過程で、新しいCladeが多数導入されてきている。一方新しく導入されたGroupはDualen1つだけである。当初導入されたJockey GroupのタイプCladeとなるJockey Cladeはその後の研究でI Groupに属することが示されたのでかつてのJockey GroupからCR1 Groupを独立させるのが主流となっている。またGroupとしての報告はされていないが、構造上の独自性からAmbalはGroupとして見るのが妥当であろう。これまでに導入されたCladeとGroupの一覧をに示す。上述の通り、Cladeは他の転移因子(DNAトランスポゾン、LTRレトロトランスポゾン)の分類と比較してあまりに細分化されすぎており、これ以上の分類はあまり有意義とは言えないだろう。

LTRレトロトランスポゾンの分類

 狭義のLTRレトロトランスポゾンは3つのグループに分けられる。Ty1/ Copia、Ty3/ Gypsy、BEL/Paoである。この中ではTy1/Copiaが最も古くに分岐している。逆転写酵素の系統上、LTRレトロトランスポゾンと単系統になるものとしては、他にレトロウイルス、ヘパドナウイルス、カリモウイルス、YRレトロトランスポゾンがある。YRレトロトランスポゾンは更にDIRS、Ngaro、VIPERに分けられ、また更にDIRSからPatを分離する場合もある。
 レトロウイルス、ヘパドナウイルス、カリモウイルスについては国際ウイルス分類委員会(ICTV)の分類がある。それぞれは「科」の単位を与えられ、中に複数の属を含む。国際ウイルス分類委員会は一部のLTRレトロトランスポゾンについても分類を行っており、Ty1/Copiaをシュードウイルス科(Pseudoviridae)、Ty3/Gypsyをメタウイルス科(Metaviridae)に分類し、BEL/Paoをメタウイルス科内のSemotivirus属としている。ICTVによる分類をに示す。
 内在性レトロウイルス(Endogenous retrovirus, ERV)には別の分類体系もあり、ERV1、ERV2、ERV3に分けられる。ERV1はGammaretrovirusに、ERV2はBetaretrovirusとAlpharetrovirusに、ERV3はSpumavirusにそれぞれ近縁(あるいはその内群)である。


Counter (from 2005/10/08)

禁無断複写転載/リンクフリー

inserted by FC2 system