Suomalaisten geneettiset isälinjat

19.9.2008(HUOM! Tänä vuonna muutettiin jälleen suomalaisten yleisimmän isälinjan merkintää, mutta ymmärrettävyyden vuoksi käytän siitä edelleen nimitystä N3. Sen aiempia nimityksiä ovat haploryhmä (eli Hg) 16 ja Tat-C.)


En ole tarjonnut tällä sivustolla juurikaan varsinaisia tuloksia alkuperän osa-alueita tutkivilta tieteiltä, joten nyt on korkea aika selventää, mistä oikein puhutaan.

Nykyään geenejä tutkitaan siis yhä enenevässä määrin toisvanhempaisten (osuva käännös Kalevi Wiikin) geenilinjojen kautta. Äitilinjoja tutkitaan mitokondriaalisesta DNA:sta ja isälinjoja Y-kromosomaalisesta DNA:sta. Näitä suositaan siksi, että niillä saavutetaan suurempi aikasyvyys kuin tutkimalla tuman DNA:ta, joka periytyy molemmilta vanhemmilta ja sekoittuu siksi nopeasti.

Keskityn geenien osalta aluksi isälinjoihin, koska niillä näyttää olevan parempi korrelaatio kielikuntiin kuin äitilinjoilla, ainakin puhuttaessa Euraasian laaja-alaisista kielikunnista (uralilainen, indoeurooppalainen ja turkkilainen). Tämä merkitsee sitä, että isälinjoilla on kielikuntien tapaan laaja levinneisyys itä–länsi-suunnassa, kun taas äitilinjojen levinneisyys näyttää pääsääntöisesti pohjois–etelä-suuntaiselta. Äitilinjat saattaisivatkin korreloida paremmin Euroopan varhaisempien kielten kanssa, eli esimerkiksi Pohjois-Euroopan alkuasuttajien kielten kanssa, joista tosin yksikään ei valitettavasti ole säilynyt (vaikka kielellinen substraatti onkin eristetty esim. saamesta; yritän valmistella sivun aiheesta).

Tätä kytköstä näyttäisi tukevan se, että mainitut laaja-alaiset kielikunnat ovat kaikki levittäytyneet vasta karkeasti vuoden 4000 eaa. jälkeen ja että isälinjojen ikäyksiä on koko ajan pyritty nuorentamaan. Vastaavasti paleoeurooppalaiset kielet (nykyään siis kadonneet) edustavat paljon vanhempaa tilannetta: niiden ekspansio alkoi jääkauden päättyessä karkeasti 10 000 vuotta eaa., ja äitilinjojen ikäys onkin paljon vanhempi kuin isälinjojen: erot ovat jopa kymmeniä tuhansia vuosia.

Kun geenilinjaa (toisvanhempainen haploryhmä) iätään, iätään oikeastaan haploryhmän alkupiste, eli hetki ennen tytärmutaatioiden (joista muodostuvat haploryhmän haplotyypit) syntyä. Ja mitä suurempi määrä ihmisiä syntyy (eli mitä laajemmalle geenilinja leviää), sitä useammin syntyy mutaatioita, jotka säilyvät nykypäivään. Niinpä vanhempi ikäys merkitsee, että geenilinjan ekspansio on tapahtunut aikaisemmin, ja nuorempi ikäys merkitsee, että geenilinjan ekspansio on tapahtunut myöhemmin.

Suomalaisten isälinjoista

Suomalaisia ei ole mielekästä käsitellä yhtenä väestönä, koska isälinjojen esiintymistaajuudet (frekvenssit) vaihtelevat eri puolilla maata. Usein erotetaan perustellusti toisistaan länsi- ja itäsuomalaiset, ja seuraavassa noudatan tätä karkeaa jakoa.

Isälinjat yleisyyden mukaan (Y-DNA):
(Lappalainen et al. 2008: ”Migration Waves to the Baltic Sea Region.” – Annals of Human Genetics 2008.)

Länsisuomalaiset (230 miestä)
N3 = 41,3 % (= N1c)
I1a = 40,0 % (= I1)
R1a1 = 8,7 %
R1b = 5,2 %
DE = 0,9 %
I1c = 0,9 %
N2 = 0,9 % (= N1b)
Y* = 0,4 % (xC,DE,F)
C = 0,4 %
F = 0,4 % (xI,J,K)
I1b = 0,4 %
N* = 0,4 % (xN2,N3)

Itäsuomalaiset (306 miestä)
N3 = 70,9 %
I1a = 19,0 %
R1a1 = 5,9 %
R1b = 2,6 %
I1c = 0,7 %
F = 0,3 % (xI,J,K)
Q = 0,3 %
R* = 0,3 % (xR1a,R1b)

(Lappalainen et al. 2008)


Suomalaisilta tavataan siis kaikkiaan neljäätoista eri isälinjaa, joista neljä on suurta ja joista kymmenen taajuus on alle prosentin. Viime aikoina linjojen tulosuuntiin on löydetty tarkennuksia. Vallitseva N3 on kiistatta peräisin idästä, ja viimeisimmän käsityksen mukaan se on levinnyt Aasian puolelta (eli Ural-vuoriston ja Kaspianmeren itäpuolelta). Tämä linja koostuu oikeastaan kahdesta aallosta: varhaisempi N3a1 on levinnyt laajemmalle ja sitä tavataan esimerkiksi slovakeilta ja ukrainalaisilta saakka, kun taas nuorempi N3a2 on keskittynyt Euroopan puolella Keski-Volgan uralin- ja turkinkielisille, ja lännessä sen frekvenssi putoaa jyrkästi vepsäläisten länsipuolella. Kumpaakin alalinjaa tavataan myös Siperiassa, eli kumpikin on kokenut hyvin mittavan leviämisen.

N3:n eräs keskittymä löytyy Itä-Siperian jakuuteilta, jotka puhuvat turkkilaiseen kielikuntaan kuuluvaa kieltä. Näyttäisi siltä, että jakuutit eivät ole ainakaan isälinjojen osalta kovinkaan paljon assimiloineet itseensä alueen alkuperäisempää väestöä, jota vielä edustavat jukagiirit (ks. Pakendorf et al. 2006). N3 näyttääkin tulleen alueelle Sajan-vuoriston suunnalta, mistä turkkilainen kielikin. Kuitenkin N3:a tavataan myös aivan Siperian itäisimmistä osista.

I1a:n tulosuunta on sen sijaan jossain määrin kiistanalainen. Lähteenä käyttämäni tutkimuksen (Lappalainen et al. 2008) mukaan länsisuomalaisten I1a muistuttaa ruotsalaista ja itäsuomalaisten baltialaista. Tämä isälinja lieneekin kiertänyt Suomeen kahden puolen Itämerta. I1a on yleinen Itämeren rantojen germaaninkielisillä kansoilla, mutta sitä tavataan ainakin Volgan mutkaan saakka. Sitä on runsaasti myös saamelaisilla.

R1a1 on myös tulosuunnaltaan hieman kiistanalainen. Itse linja esiintyy Euroopassa taajimpana itäisen Euroopan slaaveilla, mutta sitä on runsaasti myös Skandinaviassa. Tutkimuksen Lappalainen et al. (2008) mukaan suomalaisten R1a1 muistuttaa kuitenkin enemmän keskieurooppalaista kuin slaavilaista R1a1:tä.

R1b:tä puolestaan pidetään yleisesti läntisenä linjana, mutta kuitenkin sitä tavataan idässä vielä länsisiperialaisilta kansoiltakin. Ilman tarkempia tutkimuksia on mahdotonta sanoa, mistä ja mitä kautta tämä linja on Suomeen tullut. Teoriassa on mahdollista, että kaikki kolme viimemainittua isälinjaa, I1a, R1a1 ja R1b, olisivat levinneet Suomeen kahdelta suunnalta, lounaasta ja kaakosta.

Monet suomalaisten marginaalisista isälinjoista ovat paljon yleisempiä etelämpänä Euroopassa, mutta joitain eksoottisempiakin linjoja joukkoon mahtuu. Y* (xC,DE,F; x = poislukien) on joko A tai B (näiden tunnusmerkkejä ei tutkimuksessa erikseen testattu), jotka molemmat ovat afrikkalaisiin väestöihin rajoittuvia isälinjoja.

C on syntynyt pian ensimmäisten nykyihmisten lähdettyä Afrikasta, ja sen alalinjoja tavataan laajalti Aasiassa muttei juurikaan Euroopassa. N* esiintyy lähinnä Altain ja Pohjois-Kiinan alueella, ja N2 on yleinen samojedeilla, ulottuen lännessä saarekkeisena Keski-Volgalle ja vepsäläisten alueelle asti. Q on aasialainen linja, mutta se on taajaan edustettuna myös Amerikan intiaaneilla.

Mielenkiintoista kyllä, selvästi aasialaisia isälinjoja C ja Q ei ole tavattu Länsi-Siperian hanteilta (ostjakeilta), vaikka suomalaisiin asti näitä on päätynyt. Selitys voisi olla niinkin myöhäinen kuin Venäjän vallan aikainen tataarivaikutus. Suomessa on edelleen elinvoimainen tataarivähemmistö, ja Keski-Volgan turkkilaisilla kansoilla tataareilla, baškiireilla ja tšuvasseilla isälinjoja C ja Q tavataan pieninä pitoisuuksina. Hantit puolestaan lienevät aikaisemmin asuneet Uralin länsipuolella, ja Uralin ylitys on tapahtunut huomattavasti pohjoisempana kuin turkkilaisilla kansoilla ylitys toiseen suuntaan (idästä länteen). Hantit ovat siis hyvinkin saattaneet välttää suorat kontaktit turkkilaisiin, vaikka Siperiassa Obia ylävirtaan (kaakkoon) seuratessaan he ovatkin jälleen päätyneet lähemmäs turkkilaisia kansoja.

Mistä ja milloin kaikki nämä isälinjat ovat Suomeen tulleet? Siihen on vaikea vastata mitään varmaa. Mainitut aasialaiset linjat voisivat teoriassa olla myöhäisimmillään vasta tataarien mukana Venäjältä Suomeen tulleita. Entäpä afrikkalaiset isälinjat? Ei aavistustakaan. Aivan viime sukupolvien aikana saapuneista tulokkaista ei voi olla kysymys, koska geenitutkimuksiin valitaan sukutaustaltaan ”puhtaita” suomalaisia, jotka eivät ole sukua toisilleen.

Mihin haluamme vastauksia?

Viime vuosina, kun on haluttu vastata kysymykseen mistä suomalaiset ovat tulleet, on yleensä kerrottu koko nykyihmisen historia Afrikasta Aasian kautta Eurooppaan. Jääkauden maksimin aikaisia refugioita (pakoalueita, talvehtimiskeskuksia) on myös korostettu ehkä liikaakin. Etnohistorian kannalta ei nimittäin ole suurtakaan merkitystä sillä, ovatko jonkin geenilinjan kantajien esivanhemmat kulkeneet Intiassa rannikon vai sisämaan kautta, eikä sillä, ovatko he talvehtineet jääkaudella Iberiassa (Espanjassa) vai Ukrainassa.

Tärkeintä olisi kuitenkin saada tietää, milloin ja mitä kautta (ja keiden kanssa) ihmiset ovat tulleet nykyisen Suomen alueelle. Vain tällä asialla on merkitystä esimerkiksi silloin, kun pohditaan Suomen kielellistä uralilaistumista. Ensin on selvitettävä lähialueet ja lähimenneisyys, minkä jälkeen vasta voidaan rakennella spekulaatioita kaukaisemmista alueista ja ajanjaksoista. Muuten perusta jää hyvin hataraksi, ikään kuin kavuttaisiin peräpuoli edellä puuhun.

Korostan jälleen, että tarkentuva haplotyyppianalyysi saattaa muuttaa hyvinkin radikaalisti jo varmoiksi oletettuja kytköksiä. Jos esimerkiksi jokin sellainen geenilinja, jota on pidetty lännestä tulleena ja joka siksi on yhdistetty vaikkapa germaanivaikutukseen Suomessa, selviääkin idän kautta tänne tulleeksi, katkeaa sen yhteys germaaneihin. Silloin on etsittävä jokin uusi linja edustamaan germaaneja, ja tästä saattaa seurata, että myös suomen kielen tuojaksi oletettu linja menee uusiksi.

Puhumattakaan siitä, että kielitieteen kentilläkin kuohuu: suomen kielen esimuodon saapumista Suomeen on viime vuosina haluttu myöhentää. Jos kielen saapumisen aika ja suunta muuttuvat, katkeaa myös yhteys tiettyyn aikaan tietystä suunnasta tulleeseen geenilinjaan. Siksi onkin visusti vältettävä kielelliseen identiteettiin perustuvien nimilappujen länttäämistä geenilinjoihin.

Ei siis kannata puhua suomalaisesta, saamelaisesta, germaanisesta tai slaavilaisesta geenilinjasta: useimpia geenilinjoja on näillä kaikilla, ja jonkin linjan korkea esiintymistaajuus voi johtua yhtä hyvin ajautumis- tai pullonkaulailmiöistä kuin siitä, että kyseinen geenilinja jotenkin kiinteästi liittyisi juuri siihen kielilinjaan, jota puhuvalla väestöllä sitä esiintyy. Esimerkiksi nimitys ”saamelaismotiivi” saattaa erehdyttää ajattelemaan, että äitilinja U5b1b1 olisi levinnyt Lapista etelään eli saamelaisilta naapurikansoille, vaikka prosessi on todennäköisimmin ollut juuri päinvastainen (koska väkipaine on aina ollut etelästä harvaanasutun pohjoisen suuntaan) ja linja on vain sattunut rikastumaan pohjoisessa, missä myöhäisemmät tulokaslinjat eivät ole syrjäyttäneet sitä niin kuin etelässä.

Alkuperätutkimus onkin jatkuvasti muuttuva palapeli, jossa on otettava huomioon olennaiset eri näkemysten perusteluihin vaikuttavat muutokset tutkimustilanteessa. Ja tietysti jätettävä huomiotta sellaiset muutokset, joilla ei todellisuudessa olekaan vaikutusta asiaan, vaikka joku saattaa toisin uskoakin.

Ovatko suomalaiset itäisiä?

Aiemmin olen nimennyt muutamia geenilinjoja itäisiksi – ovatko suomalaiset siis sittenkin mongoleja? Vallitsevan isälinjan itäisyydellä ei ole mitään tekemistä mongolisuuden kanssa, koska mongolipiirteet eivät ole sidoksissa mihinkään toisvanhempaiseen linjaan. Tästä syystä samaa isälinjaa edustavat miehet ovat hyvinkin erinäköisiä: suomalainen N3-mies näyttää enemmän suomalaiselta I1a-mieheltä kuin jakutialaiselta N3-mieheltä.

Tvärminnen juurisymposiumissa 1980 heitettiin arvio, että suomalaisten geeniperimästä 25 % on itäistä perua. Karkeasti laskien tämä pitää edelleen paikkansa: jos naiset ovat ”eurooppalaisia” tai ”läntisiä” ja puolet miehistä ”itäisiä”, niin sehän merkitsee neljäsosan suomalaisista olevan itäistä alkuperää. Vaikka isä- ja äitilinjat paljastavat vain pienen murto-osan suorista esivanhemmistamme, voitaneen olettaa niiden loppujen esivanhempiemme paljastuvan kaikkien muiden suomalaisten isä- ja äitilinjoista.

Sitä paitsi ”itäisyys” on käypä käsite vain suhteessa muihin eurooppalaisiin. Koska myös indoeurooppalaista kieltä puhuvilla liettualaisilla on korkea N3-taajuus, he ovat yhtä ”itäisiä” kuin suomalaiset. Etelämpänä Euroopassa on myös paljon aasialaisia geenilinjoja, mutta koska ne ovat tulleet Lähi-idästä, niillä ei ole taakkanaan mongolimielleyhtymiä.

Kielet

Isälinjoista juuri N3 on haluttu liittää uralilaiseen kieleen, mutta se ei suinkaan ole ainoa vaihtoehto. Sitä paitsi eräiltä samojedikansoilta tätä linjaa ei ole lainkaan löydetty. Useimmilta uralilaisilta kansoilta tavataan myös isälinjoja R1a ja R1b, jotka myös voisivat liittyä uralilaisen kielen leviämiseen. Eräs mahdollisuus on myös N2, joka on samojedeilla ja Keski-Volgan kansoilla erittäin yleinen ja jota vielä suomen lähisukukielen vepsän puhujilta tavataan 18 % verran. On myös esitetty, että kantasuomen (itämerensuomen) syntyalue ja leviämiskeskus osuisi juuri tälle alueelle, Äänisen eteläpuolelle. N2 olisi siis tuonut alueelle uralilaisen kielen, mutta pitkän ja vakaan kantasuomalaisen kehityskauden aikana linjan pitoisuus olisi laimentunut niin että Suomeen ja Viroon sitä on tullut enää alle prosentti (tai tarkemmin: sitä on nykyään enää alle prosentti).

Tällainen etappiekspansio – jossa kieli leviää vaiheittain ja leviämisvaiheiden välissä on pitkiä leviämättömyyden kausia, jolloin geenipooli saa uutta verta, minkä seurauksena seuraavassa vaiheessa pääasiallinen kielenlevittäjä onkin eri geenilinja kuin edellisessä vaiheessa – on oikeastaan ainoa mahdollisuus uralilaisen kielikunnan kohdalla: mitään isälinjaahan ei tavata kaikilta uralilaisilta kansoilta (olettaen että kieli on levinnyt juuri isälinjan mukana). Leviäminen koko nykyiselle valtavalle puhuma-alueelle ei siis ole voinut tapahtua kertarysäyksellä. Ja tietysti historiallisestikin tiedetään, että pohjoisimmille alueille itämerensuomi, samojedi ja komi ovat levinneet vasta myöhään.

Ongelmana ovat oikeastaan vain kielikunnan periferiat, lännessä itämerensuomi ja saame ja idässä samojedi, joiden leviäminen nykyiseen laajuuteensa on vaatinut selvästi useampia vaiheita kuin kielikunnan keskustassa (siellä kuuluisassa Volgan mutkassa), missä voidaan olettaa esimerkiksi udmurttia puhutun ”aina” (siis kantauralista lähtien) samalla alueella. Mahdollisuuksia on oikeastaan kaksi: joko uralilaista kieltä on alkuaan levittänyt N3, jolloin samojedikielten myöhempi ekspansio Sajanilta pohjoiseen on tapahtunut esimerkiksi N2:n kantamana; tai uralilaista kieltä on alkuaan levittänyt N2, jolloin itämerensuomen ja saamen leviäminen Äänisen ympäristöstä länteen ja pohjoiseen on tapahtunut esimerkiksi N3:n kantamana.Derenko M, Malyarchuk B, Denisova G, Wozniak M, Grzybowski T, Dambueva I, Zakharov I:
”Y-chromosome haplogroup N dispersals from South Siberia to Europe.” – Journal of Human Genetics, 2007.

Ingman, Max & Gyllensten, Ulf:
”A recent genetic link between Sami and the Volga-Ural region of Russia.” – European Journal of Human Genetics, 2007.

Lappalainen T, Laitinen V, Salmela E, Andersen P, Huoponen K, Savontaus M.-L, Lahermo P:
”Migration Waves to the Baltic Sea Region.” – Annals of Human Genetics, 2008.
Takaisin pääsivulle