Varför Språk Och Dialekter - Det Här är Helt Olika Saker - Alternativ Vy

2024 Författare: Keith Bush | [email protected]. Senast ändrad: 2023-12-16 14:50

Ofta har enkla frågor komplexa svar. Till exempel: vad är skillnaden mellan språk och dialekt? Om du bestämmer dig för att fråga en lingvist om detta, luta dig tillbaka. Även om det vid första anblicken inte är något svårt i den här frågan kan den besvaras på olika sätt.

Skillnaden mellan språk och dialekt kan bero på en eller annan synvinkel. Ur politisk synvinkel är språk det folk brukar tala som nation. Till exempel, från 1850 till 1992, fanns det så kallade serbokroatiska språket, som inkluderade flera dialekter, inklusive serbiska, kroatiska och bosniska. Men efter att Jugoslavien delades upp i flera oberoende stater i mitten av 1990-talet erkändes dessa dialekter som separata språk. Denna politiska definition fungerar delvis, även om den medför fler problem än lösningar: det finns språk som talas i olika länder, ett slående exempel på detta är spanska i Latinamerika. Ingen skulle argumentera för att mexikansk spanska och colombianska spanska är olika språk. Eventuellt spanska, talade i delar av Spanien,så annorlunda än sina latinamerikanska sorter att det förtjänar att kallas ett separat språk, men det är inte helt klart.

Men tänk om vi drar gränsen mellan språk och dialekt, styrt av kriteriet för ömsesidig förståelse? Tyvärr är detta tillvägagångssätt inte heller idealiskt. En dansker kommer att förstå svenska något bättre än en svensk - dansk. På samma sätt kommer en person som talar den märkliga bondedialekten av brittisk engelska att förstå en amerikaner från Los Angeles mycket bättre än en amerikan. Ömsesidig förståelse beror ofta på externa faktorer - de är en ganska okontrollerbar variabel - och inte på själva språkets inneboende egenskaper.

Så kanske vi borde anta en rent språklig inställning. Tänk dig att vi systematiskt kan mäta skillnaden (D) mellan två talvarianter. Den specifika betydelsen av D skulle då tillåta oss att definiera gränsen mellan två dialekter och två språk. Att hitta ett sådant värde borde inte vara särskilt svårt, eftersom de två språken kan jämföras på många kriterier, såsom ljudinventering, grammatiska egenskaper eller ordförråd.

Men tänk om skillnaderna mellan talvariationer är gradvisa och sannolikheten för att hitta ett givet värde på D är lika hög som sannolikheten för att hitta något annat värde? Då måste vi välja ett godtyckligt värde på D som utgångspunkt, och ett godtyckligt värde skulle kasta oss tillbaka till överväganden av politisk eller praktisk karaktär som vi inte tänkte överväga. Vill vi att vår brytlinje ska vara på den nivå där serbiska och kroatiska är olika språk eller ett? Katalogisering av världens språk, hur många tusen språk vill vi överlämna till glömska: fem? Eller sju? Kanske tiotusen?

De senaste åren har två huvudsakliga hinder för att skilja mellan språk och dialekt övervunnits. Den första är hur man mäter skillnaderna mellan talvarianter - det vill säga att hitta ett värde för D. År 2008 skapade en grupp lingvister Automated Similarity Judgment Program (ASJP), vars dagliga kurator och grundare är din. ASJP har noggrant förberett en systematisk språkjämförelsesuppsättning som för närvarande innehåller 7655 ordlistor. De är relevanta för två tredjedelar av världens språk, förutsatt att språk för våra ändamål definieras av ISO 639-3-standardkoden. Eftersom varje ordlista innehåller en fast uppsättning med 40 begrepp som tolkas konsekvent är det enkelt att jämföra dem och därmed få ett mått på skillnaden. Det vanligaste måttet på skillnad mellan två ord är Levenshtein-avståndet, en term som är uppkallad efter Vladimir Levenshtein, en sovjetisk forskare som 1965 utvecklade en algoritm för att jämföra två teckensträngar. Han definierade "avstånd" som det minsta antalet ersättare, insättningar och raderingar som krävs för att omvandla en rad till en annan. Levenshtein-avståndet kan med fördel delas med längden på den längsta av de två linjerna, och därmed sätta alla avstånd på en skala från 0 till 1. Detta fenomen är känt som det normaliserade Levenshtein-avståndet, eller LDN. Han definierade "avstånd" som det minsta antalet ersättare, insättningar och raderingar som krävs för att omvandla en rad till en annan. Levenshtein-avståndet kan med fördel delas med längden på den längsta av de två linjerna, och därmed sätta alla avstånd på en skala från 0 till 1. Detta fenomen är känt som det normaliserade Levenshtein-avståndet, eller LDN. Han definierade "avstånd" som det minsta antalet ersättare, insättningar och raderingar som krävs för att omvandla en rad till en annan. Levenshtein-avståndet kan med fördel delas med längden på den längsta av de två linjerna, och därmed sätta alla avstånd på en skala från 0 till 1. Detta fenomen är känt som det normaliserade Levenshtein-avståndet, eller LDN.

Det andra hindret är att kanske "språk" och "dialekt" är begrepp som bara kan definieras i godtycklig ordning. Här har vi några mycket uppmuntrande nyheter för dig. Om vi tittar på alla språkfamiljer i ASJP-databasen, där projektdeltagarna har inkluderat en betydande andel nära besläktade sorter, kan vi börja söka efter olika typer av språk och dialekter. En spännande bild uppstår framför oss: avstånd fluktuerar som regel antingen runt ett relativt litet värde eller runt ett relativt stort och en depression bildas mellan dem. Som det visar sig ligger detta tråg oftast i ett smalt intervall med i genomsnitt cirka 0,48 LDN. Vi har inte fel om vi säger att talvarianter inte tenderar att vara delvis lika varandra i deras grundläggande ordförråd. Antingen finns det en tendens till större likhet, i vilket fall talvarianterna kan definieras som olika dialekter eller mot mindre likhet - i vilket fall de kan hänföras till olika språk. Det är här gränsen mellan språk och dialekt ligger.

Detta fenomen är sannolikt ett resultat av sociala omständigheter. Dialekter skiljer sig åt när människor bosätter sig i nya territorier och bildar nya identiteter, men om det fortfarande finns någon kontakt mellan dem kan konvergens äga rum så att talvarianter förblir mer än 50 procent lika (och därmed tal handlar om ett språk). Men ett litet tryck mot divergens kan orsaka att språkvarianter skiljer sig relativt snabbt, vilket ökar Levenshtein-avståndet, i vilket fall vi kan kvalificera dem som separata språk. Det kan finnas ett samband mellan gränsen för avstånden mellan ord i standardlistan som används av ASJP och motsvarande avstånd i andra delar av språkstrukturen, vilket kan leda till en allvarlig förlust av förståelsen. Med andra ord,tröskeln till förståelse kan korrelera med tröskeln mellan språk och dialekter. Vi har ännu inte studerat denna fråga, men som forskningsobjekt är den extremt intressant.

Kampanjvideo:

Efter att ha kommit fram till ett objektivt snarare än ett godtyckligt kriterium för att skilja språk från dialekter kan vi tillämpa det på världens språk. Vissa par talvarianter som anses vara nationella språk, som bosniska och kroatiska, ligger långt under LDN-tröskeln på 0,48 (vilket betyder att de är samma språk oavsett om det finns jugoslavien). Inte långt från denna tröskel finns språk som hindi och urdu (de kan knappast kallas två olika språk). Och varianter av arabiska och kinesiska, som ofta ses som samma språk, svävar över LDN = 0,48 (dessa sorter är separata språk). I själva verket finns det flera par varianter som vanligtvis anses vara olika språk men fluktuerar på gränsen: till exempel danska och svenska, som har ett LDN på 0,4921.

Slutligen kan en teknik härledd från datamängder, kallad ASJP-kronologi, användas för att fastställa hur lång tid det tar för dialekter att distansera sig tillräckligt långt ifrån varandra för att betraktas som separata språk. Resultatet vi hittade är 1059 år om vi inte tar hänsyn till något fel. Dessa resultat stöds av hur lång tid det tar för det generiska språket i en språkfamilj att dela upp i dotter språk, som senare blir förfäder till underfamiljer. För detta behöver vi andra analysmetoder, men resultaten är likartade: det tar ungefär ett årtusen att förvandla dialekter till språk. Vi vet detta eftersom vi nu kan skilja varandra från varandra.

Søren Wichmann är en dansk lingvist som samarbetar med Leiden University (Nederländerna), Kazan Federal University (Ryssland) och Peking Linguistic University (Kina). Hans senaste bok, Temporal Stability of Linguistic Typological Features (2009), författades tillsammans med Eric W. Holman.