SVEŽE
čafuzi, čajna dejli, čajne vrečke, ČAK NORS = Chuck Norris, čamast, čarlibraun, časovnica, čavhnjen, Če bo mhla ne bom mhla, če pa nbo mhla, bom mhla., če časa nebi bilo, bi vsak delal vse, z vsakim in vsepovsod, če ne z leti, pa s tableti, če ni mraz ke svina je pa lohk tut vroče ke svina., če te jaz kušnem, boš zarjavel, čeb te učeri kupu pa dons prudau b zgubo naredu, Čebelnjak, čefur, čefuriranje, čekniti, čelešnk, čelnaKLJUČNE
ženska (172), kletvica (122), seks (96), moški (96), šola (90), avto (87), kleti (80), alkohol (78), delo (77), preklinjanje (72), politika (68), penis (63), Ljubljana (62), rit (62), hrana (61), otrok (60), denar (57), spolnost (52), pijača (48), pijanost (47), neumnost (45), drek (44), šport (44), fuk (42), jezik (40), voda (38), čas (37), pička (37), nič (37), kurac (36)V sestavku želim pojasniti nekaj nejasnosti, ki izhajajo iz odziva "nekaterih strokovnjakov z različnih področij", objavljenega v Književnih listih 21. maja 2012, na objavo delovnega besedila Resolucije o nacionalnem programu za jezikovno politiko 2012–2016. Sestavek izraža osebno mnenje, objava resolucije in odzivi pa mu služijo bolj kot okvir za razmišljanje o trenutnem stanju slovenščine, kot bi ga bilo morda mogoče videti iz širše perspektive. Omejujem se zgolj na področje, ki je poimenovano "opremljenost jezika" z jezikovnimi opisi, viri in tehnologijami, ne spuščam pa se v vprašanja o simbolni vlogi jezika, ki so v odzivih sicer dokaj izpostavljena. Izhodišče razmišljanja naj bo misel, da slovenščina – tako kot je v času protestantizma dobila prve knjige in opise v okviru nekega širšega evropskega idejnega okvira – tudi danes ni izoliran jezikovni otok in je torej za ustrezno primerjavo smiselno preveriti, kako s svojimi jeziki upravljajo jezikovne skupnosti, predvsem evropske, ki so približno podobne slovenski.
Čeprav so okoliščine pri jezikih, ki so po številu govorcev vsaj približno primerljivi s slovenščino, raznolike, je vendarle mogoče postaviti nekaj vzporednic. Ena od njih je ta, da za jezikovne opise in vire (slovarje, slovnice, pravopise, besedilne korpuse itd.) navadno skrbi ena osrednja, večinoma akademska institucija. Tako denimo za češke vire skrbi Ústav pro jazyk český v okviru češke Akademije (skupaj z Ústav Českého národního korpusu na Karlovi unverzi v Pragi), za slovaške Jazykovedný ústav Ľudovíta Štúra, za bolgarske Институт за български език „Проф. Любомир Андрейчин”, za nizozemske Instituut voor Nederlandse Lexicologie, za estonske Eesti Keele Instituut itd. Takšno vlogo ima pri slovenščini Inštitut za slovenski jezik Frana Ramovša, ki deluje v okviru Znanstvenoraziskovalnega centra Slovenske akademije znanosti in umetnosti. Druga primerjava, ki se ponuja, je organiziranost načrtovalnih dejavnosti glede razvoja jezikov na državni ali meddržavni ravni v različnih jezikovnih skupnostih. Med take dejavnosti spada omenjena slovenska Resolucija o nacionalnem programu za jezikovno politiko, a tudi drugi namenski programi, kot je denimo segment, ki ga za jezikoslovje namenja Javna agencija za raziskovalno dejavnost RS in podobni. Tretja vzporednica, ki je pravzaprav najlažje merljiva, je razvitost jezika na področju jezikovnih tehnologij, ki postajajo v digitaliziranem svetu vedno pomembnejše in na nek način tudi indikator nadaljnjega živahnega življenja jezika v drugačnem okolju ali usihanja njegove moči zaradi nezmožnosti prilagajanja novostim.
Če kot tipična osnovna dela, ki opisujejo ali urejajo jezik, izpostavimo slovnice, slovarje in pravopise, s katerimi se govorci najpogosteje srečujejo, lahko za slovenščino hitro ugotovimo, da ta hip niso v najboljšem stanju. Kanonični slovnični opis slovenščine je bolj ali manj omejen na znanstveno slovnico akademika Jožeta Toporišiča, ki je nedvomno velik osebni podvig in življenjsko delo, in njene učbeniške izvedenke, vendar na drugi strani analize sodobnega jezika kažejo, da je ta opis vendarle oddaljen od jezikovne realnosti, saj ni temeljil na analizi obsežnejšega gradiva, večinoma pa je kljub sodobni letnici zadnje izdaje nastal pred 20 in več leti. Predvsem v okviru pedagoške dejavnosti že nekaj časa tli ideja o slovničnem opisu, ki bi bil bolj prilagojen pedagoški praksi in bistveno bolje usklajen z realno sodobno rabo slovenščine. Tudi pri slovarskem opisu sodobnega jezika stanje ni boljše. Edini dostopni razlagalni slovar slovenskega jezika je še vedno omejen na Slovar slovenskega knjižnega jezika, ki je nastajal med leti 1970-1991 na podlagi gradiva, ki je bilo večinoma zbrano v šestdesetih letih prejšnjega stoletja. Če je v svojem času predstavljal leksikografski podvig, v novi digitalni sedanjosti s potrebami po takojšnjem odzivu na nova poimenovanja ali prenovljeno rabo obstoječega besedišča slovar pomeni anahronizem, tudi zaradi splošnega dojemanja javnosti, da slovar jezik normira, in če določene besede ali rabe v slovarju ni, naj bi to pomenilo, da ne obstaja ali ni dovoljena. Ob takšni naravnanosti govorcev slovenščine je potreba po sodobnejšem priročniku toliko večja. Tudi Slovenski pravopis ni v boljšem stanju. Pravopisna pravila ostajajo skoraj nespremenjena od prve objave Načrta pravil za novi slovenski pravopis iz l. 1981, potem izdanih končnih Pravil l. 1990 ter istih pravil skupaj s pravopisnim slovarjem l. 2001, čeprav sta se v zadnjih trideset letih jezikovna realnost in raba jezika spreminjala. Tudi slovarski del pravopisa iz l. 2001 ni nastal na novem gradivu, temveč je le prevzel besedišče iz SSKJ in ga prilagodil pravopisnim pravilom, ki so torej nastala dvajset let pred tem. Na splošno lahko rečemo, da so temeljni viri za slovenščino, s katerimi se srečuje povprečni uporabnik, stari od dvajset do petdeset let, nastali pa so na podlagi izhodišč, ki so enako stara ali starejša.
Tako kot na številnih drugih področjih je v zadnjih dvajsetih letih na dogajanje v jezikovni realnosti in tudi v jezikoslovju močno vplival razvoj računalništva, informacijskih tehnologij, svetovnega spleta in v zadnjem času mobilne telefonije. V tradicionalna področja, denimo leksikografijo, je pri angleškem jeziku posegel že v osemdesetih letih, pri večini ostalih evropskih jezikih pa desetletje kasneje v devetdesetih. Tvorci jezikovnih politik pri evropskih jezikih so se takrat hitro zavedli sprememb in jeziki so se začeli intenzivno digitalizirati, pogosto tudi v okviru evropskih projektov. S tedanjimi odzivi institucij, ki se tako ali drugače ukvarjajo s slovenščino, pravzaprav ne moremo biti nezadovoljni. Več fakultet na naših dveh največjih univerzah, tudi Institut Jožef Stefan in Inštitut za slovenski jezik so se v drugi polovici 90. let vključevali v tovrstne evropske projekte, poleg tega so v okviru komercialne sfere potekala vlaganja v nove jezikovne vire in orodja, tako knjižne kot digitalne. Zdi se pa, da je ta prvi zagon v prejšnjem desetletju izrazito opešal in začel se je večati razkorak med hitrim in energičnim napredovanjem pri drugih jezikih in stanjem pri slovenščini. Zdi se, da je vzrokov za takšen razvoj več in v nadaljevanju bi želel opozoriti na nekaj zastranitev, ki jih med drugim želi ublažiti predlog nove resolucije.
Knjižno ali digitalno?
Vprašanje je do neke mere umetno, kajti odgovor je verjetno: za zdaj – tako knjižno kot digitalno, vendar se je v času dokaj revolucionarnih digitalizacijskih sprememb pomembno ozreti na jezikovne politike tako EU kot celote kot posameznih jezikov in jih primerjati s stanjem pri slovenščini. V času, ko na pametnih telefonih lahko poizvedujemo za informacijami preprosto z glasom, kar pomeni, da mora računalnik sprocesirati govor, ga pretvoriti v obliko, ki omogoča iskanje po obsežnih podatkovnih bazah, in rezultat predstaviti tako rekoč hipno in v razumljivi obliki, najbrž ni potrebno dokazovati, da je za prihodnji razvoj jezikov ključna predvsem digitalizacija in da bodo na dolgi rok preživeli in dobro uspevali tisti, ki jim bo uspelo premostiti digitalni razkorak, ki je začel ločevati razvite od nerazvitih, starejše od mlajših, spletno povezane od nepovezanih, digitalne domačine od digitalnih priseljencev itd. Slovenščina s svojim dragocenim statusom uradnega jezika Evropske unije niti ni v slabem položaju. Ta prinaša med drugim tudi zanimanje velikih severnoameriških podjetij, kot so Microsoft, Google, Apple in drugih, ki bi sicer verjetno izostalo, in podpora slovenščini bi bila na ravni podpore retoromanščini ali luksemburščini. Za primerjavo – prav zaradi statusa uradnih jezikov EU se je v zadnjem času izjemno povečala podpora irščini in malteščini.
Vendar ugoden status in zunanja podpora nikakor nista dovolj, da bi se jezik lahko enakopravno vključil v trend, ki v končni fazi stremi za tem, da bodo računalniki simulirali človekovo dojemanje okolice, pri čemer je jezik poleg vizualnih, multimodalnih in drugih jezikovno neodvisnih modusov ena od najpomembnejših komponent. Poleg drugih okoliščin bo računalniško razumevanje jezika torej postalo vedno pomembnejše za njegov uspešen razvoj. Na tej točki se srečajo tradicionalni jezikovni viri in nove jezikovne tehnologije, ki za uspešno delovanje potrebujejo obsežne jezikovno specifične baze podatkov (od baz izgovorjav, besednih oblik, pomenskih relacij itd.), za katere pa so tipično odgovorni jeziki in njihovi jezikovni načrtovalci sami, saj Evropska unija financira projekte, ki prinašajo skupno dodano vrednost, komercialna sfera pa se ozira predvsem na število odjemalcev in se osredotoča na številčno večje jezike. Táko je bilo denimo povsem jasno sporočilo predstavnika Googla na eni od konferenc evropskega projekta, v katerem sodeluje Institut Jožef Stefan in je posvečen jezikovnim virom in tehnologijam.
Pomembno se je zavedati, da sta razvoj (tradicionalnih in novih) jezikovnih virov in razvoj jezikovnotehnoloških aplikacij dve plati istega kovanca in da kakršnokoli smiselno načrtovanje virov, s katerimi se neposredno srečujejo uporabniki (slovnice, slovarji, pravopisi itd.), mora iti z roko v roki z razvojem tehnologij, pri katerih so isti ali podobni viri skriti v ozadju, vendar nujno potrebni za njihovo delovanje (črkovalniki, slovnični pregledovalniki, govorne tehnologije, informacijsko poizvedovanje, tehnologije semantičnega spleta itd.). Kot eno od bistvenih težav jezikovnega načrtovanja za slovenščino v preteklosti dojemam vedno večji razkorak med načrtovanjem enih in drugih virov in aplikacij, a tudi splošno neurejenost tega področja, pri čemer se zdi, da v zadnjem času ta trend postaja celo intenzivnejši. Ob primerjavi z drugimi jeziki se zdi zanimivo, da je bilo pri tistih, ki so omenjeni razkorak uspeli preseči, preobrat mogoče locirati v približno enak čas nekje v prvih letih tega stoletja. Ker v sestavku ni prostora za podrobnejšo obravnavo, lahko omenjeno nakažemo z dvema tipičnima primeroma.
Prvi je Estonija, kjer je vlada l. 2004 sprejela Strategijo razvoja estonskega jezika 2004-2010, v kateri je postavila izhodišča za nadaljnje financiranje dejavnosti v zvezi z estonščino. Dokument je do neke mere primerljiv z Resolucijo o nacionalnem programu za jezikovno politiko 2007-2011, ki je bila sprejeta maja 2007 v slovenskem parlamentu, zato si je zanimivo ogledati nekatere rešitve. Razlika, ki je vidna že na prvi pogled, je sistematična priprava na izdelavo Strategije, ki je trajala tri leta s študijami po posameznih področjih, in sicer:
V času priprave je bilo organiziranih sedem konferenc, tudi s tujimi predavatelji, predlog Strategije pa je bil po objavi nekaj manj kot leto dni v javni razpravi. Pomembno je, da so bili v skladu s to strategijo sprejeti konkretni programi, ki so omogočili implementacijo njenih načel. Eden od takih programov je bil Nacionalni program za estonske jezikovne tehnologije (2006-2010), katerega namen je bil "razviti jezikovne tehnologije za estonščino do stopnje, ki bo omogočila nemoteno delovanje jezika na področju informacijskih tehnologij in vzpostavitev sodobne jezikovnotehnološke infrastrukture. Podrejena cilja sta razviti potrebno programsko opremo za jezikovne tehnologije ter komplementarne jezikovne vire." Skupna vrednost programa je bila približno 4,5 milijona evrov, program je upravljal in nadzoroval odbor z devetimi člani, vsi rezultati, ki jih je financiral program, so prosto dostopni.
Drugi značilen primer je ustanovitev in delovanje Nizozemske TST-Centrale, Agencije za nizozemske jezikovne vire, ki jo je Nizozemska jezikovna zveza (Nederlandse Taalunie), ki od l. 1980 skrbi za nizozemsko govoreče jezikovne skupnosti v treh državah – na Nizozemskem, v Belgiji in v Surinamu, ustanovila l. 2004, v istem letu kot je bil sprejet estonski program. Potem ko so v Zvezi ugotovili, da je izdelava podobnih jezikovnih virov financirana večkrat in da ni prave koordinacije pri izdelavi želenih in nujnih virov, ki jih potrebujejo govorci nizozemščine, je bil glavni namen novoustanovljenega telesa skrb za načrten razvoj in distribucijo virov, ki jih kot vrhovno telo financira Zveza. Ta sicer svojo vizijo definira na naslednji način: "Nizozemščina pripada njenim uporabnikom. Način, kako jo ti govorijo in pišejo, vzpostavlja standard, ki ni nespremenljiv, temveč je nenehno v gibanju. Nizozemska jezikovna zveza ta standard opisuje v slovnicah in slovarjih. Jezikovni svetovalci pomagajo uporabnikom, ki želijo uporabljati standardni jezik. Zgolj pri pravopisu Nizozemska jezikovna zveza določa pravila, ki so nadalje dokumentirana v statutih njenih članov."
Nizozemska jezikovna zveza je torej (med)vladna organizacija, pri čemer – ker je meddržavno telo – njeno politiko določa Odbor ministrov, nadzoruje pa ga medparlamentarna komisija, sestavljena iz predstavnikov vseh udeleženih parlamentov. Svet za nizozemski jezik in literaturo, ki ga sestavljajo strokovnjaki in drugi prominentni uporabniki, pa deluje kot svetovalno telo, ki odboru in komisiji svetuje pri izdelavi jezikovne politike. Na leto svojim članom Zveza dodeli približno 10 milijonov evrov za financiranje projektov, ki se skladajo s politiko, ki jo določi to vladno telo.
Estonija in Nizozemska lahko torej služita kot zgled, ki sicer ni osamljen, kako je jezikovna politika pri nekaterih jezikih uspela preseči delitev na tradicionalne in klasične jezikovne vire ter s pomočjo krovne institucije kanalizirati prizadevanja z obeh koncev v en konsistenten jezikovni program.
Zasebno ali javno?
Pri jezikovnih virih, orodjih in tehnologijah je vprašanje javnega ali zasebnega lastništva razmeroma kočljivo, saj omejen dostop do virov predvsem v digitalnem okolju lahko precej zavira ali pospešuje uspešen razvoj jezika. V malce bolj globalnem smislu je bila v tem kontekstu zanimiva razprava, ki se je odvila na enem od srečanj zgoraj omenjenega evropskega projekta. Na dan je prišlo vprašanje, kako ravnati, če bi Google začel zaračunavati uporabo spletnega prevajalnika GoogleTranslate, ki je sicer zelo uspešen in razširjen izdelek. Strokovnjaki so namreč trdili, da je bil velik del Googlovih tehnologij strojnega prevajanja razvit v okviru evropskih projektov v 90. letih in potem prenesen v komercialno okolje povsem drugje. Prevladovalo je mnenje, da je prosta raba orodja iz tega razloga na nek način pravična, čeprav sicer izhaja iz filozofije oz. odločitve podjetja. Ob razmisleku o tem primeru je treba upoštevati, da ni naključje, da je razvite tehnologije uspešneje uporabilo podjetje, ki jih je privedlo do končnega uporabnega produkta, saj je akademsko okolje, kjer so bile razvite, za te namene bistveno manj primerno. Drugo vprašanje pa je, zakaj do enakega rezultata ni bilo mogoče priti v Evropi. Eden od inherentnih in nerešljivih antagonizmov zasebno-javno je torej stabilnost razvoja in učinkovitost uporabe rezultatov, ki so sami lahko financirani v takem ali drugačnem okviru.
Po drugi strani se – predvsem v povezavi z jezikovnimi viri – zdi, da je spletno okolje tako rekoč na glavo obrnilo koncept avtorskih pravic, ki je bil v rabi nekje od 18. do 21. stoletja. O tem potekajo številne razprave, uveljavljajo se različni koncepti, kot je denimo "copyleft", "creative commons" itd. Njihovo bistvo je, da urejajo vsaj osnovno zaščito avtorjev v okolju, kjer je dinamika prenosa vsebine avtorskih del neprimerno hitrejša in preprostejša kot v knjižni obliki. Vprašanje, ki je pereče in nikakor še ni rešeno, pa je uporaba delov besedil za različne nadaljnje namene, začenši z iskanjem po njih in tržnim prikazovanjem zadetkov, pri čemer je vprašanje tudi sam splošni status besedil oz. širše avtorskih del, ki so objavljena na spletu. Spletna javnost objavljene vsebine večinoma dojema kot proste, mehanizmov, ki bi jih zaščitili pred zlorabo, pa v obstoječem spletnem okolju pravzaprav niti ni.
Eden od zanimivejših pokazateljev, kako je vendarle pomembno vprašanje lastništva avtorskih pravic pri izkoriščanju jezikovnih podatkovnih zbirk za namene računalniške obdelave jezika, je usoda zbirk pravnih besedil, ki so bila prevedena v procesu pridruževanja srednje- in vzhodnoevropskih držav Evropski uniji. Iz njih je "nehote" nastal tudi ogromen vzporedni korpus prevedenih besedil, in ker so ta besedila večinoma v lasti državnih institucij in Evropske unije, so prosto dostopna tudi za računalniško obdelavo in obilno izkoriščana. Podobno usodo doživlja tudi Wikipedija kot čedalje večja zbirka besedil v različnih jezikih, ki je kot podatkovna zbirka dostopna pod licenco GNU Free Documentation Licence. Ta v osnovi določa, da je podatke mogoče prosto uporabljati, dokler uporabnik daje na voljo predelave pod istimi pogoji in priznava avtorstvo originala. Na splošno velja, da se viri, ki imajo bolje urejen prost dostop in pogoje uporabe, tudi uporabljajo za namen računalniške obdelave naravnih jezikov.
Če si na drugi strani kot značilen primer ogledamo zgodbo SSKJ in lastništva avtorskih pravic, se je po založniških kolofonih različnih izdaj spreminjalo na zanimiv način. Prva izdaja v petih knjigah, ki je izhajala v letih 1970-1991, oznake za copyright nima – v kolofonu je preprosto navedeno, da je knjigo izdala SAZU oz. kasneje ZRC SAZU, založila pa Državna založba Slovenije. Prvič se oznaka za copyright pojavi l. 1994 ob izdaji v eni knjigi – torej takrat, ko je bil slovar tudi digitaliziran in pripravljen za računalniško luščenje podatkov, kar je tudi opisano v predgovoru v to izdajo – tam so kot lastniki avtorskih pravic navedeni "Inštitut za slovenski jezik Frana Ramovša ZRC SAZU in avtorji". Dodatek "in avtorji" kasneje doživi spremembo: pri elektronski izdaji SSKJ se na CD-ju ta dodatek pojavlja, v kolofonu iste publikacije pa je kot lastnik avtorskih pravic samo "SAZU in ZRC SAZU, Inštitut za slovenski jezik Frana Ramovša". Enaka formulacija je navedena tudi v kolofonu v izdaji časnika Dnevnik iz leta 2008. Čeprav je SSKJ zdaj dostopen kot spletni slovar, kot podatkovna zbirka za računalniške namene nikoli ni bil na voljo, iz opisa avtorskih pravic bi bilo mogoče sklepati, da je to odvisno od odločitve ZRC SAZU. Skratka, že digitaliziranega vira, potencialno uporabnega za računalniške namene, ki je bil v celoti financiran iz javnih sredstev, javna institucija ne daje na voljo, čeprav je bil v različnih knjižnih in elektronskih izdajah celo večkrat prodan– z identično vsebino.
Verjetno ni dvoma, da je izhodišče pri tem jasno: kar je bilo financirano iz proračuna, bi moralo biti prosto dostopno za vse "končne" uporabnike, torej govorce jezika, ki so hkrati tudi davkoplačevalci. Točka, pri kateri se stvari zapletejo in kjer tudi pri drugih jezikih obstaja določeno nihanje, je nadaljnja komercialna raba teh načeloma prosto dostopnih izdelkov. Že omenjeni TST-Centrale, ki hrani in distribuira vire za nizozemščino, vse svoje številne vire daje na voljo brezplačno za nekomercialno rabo, komercialna raba pa je stvar pogajanj. Kot se je izkazalo v pogovorih z njihovimi predstavniki, ima institucija mandat, da presodi, kakšna je komercialna cena posamezne zbirke, pri čemer se ta lahko precej spreminja glede na čas ali stranko. S ciljem, da si zagotovijo čim boljšo podporo za svoj jezik, je tudi komercialna raba virov razmeroma poceni, pa čeprav gre za končne kupce, kot sta Google ali Microsoft.
Težava v slovenskem okolju je – poleg neučinkovitega načrtovanja – po mojem mnenju tudi razpršenost in neorganiziranost zbiranja, hranjenja in distribucije že izdelanih prosto dostopnih virov, saj ni osrednje institucije, ki bi za to sistematično skrbela. Če si je kaj želeti glede reševanja te težave, je to predvsem zavedanje največjega financerja izdelave teh virov, torej Ministrstva za izobraževanje, znanost, kulturo in šport, ter posredno tudi Agencije za raziskovanje RS, da ta problem obstaja, da so rešitve znane, da jih pa vendar ne gre pričakovati od drugega kot od tistega, ki ima možnost narekovati pogoje izdelave teh virov – če upoštevamo nasvet strokovnjakov pri jeziku, kjer so to področje že pred časom uspešno uredili.
Mednarodno ali lokalno?
Ob pogoju, da sta status in dostopnost končnih rezultatov primerno urejena, v Evropi javno-zasebna partnerstva pri izdelavi jezikovnih virov in razvijanju jezikovnih tehnologij načeloma niso nezaželena, ravno nasprotno. Pri manjših jezikih so povezave med močnejšimi podjetji in osrednjimi institucijami, ki skrbijo za jezik, dokaj pogosta. Kot enega tipičnih tovrstnih partnerstev lahko denimo izpostavimo evropsko financirani projekt Evrotermbank, v katerem se je združilo devet institucij iz obeh svetov: pod vodstvom podjetja Tilde iz Latvije so v projektu sodelovali še Latvijska akademija znanosti, Inštitut za litvanski jezik in Državna komisija za litvanski jezik iz Litve, podjetje Morphologic iz Madžarske, Inštitut za informacijski menedžment iz Nemčije, Center za jezikovne tehnologije iz Danske, ki je sicer del univerze v Kopenhagnu, in Center za informacijsko procesiranje iz Poljske. Cilj projekta je bil "harmonizacija in konsolidacija terminološkega dela v novih državah EU s prenosom izkušenj iz obstoječih terminoloških omrežij Evropske unije ter združevanje kompetenc in naporov v državah pristopnicah". V okviru projekta je bil vzpostavljen spletni portal, ki služi kot osrednja točka tudi za lokalne terminološke baze, kot je denimo terminološki portal termnet.lv, uradna terminološka baza latvijske Akademije znanosti, ki vsebuje 145.000 vnosov s 430.000 termini z 32 različnih terminoloških področij. Ali na kratko: združena podjetja in akademske institucije iz manjših baltskih držav so se povezala z izkušenimi institucijami iz zahodne Evrope in skupaj ustvarila osnovo za rešitev dostopa do terminoloških podatkov, do katerih bi posamične države oz. jeziki prišli bistveno težje. Ni odveč pripomniti, da podobnega portala za slovenščino ni tudi deset let po koncu projekta, ki je Latvijcem, Litvancem in drugim zagotovil stalen spletni dostop do terminoloških podatkov.
Tudi sicer kratek pregled sodelovanja naše osrednje jezikovne institucije v evropskih projektih kaže neugodno sliko. Če je denimo obdobje devetdesetih let s tega stališča kazalo na boljše nadaljevanje, saj je takrat Inštitut za slovenski jezik sodeloval v evropskih projektih MULTEXT-EAST (1995-1997), TELRI I (1995-1998) in II (1999-2001), se je v zadnjem desetletju iz teh projektov povsem umaknil in od takrat ni sodeloval niti v enem. Zdi se, da gre za dolgo obdobje zamujenih priložnosti, saj inštituti za druge jezike intenzivno sodelujejo v projektih, kot so CESAR (Central and south-east european resources – 2011-2013), katerega partnerji so denimo Inštitut za bolgarski jezik Prof. Ljubomir Andrejčin, Jezikoslovni inštitut Ľudovíta Štúra Slovaške akademije znanosti in Inštitut za jezikoslovne raziskave Madžarske akademije znanosti, ali projekt CLARIN (Common Language resources and infrastructure – 2008-2011), infrastrukturni projekt, v katerem so bili skoraj vsi evropski jeziki in pravzaprav predstavlja eno večjih zamujenih priložnosti, saj Slovenija oz. slovenščina v tem projektu sploh ni bila udeležena – za razliko od litvanščine, latvijščine, islandščine, estonščine, malteščine in seveda vseh drugih večjih evropskih jezikov.
Na drugi strani so v evropskih projektih, ki so vsaj deloma povezani s slovenskimi jezikovnimi viri in tehnologijami, v zadnjih desetih letih močno prisotni predvsem Institut Jožef Stefan (strojno učenje, podatkovno rudarjenje, jezikovni viri), tudi Fakulteta za elektrotehniko, računalništvo in informatiko Univerze v Mariboru (govorne tehnologije) in jezikovnotehnološko podjetje Amebis (strojno prevajanje). Zdi se torej, da bi bilo v trenutni situaciji močno zaželeno predvsem povezovanje relevantnih slovenskih institucij v omrežja, ki bi omogočala tudi udeležbo pri finančnih virih, ki jih Evropska unija vendarle namenja svojim jezikom. Vsi, ki so bili kdaj udeleženi pri prijavljanju evropskih projektov, pa vedo, da dostop do teh virov ni preprost in je medinstitucionalne partnerske povezave mogoče graditi zgolj na dolgi rok. Tudi na tej točki pa zunanji opazovalec močno pogreša predvsem skupni dolgoročni program in organizacijsko strukturo, ki bi omogočila tovrstno povezovanje tako na ravni Slovenije kot tudi izven nje. Možnost za to ponujajo predvsem infrastrukturni projekti, kot je denimo že omenjeni CLARIN, pri katerem pa žal zaradi varčevalnih ukrepov tudi v prihodnje ni videti, da bi bila slovenščina lahko udeležena.
Predpogoj za udeležbo v evropskem (raziskovalnem) prostoru je obstoj raziskovalnih skupnosti, ki lahko izkazujejo relevantne rezultate na mednarodnih konferencah in nasploh v mednarodnem raziskovalnem publiciranju. Manjši jeziki so pri tem načeloma vedno v slabšem položaju, saj ni skrivnost, da na mednarodnih konferencah, v znanstvenih revijah in pri znanstvenih založbah raje objavljajo rezultate, ki so zanimivejši za širšo publiko. Kljub vsemu pa številčni podatki o objavah na različnih konferencah, ki so povezane z jezikovnimi viri in tehnologijami, govorijo svoje. Če kot vzorec vzamemo zadnji dve konferenci evropskega združenja leksikografov EURALEX (2008, 2010), dve konferenci serije e-lexicography in the 21st century (2009, 2011) in zadnji dve konferenci s področja jezikovnih virov in tehnologij LREC (Language resources and evaluation – 2010, 2012), se kaže naslednje stanje: na konferencah EURALEX je prispevkov slovenskih avtorjev o slovenščini skupaj sedem, avtorji prihajajo s Filozofske fakultete in Fakultete za družbene vede Univerze v Ljubljani, Instituta Jožef Stefan in zavoda Trojina. Na konferencah e-lexicography je slovenskih prispevkov ravno tako sedem, avtorji pa prihajajo s Filozofske fakultete Univerze v Ljubljani, Inštituta Jožef Stefan, podjetja Amebis, zavoda Trojina, Službe vlade RS za prevajanje, en prispevek v soavtorstvu prihaja z Inštituta za slovenski jezik. Na konferencah LREC je prispevkov skupaj enajst, avtorji pa prihajajo z Instituta Jožef Stefan, Filozofske fakultete Univerze v Ljubljani in Fakultete za elektrotehniko, računalništvo in informatiko Univerze v Mariboru, en prispevek v soavtorstvu prihaja z Inštituta za slovenski jezik.
Zdi se torej, da naša osrednja institucija, ki skrbi za jezikovne vire za slovenski jezik, v mednarodnem prostoru na svojem področju skorajda ni prisotna, bistveno aktivnejši so na slovenskih univerzah in v drugih institucijah, ki se v Sloveniji ukvarjajo s tem področjem. Odločitev za umik iz mednarodnega okolja je lahko zavestna, vendar je za osrednjo institucijo, ki skrbi za jezik, neobičajna in na dolgi rok verjetno neobetavna, saj povezovalne prakse osrednjih inštitutov za druge jezike kažejo, da so učinki – tako finančni kot vsebinski – prej pozitivni kot ne.
Cvetenje ali osutje?
Če se na koncu vrnem k delovnemu besedilu Resolucije o nacionalnem programu za jezikovno politiko in odzivom nanj, ki so to razpravo spodbudili, bi vsaj za področja jezikovnega opisa, jezikovnih virov in jezikovnih tehnologij lahko rekli, da skuša resolucijski predlog s sugestijo izdelave podrobnejšega programa v enem letu po sprejetju resolucije vsaj za silo izboljšati stanje jezikovne opremljenosti in jezikovne infrastrukture za slovenščino, ki se zdi trenutno dokaj neobetavno, in sicer po najboljših in najbolj uspešnih zgledih, ki jih je najti pri ostalih (manjših) evropskih jezikih. Zdi se, da je ena od ključnih besed pri tem "sodelovanje" ali "sodelovalna naravnanost" institucij, ki so v teh prizadevanjih udeležene. Drugi nujni pogoj se zdi spoznanje ključnih akterjev, da je področje neurejeno in da je za ureditev stanja potreben napor, ki ga ima večina drugih držav že za sabo, kar konkretno pomeni predvsem to, da bi morala država svojo odgovornost sprejeti nase do konca in je ne prepuščati nizu naključnih in nepovezanih mikroodločitev znotraj enega, drugega ali tretjega telesa, ki parcialno odločajo o istih vsebinah. Na ta način se omejena finančna sredstva zagotovo trošijo bistveno manj racionalno, kot bi se lahko. Izjemno pomembno je tudi zavedanje, da tega razvoja ne bo, če ga ne bomo izpeljali sami, torej slovenska jezikovna skupnost. Resolucija predstavlja točko, ko je o takšnih ukrepih sploh mogoče začeti razmišljati. Da bi bili ti kdaj tudi uresničeni, bi bila potrebna močna politična volja, kar pa ostaja bolj politično kot strokovno vprašanje.
Simon Krek
Škofja Loka, 4. junij 2012
Prvič objavljeno na avtorjevem blogu. Na tem mestu objavljeno z njegovim dovoljenjem.